GPT-Rosalind : OpenAI lance le premier modele IA dedie aux sciences de la vie

OpenAI vient de devoiler GPT-Rosalind, son premier modele d’intelligence artificielle concu specifiquement pour les sciences de la vie. Nomme en hommage a Rosalind Franklin, la biophysicienne dont les travaux sur la diffraction des rayons X ont ete essentiels a la decouverte de la structure de l’ADN, ce modele se distingue des approches generiques adoptees jusqu’ici par les grands labos d’IA pour les applications scientifiques.

Un LLM taille pour la biologie

La plupart des modeles d’IA destines a la recherche scientifique ratissent large : chimie, physique, mathematiques, biologie. GPT-Rosalind prend le parti inverse. Il se concentre exclusivement sur les sciences du vivant : biochimie, genomique, decouverte de medicaments.

Selon Joy Jiao, responsable de la recherche en sciences de la vie chez OpenAI, le modele a ete calibre pour repondre a deux blocages majeurs des chercheurs en biologie. Le premier : la difficulte a naviguer dans des processus multi-etapes complexes (le fameux « raisonnement » que les LLMs peinent a maitriser sur des problemes longs). Le second : la tendance des modeles generiques a produire des reponses enthousiastes mais peu fiables quand on leur soumet des hypotheses biologiques.

Anti-complaisance integree

Pour contrer la « sycophantie » des LLMs classiques, OpenAI affirme avoir calibre GPT-Rosalind pour etre plus sceptique. Quand un chercheur lui soumet une cible therapeutique douteuse, le modele est cense le dire franchement plutot que de valider la piste par politesse algorithmique. En clair, si votre hypothese de drug target ne tient pas la route, Rosalind ne vous caressera pas dans le sens du poil.

Reste la question des hallucinations. Ars Technica souligne qu’on ne sait pas encore si OpenAI a vraiment resolu ce probleme dans un contexte biologique, ou les erreurs peuvent avoir des consequences reelles. Les premiers retours du terrain permettront de trancher.

Acces restreint et garde-fous

GPT-Rosalind n’est pas en libre-service. OpenAI limite l’acces aux entites basees aux Etats-Unis, via un programme d’acces de confiance (« trusted access deployment structure »). La raison : le modele pourrait potentiellement etre detourne pour optimiser la virulence d’un pathogene ou concevoir des agents biologiques dangereux.

Pour le moment, Rosalind est disponible en apercu de recherche dans ChatGPT, Codex et l’API. Un plugin gratuit « Life Sciences Research » sera egalement propose via Codex pour un usage plus large, mais avec des capacites reduites.

La course aux modeles scientifiques specialises

OpenAI n’est pas seul sur ce terrain. Google DeepMind, avec AlphaFold, a deja transforme la prediction des structures proteiques. Des startups comme Recursion Pharmaceuticals et Insilico Medicine utilisent des modeles proprietaires pour accelerer la decouverte de molecules. Mais GPT-Rosalind se positionne differemment : c’est un LLM conversationnel qui peut assister un chercheur au quotidien, pas un outil de prediction structurelle.

Yunyun Wang, responsable produit chez OpenAI, souligne que le systeme vise une utilisation pratique : poser des questions, explorer des hypotheses, identifier des connexions entre publications, evaluer des cibles therapeutiques. Un copilote de recherche, en somme.

Pourquoi c’est important

L’IA generique a deja montre ses limites dans les sciences dures : reponses superficielles, hallucinations sur des faits techniques, incapacite a tenir un raisonnement sur 15 etapes. La specialisation verticale est la prochaine frontiere. Si GPT-Rosalind tient ses promesses, il pourrait devenir le premier assistant IA vraiment utile pour les biologistes, bien au-dela des chatbots generalistes qui peinent a distinguer un gene d’une proteine.

Mais la prudence s’impose. Tant que les retours concrets des chercheurs n’auront pas confirme la fiabilite du modele, GPT-Rosalind reste une promesse. Les prochains mois diront si OpenAI a reellement comble le fosse entre l’IA conversationnelle et la recherche en biologie.

Un LLM taille pour la biologie

Anti-complaisance integree

Acces restreint et garde-fous

La course aux modeles scientifiques specialises

Pourquoi c’est important

À lire aussi

Anthropic laisse fuiter tout le code source de Claude Code par erreur sur npm

Mistral lance Voxtral TTS : un modèle de synthèse vocale open source qui tient sur un smartphone

Arthur Mensch à l’AN : Mythos d’Anthropic peut orchestrer des cyberattaques, ne lui donnez pas accès au code militaire français