OpenAI a présenté GPT-Rosalind — un modèle d'IA pour la biologie, la génomique et le développement de médicaments
OpenAI a lancé GPT-Rosalind — le premier modèle de l'entreprise conçu pour les sciences de la vie. Il aide à travailler avec la biochimie, la génomique et la…
Traité par IA depuis MarkTechPost ; édité par Hamidun News
Le 16 avril, OpenAI a présenté GPT-Rosalind—le premier modèle spécialisé de l'entreprise pour les life sciences, couvrant les tâches à l'intersection de la biologie, de la pharmacie et de la médecine appliquée. Le modèle est nommé en l'honneur de Rosalind Franklin et est conçu non comme un remplaçant des scientifiques, mais comme un outil pour accélérer l'aspect le plus exigeant du travail scientifique : l'examen de la littérature, la vérification des données, la formulation d'hypothèses et la planification des étapes suivantes. Pour contextualiser, le chemin allant de l'identification d'une nouvelle cible médicamenteuse à l'approbation de la FDA prend généralement de 10 à 15 ans.
OpenAI parie que l'IA peut raccourcir au moins les premières étapes de ce cycle, où les chercheurs passent d'énormes quantités de temps sur l'analyse, la vérification des faits et le travail avec des sources fragmentées. Selon la description de l'entreprise, GPT-Rosalind est optimisé pour les processus scientifiques qui nécessitent un raisonnement sur la chimie, les protéines, les gènes, les voies biologiques et les protocoles expérimentaux. Contrairement aux chatbots universels qui peuvent faire un peu de tout, l'accent ici est mis sur les longues chaînes de recherche : rassembler et comparer des dizaines d'articles, récupérer des données à partir de bases de données spécialisées, interpréter les résultats, proposer une hypothèse de travail et aider à planifier l'expérience suivante.
OpenAI souligne séparément qu'il ne s'agit pas simplement de génération de texte. Le modèle doit aider à résumer la base de preuves, générer des hypothèses, planifier des expériences et analyser des données—en d'autres termes, fonctionner au sein d'un flux de travail scientifique réel, pas seulement répondre aux questions dans une fenêtre de chat. Parallèlement, ils ont lancé le plugin Life Sciences research pour Codex.
Le plugin fournit l'accès à plus de 50 outils scientifiques, sources de littérature, bases de données multi-omiques et services biologiques. En pratique, cela signifie qu'un chercheur peut exécuter des recherches de séquences, visualiser les structures de protéines, rassembler des publications, trouver des ensembles de données ouverts et lier tout cela au raisonnement du modèle—tout dans une seule interface. Pour les laboratoires et les entreprises pharmaceutiques, cela compte plus que simplement un autre LLM : la valeur émerge là où le modèle formule non seulement une réponse, mais peut accéder aux données nécessaires et s'intégrer dans les flux de calcul existants.
Selon les benchmarks publics d'OpenAI, GPT-Rosalind affiche le meilleur résultat sur BixBench parmi les modèles avec des métriques publiées. Sur LABBench2, le modèle a surpassé GPT-5.4 dans six tâches sur onze ; l'entreprise a vu l'amélioration la plus significative dans CloningQA, où il faut concevoir des réactifs et un plan complet pour le clonage moléculaire.
OpenAI a testé séparément le modèle avec Dyno Therapeutics sur la tâche de prédire et générer des séquences ARN par fonction, en utilisant des données non publiées qui n'auraient pas pu entrer dans l'ensemble d'entraînement. Dans l'environnement Codex, les meilleurs résultats du modèle sur dix tentatives ont dépassé le 95e percentile des experts humains sur la tâche de prédiction et étaient approximativement au 84e percentile sur la tâche de génération de séquences. Cela ne prouve pas que l'IA est prête à faire des découvertes par elle-même, mais montre que dans les scénarios bioinformatiques étroits, elle commence à rivaliser avec les spécialistes forts.
Le lancement a été prudent. GPT-Rosalind est actuellement disponible en tant qu'aperçu de recherche via ChatGPT, Codex et API, mais uniquement pour les clients d'entreprise qualifiés aux États-Unis dans le cadre d'un programme d'accès de confiance. OpenAI cite des mesures de sécurité renforcées, le contrôle d'accès et les exigences de gouvernance et de contrôle interne : une organisation doit mener une recherche légitime avec des avantages clairs pour la santé humaine, restreindre l'accès au modèle et respecter les règles pour prévenir les abus.
Parmi les partenaires et les premiers utilisateurs, l'entreprise cite Amgen, Moderna, Thermo Fisher Scientific, Allen Institute et d'autres organisations de l'écosystème des life sciences. En parallèle, OpenAI travaille avec le Los Alamos National Laboratory sur le soutien de l'IA pour la conception de protéines et de catalyseurs. Pour le marché, c'est un changement important.
OpenAI démontre que le prochain grand pari n'est pas seulement des modèles plus généraux et plus grands, mais des systèmes étroitement spécialisés adaptés à des processus professionnels spécifiques. Dans les life sciences, le coût de l'erreur est élevé, les données sont complexes, et le succès est mesuré non par le nombre de réponses polies, mais par la qualité des hypothèses et la vitesse des expériences. Si GPT-Rosalind s'enracine vraiment dans les processus de laboratoire, cela renforcera la tendance vers des modèles d'IA verticaux pour les industries où la valeur naît d'une compréhension approfondie du domaine, d'un accès aux outils et d'un travail dans un environnement strictement contrôlé.
Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?
AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.