OpenProtein.AI Ouvre l'Accès aux Outils d'IA pour la Conception de Protéines aux Biologistes
OpenProtein.AI vise à rendre l'ingénierie des protéines alimentée par l'IA accessible non seulement aux équipes de ML, mais aussi aux biologistes…
Traité par IA depuis MIT News ; édité par Hamidun News
OpenProtein.AI tente de supprimer l'une des principales barrières à l'intersection de l'IA et de la biologie : des modèles puissants pour travailler avec les protéines existent déjà, mais pour la plupart des chercheurs, ils restent trop complexes à utiliser sans connaissances en apprentissage automatique, accès à GPU et équipe d'ingénierie distincte. La startup a été fondée par Tristan Bepler, diplômé du MIT, et Tim Lu, ancien professeur du MIT.
Leur idée est simple : donner aux biologistes une plateforme web sans code à travers laquelle ils peuvent télécharger leurs propres données, exécuter des modèles pour l'ingénierie des protéines, prédire la structure et la fonction des molécules, et entraîner et affiner les modèles pour des tâches spécifiques. L'entreprise travaille déjà avec des organisations pharmaceutiques et biotechnologiques de différentes tailles, et fournit gratuitement la plateforme aux scientifiques des environnements académiques. Essentiellement, il ne s'agit pas d'un seul outil étroit, mais d'une suite complète de travail pour la recherche, où l'IA devient partie intégrante du processus de laboratoire plutôt qu'une expérience séparée pour les data scientists.
L'histoire du projet est née du travail académique de Bepler au MIT. Alors qu'il étudiait dans un programme de biologie computationnelle et systémique sous la direction de la Professeure Bonnie Berger, il travaillait sur une question qui reste centrale pour tout le domaine : comment mieux comprendre la relation entre la séquence de protéine, sa structure et sa fonction. Même avant l'apparition d'AlphaFold, Bepler recherchait comment utiliser les données évolutives pour prédire les propriétés des protéines, et a finalement abouti à l'un des premiers modèles génératifs de cette classe — essentiellement un modèle de langage de protéine.
La logique était non seulement de prédire la forme de la molécule, mais aussi de progresser plus rapidement de la séquence à la compréhension de ce que cette protéine est capable de faire. Plus tard, après l'obtention de son doctorat en 2020, Bepler a rejoint le laboratoire de Tim Lu en tant que postdoctorant. Il devint alors particulièrement évident à quel point l'écart était grand entre les outils d'IA de pointe et les besoins réels des biologistes.
Les modèles eux-mêmes devenaient plus puissants, mais leur mise en œuvre nécessitait trop de préparation technique : il fallait écrire du code, configurer les calculs, assembler des bibliothèques de séquences, procéder à l'ajustement fin et à l'interprétation des résultats. OpenProtein.AI est construite comme une réponse précisément à ce problème.
Au lieu de forcer les chercheurs à devenir des ingénieurs ML, l'entreprise cache la complexité dans l'infrastructure et laisse à l'utilisateur une interface compréhensible et des scénarios de travail prêts.
Le développement propriétaire clé d'OpenProtein est le modèle PoET — Protein Evolutionary Transformer. Il a été entraîné sur des groupes de protéines pour que le modèle puisse générer des séquences apparentées et capturer les contraintes évolutives qui déterminent les propriétés moléculaires. L'entreprise affirme que PoET peut généraliser ces contraintes et accepter de nouvelles informations sur les séquences sans réentraînement complet, ce qui est particulièrement important pour les laboratoires qui reçoivent constamment de nouvelles données expérimentales.
Les chercheurs peuvent utiliser leurs propres données pour entraîner les modèles, optimiser les séquences de protéines, puis faire passer les variantes résultantes à travers des outils d'analyse, des prédicteurs de structure et d'autres vérifications in silico, avant de passer au travail en laboratoire humide. Pour ceux qui ont besoin d'un accès programmatique, la plateforme dispose d'une API, mais le scénario de base reste sans code.
L'entreprise continue d'élargir la plateforme. En 2025, elle a présenté PoET-2 — une nouvelle version du modèle de langage de protéine qui, selon OpenProtein, surpasse significativement les modèles beaucoup plus grands tout en ne nécessitant qu'une fraction des ressources de calcul et des données expérimentales. C'est un point important non seulement en termes de qualité, mais aussi en termes de coûts de recherche : si les modèles efficaces deviennent plus légers, ils peuvent être utilisés non seulement par les plus grandes entreprises pharmaceutiques.
En même temps, les grandes entreprises s'impliquent déjà. Boehringer Ingelheim a commencé à utiliser la plateforme au début de 2025, puis a étendu la collaboration avec OpenProtein pour des tâches liées à l'ingénierie des protéines dans la thérapie du cancer, des maladies auto-immunes et inflammatoires.
L'étape suivante pour l'entreprise est d'enseigner aux modèles à mieux travailler non seulement avec les propriétés statiques des protéines, mais aussi avec leur comportement dynamique. Il s'agit de cas où une protéine doit participer simultanément à plusieurs mécanismes biologiques ou changer de fonction après liaison avec une autre molécule. Si ces scénarios peuvent être décrits et conçus à l'aide de l'IA, cela élargira l'éventail des approches thérapeutiques et rendra la conception des systèmes biologiques notablement plus précise.
Le point principal de cette histoire est que le marché évolue progressivement des rares expériences d'IA sur mesure en biologie vers une infrastructure plus accessible pour le travail de recherche quotidien. Si OpenProtein.AI parvient vraiment à maintenir un équilibre entre ouverture, commodité et qualité des modèles, cela abaissera la barrière d'entrée pour les laboratoires, accélèrera la vérification des hypothèses et raccourcira le chemin du design informatique des protéines à un véritable candidat pour une thérapie ou une application industrielle. Et, peut-être tout aussi important, cela empêchera les outils d'IA les plus puissants de rester enfermés au sein de seulement quelques grands acteurs.
Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?
AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.