MIT News→ оригинал

OpenProtein.AI Opens Access to AI Tools for Protein Design for Biologists

OpenProtein.AI aims to make AI-driven protein engineering accessible not only to ML teams but also to conventional biologists. The startup founded by Tristan Be

OpenProtein.AI Opens Access to AI Tools for Protein Design for Biologists
Источник: MIT News. Коллаж: Hamidun News.

OpenProtein.AI пытается убрать один из главных барьеров на стыке ИИ и биологии: мощные модели для работы с белками уже существуют, но для большинства исследователей они до сих пор слишком сложны в использовании без навыков машинного обучения, доступа к GPU и отдельной инженерной команды. Стартап основали выпускник MIT Тристан Беплер и бывший доцент MIT Тим Лу.

Их идея проста: дать биологам веб-платформу без кода, через которую можно загружать собственные данные, запускать модели для инженерии белков, предсказывать структуру и функцию молекул, а также обучать и донастраивать модели под конкретные задачи. Компания уже работает с фармацевтическими и биотехнологическими организациями разного масштаба, а для ученых из академической среды предоставляет платформу бесплатно. По сути, речь идет не об одном узком инструменте, а о полноценном рабочем наборе для исследований, где ИИ становится частью лабораторного процесса, а не отдельным экспериментом для специалистов по данным.

История проекта выросла из академической работы Беплера в MIT. Во время учебы в программе по вычислительной и системной биологии под руководством профессора Бонни Бергер он занимался вопросом, который до сих пор остается центральным для всей области: как лучше понимать связь между последовательностью белка, его структурой и функцией. Еще до появления AlphaFold Беплер исследовал, как использовать эволюционные данные для предсказания свойств белков, и в итоге пришел к одной из ранних генеративных моделей такого класса — по сути, к белковой языковой модели.

Логика была в том, чтобы не только предсказывать форму молекулы, но и быстрее переходить от последовательности к пониманию того, что именно этот белок способен делать. Позже, уже после защиты PhD в 2020 году, Беплер присоединился к лаборатории Тима Лу на постдоке. Там стало особенно заметно, насколько велик разрыв между передовыми ИИ-инструментами и реальными потребностями биологов.

Сами модели становились сильнее, но их внедрение требовало слишком много технической подготовки: нужно было писать код, настраивать вычисления, собирать библиотеки последовательностей, заниматься дообучением и интерпретацией результатов. OpenProtein.AI строится как ответ именно на эту проблему.

Вместо того чтобы заставлять исследователя становиться ML-инженером, компания выносит сложность в инфраструктуру и оставляет пользователю понятный интерфейс и готовые рабочие сценарии. Ключевой собственной разработкой OpenProtein стала модель PoET — Protein Evolutionary Transformer. Ее обучали на группах белков, чтобы модель могла генерировать родственные последовательности и улавливать эволюционные ограничения, которые определяют свойства молекул.

В компании утверждают, что PoET умеет обобщать такие ограничения и принимать новую информацию о последовательностях без полного переобучения, что особенно важно для лабораторий, у которых постоянно появляется свежая экспериментальная информация. Исследователи могут использовать собственные данные для обучения моделей, оптимизировать последовательности белков, а затем прогонять полученные варианты через инструменты анализа, структурные предикторы и другие проверки in silico, прежде чем переходить к работе в мокрой лаборатории. Для тех, кому нужен программный доступ, у платформы есть и API, но базовый сценарий остается no-code.

Компания продолжает расширять платформу. В 2025 году она представила PoET-2 — новую версию белковой языковой модели, которая, по данным OpenProtein, превосходит существенно более крупные модели, хотя требует лишь долю вычислительных ресурсов и экспериментальных данных. Это важный момент не только с точки зрения качества, но и с точки зрения стоимости исследований: если эффективные модели становятся легче, ими могут пользоваться не только крупнейшие фармкомпании.

При этом крупный бизнес уже тоже подключается. Boehringer Ingelheim начала использовать платформу в начале 2025 года, а затем расширила сотрудничество с OpenProtein для задач, связанных с белковой инженерией в терапии рака, аутоиммунных и воспалительных заболеваний. Следующий шаг для компании — научить модели лучше работать не только со статическими свойствами белков, но и с их динамическим поведением.

Речь идет о случаях, когда белок должен одновременно участвовать в нескольких биологических механизмах или менять функцию после связывания с другой молекулой. Если такие сценарии удастся описывать и проектировать с помощью ИИ, это расширит набор терапевтических подходов и сделает проектирование биологических систем заметно точнее. Главный смысл этой истории в том, что рынок постепенно движется от редких, штучных ИИ-экспериментов в биологии к более доступной инфраструктуре для повседневной исследовательской работы.

Если OpenProtein.AI действительно удастся удержать баланс между открытостью, удобством и качеством моделей, это снизит порог входа для лабораторий, ускорит проверку гипотез и сократит путь от компьютерного дизайна белка до реального кандидата для терапии или промышленного применения. И, возможно, не менее важно, не даст самым сильным ИИ-инструментам замкнуться только внутри нескольких крупных игроков.

ЖХ
Hamidun News
AI‑новости без шума. Ежедневный редакторский отбор из 400+ источников. Продукт Жемала Хамидуна, Head of AI в Alpina Digital.
Загружаем комментарии…