OpenProtein.AI Opens Access to AI Tools for Protein Design for Biologists
OpenProtein.AI aims to make AI-driven protein engineering accessible not only to ML teams but also to conventional biologists. The startup founded by Tristan Be

OpenProtein.AI пытается убрать один из главных барьеров на стыке ИИ и биологии: мощные модели для работы с белками уже существуют, но для большинства исследователей они до сих пор слишком сложны в использовании без навыков машинного обучения, доступа к GPU и отдельной инженерной команды. Стартап основали выпускник MIT Тристан Беплер и бывший доцент MIT Тим Лу.
Их идея проста: дать биологам веб-платформу без кода, через которую можно загружать собственные данные, запускать модели для инженерии белков, предсказывать структуру и функцию молекул, а также обучать и донастраивать модели под конкретные задачи. Компания уже работает с фармацевтическими и биотехнологическими организациями разного масштаба, а для ученых из академической среды предоставляет платформу бесплатно. По сути, речь идет не об одном узком инструменте, а о полноценном рабочем наборе для исследований, где ИИ становится частью лабораторного процесса, а не отдельным экспериментом для специалистов по данным.
История проекта выросла из академической работы Беплера в MIT. Во время учебы в программе по вычислительной и системной биологии под руководством профессора Бонни Бергер он занимался вопросом, который до сих пор остается центральным для всей области: как лучше понимать связь между последовательностью белка, его структурой и функцией. Еще до появления AlphaFold Беплер исследовал, как использовать эволюционные данные для предсказания свойств белков, и в итоге пришел к одной из ранних генеративных моделей такого класса — по сути, к белковой языковой модели.
Логика была в том, чтобы не только предсказывать форму молекулы, но и быстрее переходить от последовательности к пониманию того, что именно этот белок способен делать. Позже, уже после защиты PhD в 2020 году, Беплер присоединился к лаборатории Тима Лу на постдоке. Там стало особенно заметно, насколько велик разрыв между передовыми ИИ-инструментами и реальными потребностями биологов.
Сами модели становились сильнее, но их внедрение требовало слишком много технической подготовки: нужно было писать код, настраивать вычисления, собирать библиотеки последовательностей, заниматься дообучением и интерпретацией результатов. OpenProtein.AI строится как ответ именно на эту проблему.
Вместо того чтобы заставлять исследователя становиться ML-инженером, компания выносит сложность в инфраструктуру и оставляет пользователю понятный интерфейс и готовые рабочие сценарии. Ключевой собственной разработкой OpenProtein стала модель PoET — Protein Evolutionary Transformer. Ее обучали на группах белков, чтобы модель могла генерировать родственные последовательности и улавливать эволюционные ограничения, которые определяют свойства молекул.
В компании утверждают, что PoET умеет обобщать такие ограничения и принимать новую информацию о последовательностях без полного переобучения, что особенно важно для лабораторий, у которых постоянно появляется свежая экспериментальная информация. Исследователи могут использовать собственные данные для обучения моделей, оптимизировать последовательности белков, а затем прогонять полученные варианты через инструменты анализа, структурные предикторы и другие проверки in silico, прежде чем переходить к работе в мокрой лаборатории. Для тех, кому нужен программный доступ, у платформы есть и API, но базовый сценарий остается no-code.
Компания продолжает расширять платформу. В 2025 году она представила PoET-2 — новую версию белковой языковой модели, которая, по данным OpenProtein, превосходит существенно более крупные модели, хотя требует лишь долю вычислительных ресурсов и экспериментальных данных. Это важный момент не только с точки зрения качества, но и с точки зрения стоимости исследований: если эффективные модели становятся легче, ими могут пользоваться не только крупнейшие фармкомпании.
При этом крупный бизнес уже тоже подключается. Boehringer Ingelheim начала использовать платформу в начале 2025 года, а затем расширила сотрудничество с OpenProtein для задач, связанных с белковой инженерией в терапии рака, аутоиммунных и воспалительных заболеваний. Следующий шаг для компании — научить модели лучше работать не только со статическими свойствами белков, но и с их динамическим поведением.
Речь идет о случаях, когда белок должен одновременно участвовать в нескольких биологических механизмах или менять функцию после связывания с другой молекулой. Если такие сценарии удастся описывать и проектировать с помощью ИИ, это расширит набор терапевтических подходов и сделает проектирование биологических систем заметно точнее. Главный смысл этой истории в том, что рынок постепенно движется от редких, штучных ИИ-экспериментов в биологии к более доступной инфраструктуре для повседневной исследовательской работы.
Если OpenProtein.AI действительно удастся удержать баланс между открытостью, удобством и качеством моделей, это снизит порог входа для лабораторий, ускорит проверку гипотез и сократит путь от компьютерного дизайна белка до реального кандидата для терапии или промышленного применения. И, возможно, не менее важно, не даст самым сильным ИИ-инструментам замкнуться только внутри нескольких крупных игроков.