IEEE Spectrum AI→ оригинал

AlphaGenome: DeepMind заставила «мусорную» ДНК говорить на человеческом

Google DeepMind выпустила AlphaGenome — систему для анализа не кодирующих белки участков ДНК. Долгое время их считали «мусорными», но именно они управляют работ

AlphaGenome: DeepMind заставила «мусорную» ДНК говорить на человеческом
Источник: IEEE Spectrum AI. Коллаж: Hamidun News.

Когда в 2020 году AlphaFold предсказал структуру белков, мир ахнул, а создатели позже получили Нобелевскую премию. Но белки — это лишь верхушка айсберга. Теперь команда Google DeepMind решила заглянуть в «темную материю» нашего организма. AlphaGenome — это новый швейцарский нож для работы с той частью ДНК, которую десятилетиями лениво называли мусорной.

Речь идет о 98% генома, которые не кодируют белки напрямую, а работают как сложнейшая панель управления. Они решают, когда гену включиться, где замолчать, а где начать работать на износ. Раньше ученым приходилось жонглировать десятком разных программ, чтобы понять, как одна крошечная мутация в этой пустоте влияет на развитие рака или редкого заболевания. AlphaGenome заменяет этот зоопарк софта единой системой, которая видит картину целиком.

Модель обучали на «сырых» данных ДНК, и теперь она умеет предсказывать 11 типов биологических сигналов. Это и сплайсинг (нарезка генетических сообщений), и плотность упаковки ДНК, и взаимодействие отдаленных участков генома. Самое впечатляющее — разрешение. AlphaGenome может анализировать последовательность длиной в миллион букв, не теряя контекста, но при этом видя изменения на уровне одного нуклеотида. Это как рассматривать карту целого города, видя при этом трещину на конкретном кирпиче.

Конечно, без нюансов не обошлось. Критики из Memorial Sloan Kettering отмечают, что модель пока плохо справляется с редкими типами клеток, так как училась на данных общих тканей. К тому же она склонна к ложноотрицательным результатам — лучше пропустит важную мутацию, чем поднимет ложную тревогу. Но если AlphaGenome говорит, что здесь проблема, ученые могут быть уверены в этом почти наверняка. Это экономит месяцы, а иногда и годы «мокрой» работы в лаборатории.

Зачем это Google? Здесь прослеживается четкая бизнес-логика. DeepMind строит вертикально интегрированную платформу для молекулярной биологии. У них есть инструменты для предсказания структуры белков (AlphaFold), их мутаций (AlphaMissense), дизайна новых молекул (AlphaProteo), а теперь и управления генами. Это уже не просто научные изыскания, а фундамент для новой индустрии лекарств, созданных полностью «в цифре».

Успех AlphaGenome уже подтвердили независимые исследователи из Японии, которые использовали модель для проверки связи между лишением сна и активностью нейронов. ИИ подтвердил их догадки, сэкономив массу времени на валидации данных. Это превращает инструмент из теоретической игрушки в реальный ускоритель науки.

Главное: DeepMind окончательно превращается из лаборатории по игре в го в главного архитектора современной биологии. Claude и GPT пишут тексты, а модели Хассабиса пишут код самой жизни. Осталось понять, когда количество этих цифровых моделей перейдет в качество реальных лекарств в аптеках.

ЖХ
Hamidun News
AI‑новости без шума. Ежедневный редакторский отбор из 400+ источников. Продукт Жемала Хамидуна, Head of AI в Alpina Digital.
Загружаем комментарии…