MarkTechPost→ оригинал

Gladstone Institutes présente MaxToki — un modèle d'IA qui prédit le vieillissement cellulaire

Gladstone Institutes a dévoilé MaxToki — un modèle d'IA temporelle pour analyser le vieillissement cellulaire à partir de données de single-cell RNA-seq. Il a é

Gladstone Institutes présente MaxToki — un modèle d'IA qui prédit le vieillissement cellulaire
Источник: MarkTechPost. Коллаж: Hamidun News.

MaxToki — это попытка научить ИИ видеть старение не как набор разрозненных биологических снимков, а как непрерывную траекторию изменений клетки во времени. Команда Gladstone Institutes и партнеров заявляет, что модель умеет не только оценивать, насколько «состарилось» конкретное клеточное состояние, но и предсказывать, какие генетические вмешательства могут ускорять или замедлять этот процесс. Для исследований старения это важный сдвиг: вместо описания текущего состояния клетки появляется инструмент для моделирования того, куда она движется дальше.

Большинство биологических foundation-моделей сегодня работают со статичными данными, чаще всего с single-cell RNA-seq — снимком того, какие гены активны в одной клетке в конкретный момент. Этого достаточно, чтобы распознать тип клетки или её текущее состояние, но недостаточно, чтобы понять динамику старения, которая разворачивается годами и десятилетиями. MaxToki построен как decoder-only transformer и обучен в два этапа.

Сначала модель изучала отдельные клеточные транскриптомы из корпуса примерно в 175 миллионов образцов. Затем ей увеличили контекст и дообучили на возрастных траекториях: около 22 миллионов single-cell транскриптомов, собранных примерно у 3800 доноров разных возрастов — от рождения до 90+ лет. В сумме обучение охватило почти 1 триллион «генных токенов».

Одна из ключевых идей MaxToki — представлять клетку не через сырые уровни экспрессии генов, а через их ранжированный порядок. Такой подход помогает меньше зависеть от технических шумов и не дает «домашним» генам, которые активны почти всегда, забивать сигнал. Вместо этого модель лучше выделяет регуляторные гены, включая транскрипционные факторы, которые часто и определяют переход клетки из одного состояния в другое.

На втором этапе MaxToki учился работать уже не с одной клеткой, а с короткой последовательностью клеточных состояний и временных промежутков между ними. Это позволило ставить два типа запросов: предсказать, сколько времени отделяет одну клетку от другой, и сгенерировать ожидаемое состояние клетки через заданный промежуток. По данным авторов, модель показала заметный выигрыш на задачах, где нужно было восстановить возрастные траектории для незнакомых примеров.

На отложенных клеточных типах, которых не было в обучении, корреляция между предсказанным и реальным временным сдвигом достигала 0,85. На отложенных возрастах и донорах — 0,77. Медианная ошибка прогноза времени составила 87 месяцев против 178–180 месяцев у более простых базовых методов.

Важно и то, что MaxToki не получает явные ярлыки пола или типа клетки при выводе, а восстанавливает контекст по самим данным. Это делает модель ближе к in-context learning в духе языковых моделей, только в биологическом домене. Особенно интересной выглядит проверка на болезнях, которых модель вообще не видела во время обучения, потому что тренировалась только на «нормальном» старении.

В клетках лёгочного эпителия у людей с тяжёлым курительным анамнезом MaxToki оценил ускорение старения примерно на 5 лет относительно контрольной группы того же возраста. Для лёгочных фибробластов при лёгочном фиброзе оценка достигала примерно 15 лет. В микроглии пациентов с болезнью Альцгеймера модель показала около 3 лет дополнительного возрастного сдвига.

При этом такого сигнала не было у людей с лёгкими когнитивными нарушениями и у так называемых Alzheimer-resilient пациентов, у которых есть похожая нейропатология, но нет выраженного когнитивного дефицита. Это намекает, что модель может улавливать не просто возраст, а именно патологическое ускорение клеточного старения. Самая сильная часть работы — попытка перейти от прогноза к действию.

Исследователи использовали MaxToki для in silico-скрининга генов в клетках сердца и искали мишени, которые могут сдвигать траекторию в сторону старения или омоложения. Несколько ранее неописанных про-стареющих кандидатов затем проверили экспериментально. В человеческих кардиомиоцитах их сверхэкспрессия запускала программы воспаления и митохондриальной дисфункции, а также ухудшала клеточную функцию, включая нарушения кальциевого цикла и ритма сокращений.

Два самых сильных кандидата протестировали и у молодых мышей: по данным авторов, уже в течение шести недель это приводило к измеримому ухудшению сердечной функции. Для биомедицинского ИИ это важный момент: модель не только красиво интерпретирует данные, но и выдает гипотезы, которые выдерживают лабораторную проверку. Что это значит на практике?

MaxToki пока остается исследовательской системой и опубликован в формате препринта, так что говорить о клиническом применении рано. Но сама идея очень сильная: если foundation-модели научатся стабильно моделировать клеточные траектории во времени, они смогут стать инструментом для раннего поиска мишеней против возрастных болезней, отбора кандидатов для лекарств и проверки гипотез еще до дорогих экспериментов. Проще говоря, биология получает аналог «симулятора будущего» для клеток — и это уже гораздо интереснее, чем очередная модель, которая просто описывает снимок настоящего.

ЖХ
Hamidun News
AI‑новости без шума. Ежедневный редакторский отбор из 400+ источников. Продукт Жемала Хамидуна, Head of AI в Alpina Digital.
Загружаем комментарии…