Gladstone Institutes apresentam MaxToki — modelo de IA que prevê envelhecimento celular
Gladstone Institutes revelou MaxToki — um modelo de IA temporal para análise do envelhecimento celular usando dados de single-cell RNA-seq. Foi treinado com…
Processado por IA de MarkTechPost; editado por Hamidun News
MaxToki é uma tentativa de ensinar a IA a ver o envelhecimento não como um conjunto de snapshots biológicos desconexos, mas como uma trajetória contínua de mudanças celulares ao longo do tempo. A equipe do Gladstone Institutes e parceiros afirmam que o modelo consegue não apenas avaliar o quão "envelhecido" um estado celular específico se tornou, mas também prever quais intervenções genéticas podem acelerar ou desacelerar esse processo. Para pesquisas de envelhecimento, isso representa uma mudança importante: em vez de descrever o estado atual de uma célula, surge uma ferramenta para modelar para onde ela está se dirigindo.
A maioria dos modelos de base biológica atualmente trabalha com dados estáticos, geralmente RNA-seq de célula única — um snapshot de quais genes estão ativos em uma única célula em um momento particular. Isso é suficiente para reconhecer o tipo de célula ou seu estado atual, mas insuficiente para entender a dinâmica do envelhecimento que se desdobra ao longo de anos e décadas. MaxToki é construído como um transformer apenas de decodificador e treinado em dois estágios.
Primeiro, o modelo estudou transcriptomas celulares individuais de um corpus de aproximadamente 175 milhões de amostras. Depois recebeu contexto expandido e foi retreinado em trajetórias de envelhecimento: cerca de 22 milhões de transcriptomas de célula única coletados de aproximadamente 3.800 doadores de diferentes idades — desde o nascimento até 90+ anos.
No total, o treinamento cobriu quase 1 trilhão de "tokens gênicos." Uma das ideias-chave do MaxToki é representar uma célula não através de níveis brutos de expressão gênica, mas através de sua ordem classificada. Essa abordagem ajuda a reduzir a dependência de ruído técnico e impede que genes "housekeeping", que estão ativos quase sempre, abafem o sinal.
Em vez disso, o modelo melhor isola genes reguladores, incluindo fatores de transcrição, que frequentemente determinam a transição de uma célula de um estado para outro. No segundo estágio, MaxToki aprendeu a trabalhar não com uma única célula, mas com sequências curtas de estados celulares e intervalos de tempo entre eles. Isso permitiu dois tipos de consultas: prever quanto tempo separa uma célula de outra e gerar o estado celular esperado após um intervalo determinado.
De acordo com os autores, o modelo mostrou ganhos notáveis em tarefas onde era necessário recuperar trajetórias de envelhecimento para exemplos desconhecidos. Em tipos de células retidos que não estavam no treinamento, a correlação entre mudança de tempo prevista e real atingiu 0,85. Em idades e doadores retidos — 0,77.
O erro mediano na previsão de tempo foi de 87 meses em comparação com 178–180 meses para métodos de linha de base mais simples. Também é importante que MaxToki não receba rótulos explícitos de sexo ou tipo de célula durante a inferência, mas recupere o contexto dos próprios dados. Isso torna o modelo mais próximo do aprendizado em contexto no espírito de modelos de linguagem, apenas no domínio biológico.
Particularmente interessante é a validação em doenças que o modelo nunca havia visto durante o treinamento, porque foi treinado apenas em envelhecimento "normal". Em células epiteliais pulmonares de pessoas com histórico pesado de tabagismo, MaxToki estimou uma aceleração do envelhecimento de cerca de 5 anos em relação ao grupo de controle da mesma idade. Para fibroblastos pulmonares em fibrose pulmonar, a estimativa atingiu aproximadamente 15 anos.
Em micróglia de pacientes com doença de Alzheimer, o modelo mostrou cerca de 3 anos de mudança de envelhecimento adicional. Porém, esse sinal não estava presente em pessoas com comprometimento cognitivo leve e em pacientes chamados Alzheimer-resilientes, que têm neuropatologia semelhante, mas sem déficit cognitivo pronunciado. Isso sugere que o modelo pode estar capturando não apenas idade, mas especificamente a aceleração patológica do envelhecimento celular.
A parte mais forte do trabalho é a tentativa de passar da previsão para a ação. Os pesquisadores usaram MaxToki para triagem in silico de genes em células cardíacas e procuraram por alvos que poderiam desviar a trajetória em direção ao envelhecimento ou rejuvenescimento. Vários candidatos pro-envelhecimento previamente não descritos foram então testados experimentalmente.
Em cardiomiócitos humanos, sua superexpressão desencadeou programas de inflamação e disfunção mitocondrial, bem como prejudicou a função celular, incluindo perturbações de ciclos de cálcio e anormalidades de ritmo de contração. Os dois candidatos mais fortes também foram testados em camundongos jovens: de acordo com os autores, em apenas seis semanas isso levou a deterioração mensurável da função cardíaca. Para IA biomédica, este é um momento importante: o modelo não apenas interpreta dados lindamente, mas também produz hipóteses que resistem ao teste de laboratório.
O que isso significa na prática? MaxToki permanece um sistema de pesquisa por enquanto e foi publicado em formato de pré-impressão, portanto é cedo demais para falar sobre aplicação clínica. Mas a ideia em si é muito forte: se modelos de base aprenderem a modelar consistentemente trajetórias celulares ao longo do tempo, eles poderão se tornar uma ferramenta para descoberta inicial de alvos contra doenças relacionadas à idade, seleção de candidatos a medicamentos e teste de hipóteses antes de experimentos caros.
Em termos simples, a biologia está obtendo um análogo de um "simulador de futuro" para células — e isso é muito mais interessante do que outro modelo que simplesmente descreve um snapshot do presente.
Quer parar de ler sobre IA e começar a usar?
AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.