Gladstone Institutes présente MaxToki — un modèle d'IA qui prédit le vieillissement cellulaire
Gladstone Institutes a dévoilé MaxToki — un modèle d'IA temporelle pour analyser le vieillissement cellulaire à partir de données de single-cell RNA-seq. Il…
Traité par IA depuis MarkTechPost ; édité par Hamidun News
MaxToki est une tentative d'enseigner à l'IA à voir le vieillissement non pas comme un ensemble d'instantanés biologiques déconnectés, mais comme une trajectoire continue de changements cellulaires au fil du temps. L'équipe du Gladstone Institutes et les partenaires affirment que le modèle peut non seulement évaluer le degré de "vieillissement" d'un état cellulaire particulier, mais aussi prédire quelles interventions génétiques pourraient accélérer ou ralentir ce processus. Pour la recherche sur le vieillissement, c'est un changement important : au lieu de décrire l'état actuel d'une cellule, émerge un outil pour modéliser où elle se dirige ensuite.
La plupart des modèles de base biologiques travaillent actuellement avec des données statiques, généralement avec le séquençage ARN de cellule unique — un instantané de quels gènes sont actifs dans une cellule individuelle à un moment particulier. Cela suffit pour reconnaître le type de cellule ou son état actuel, mais c'est insuffisant pour comprendre la dynamique du vieillissement qui se déploie au fil des ans et des décennies. MaxToki est construit comme un transformateur uniquement de décodage et entraîné en deux étapes.
D'abord, le modèle a étudié les transcriptomes cellulaires individuels d'un corpus d'environ 175 millions d'échantillons. Ensuite, il a reçu un contexte étendu et a été réentraîné sur les trajectoires de vieillissement : environ 22 millions de transcriptomes de cellule unique collectés auprès d'environ 3 800 donneurs d'âges différents — de la naissance à 90+ ans. Au total, l'entraînement a couvert près de 1 trillion de "jetons génétiques".
L'une des idées clés de MaxToki est de représenter une cellule non pas par les niveaux bruts d'expression génétique, mais par leur ordre classé. Cette approche aide à réduire la dépendance au bruit technique et empêche les gènes "housekeeping", qui sont actifs presque tout le temps, d'étouffer le signal. Au lieu de cela, le modèle isole mieux les gènes régulateurs, y compris les facteurs de transcription, qui déterminant souvent la transition d'une cellule d'un état à un autre.
Dans la deuxième étape, MaxToki a appris à travailler non pas avec une seule cellule, mais avec de courtes séquences d'états cellulaires et d'intervalles de temps entre eux. Cela a permis deux types de requêtes : prédire combien de temps sépare une cellule d'une autre et générer l'état cellulaire attendu après un intervalle donné. Selon les auteurs, le modèle a montré des gains notables sur des tâches où il était nécessaire de récupérer les trajectoires de vieillissement pour des exemples inconnus.
Sur les types de cellules retenus qui n'étaient pas dans l'entraînement, la corrélation entre le décalage temporel prédit et réel a atteint 0,85. Sur les âges et donneurs retenus — 0,77. L'erreur médiane de prédiction du temps était de 87 mois contre 178–180 mois pour les méthodes de base plus simples.
Il est également important que MaxToki ne reçoive pas d'étiquettes explicites de sexe ou de type de cellule pendant l'inférence, mais récupère le contexte des données elles-mêmes. Cela rend le modèle plus proche de l'apprentissage en contexte dans l'esprit des modèles de langage, mais dans le domaine biologique. Particulièrement intéressante est la validation sur des maladies que le modèle n'avait jamais vues pendant l'entraînement, car il n'a été entraîné que sur le vieillissement "normal".
Dans les cellules épithéliales pulmonaires chez les personnes ayant un lourd antécédent tabagique, MaxToki a estimé une accélération du vieillissement d'environ 5 ans par rapport au groupe témoin du même âge. Pour les fibroblastes pulmonaires en cas de fibrose pulmonaire, l'estimation a atteint environ 15 ans. Dans la microglie des patients atteints de la maladie d'Alzheimer, le modèle a montré environ 3 ans de décalage de vieillissement supplémentaire.
Cependant, ce signal n'était pas présent chez les personnes atteintes d'un léger trouble cognitif et chez les patients dits Alzheimer-résilients, qui présentent une neuropathologie similaire mais sans déficit cognitif prononcé. Cela suggère que le modèle pourrait capturer non seulement l'âge, mais spécifiquement l'accélération pathologique du vieillissement cellulaire. La partie la plus solide du travail est la tentative de passer de la prédiction à l'action.
Les chercheurs ont utilisé MaxToki pour le dépistage in silico des gènes dans les cellules cardiaques et ont recherché des cibles qui pourraient déplacer la trajectoire vers le vieillissement ou le rajeunissement. Plusieurs candidats pro-vieillissement précédemment non décrits ont ensuite été testés expérimentalement. Dans les cardiomyocytes humains, leur surexpression a déclenché des programmes d'inflammation et de dysfonctionnement mitochondrial, et a également altéré la fonction cellulaire, y compris les perturbations des cycles calciques et les anomalies du rythme de contraction.
Les deux candidats les plus solides ont également été testés chez les jeunes souris : selon les auteurs, en seulement six semaines, cela a entraîné une détérioration mesurable de la fonction cardiaque. Pour l'IA biomédicale, c'est un moment important : le modèle non seulement interprète les données magnifiquement, mais produit aussi des hypothèses qui résistent aux tests de laboratoire. Qu'est-ce que cela signifie en pratique ?
MaxToki reste un système de recherche pour l'instant et a été publié au format de préimpression, il est donc trop tôt pour parler d'application clinique. Mais l'idée elle-même est très solide : si les modèles de base apprennent à modéliser régulièrement les trajectoires cellulaires dans le temps, ils pourraient devenir un outil pour la découverte précoce de cibles contre les maladies liées à l'âge, la sélection de candidats médicamenteux et le test d'hypothèses avant les expériences coûteuses. En termes simples, la biologie obtient un analogue d'un "simulateur du futur" pour les cellules — et c'est beaucoup plus intéressant qu'un autre modèle qui décrit simplement un instantané du présent.
Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?
AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.