MarkTechPost→ original

Des chercheurs créent MEMO — un framework pour étendre la mémoire des LLM sans réentraînement

Des chercheurs du MIT, de la NUS et d'A*STAR ont créé MEMO — un framework permettant aux LLM d'étendre leurs connaissances via un module mémoire séparé. Les…

Traité par IA depuis MarkTechPost ; édité par Hamidun News
Des chercheurs créent MEMO — un framework pour étendre la mémoire des LLM sans réentraînement
Source : MarkTechPost. Collage: Hamidun News.
◐ Écouter l'article

Des chercheurs de l'Université nationale de Singapour (NUS), du MIT et d'A*STAR ont présenté MEMO — un framework modulaire qui permet aux modèles de langage d'apprendre rapidement de nouvelles connaissances sans réentraîner le modèle principal.

Le problème de la mise à l'échelle des connaissances

Les grands modèles de langage modernes sont entraînés sur d'énormes ensembles de données et stockent les connaissances acquises dans leurs paramètres. Lorsqu'il est nécessaire d'ajouter de nouvelles connaissances — par exemple, des données provenant d'une base de données d'entreprise, des références médicales ou des informations actuelles sur les derniers événements — l'approche traditionnelle nécessite un réentraînement complet du modèle. Cela signifie des mois de calcul, des millions de dollars de coûts et une énorme consommation d'énergie. De plus, lors du réentraînement, le modèle principal peut « oublier » ce qu'il savait déjà — un phénomène connu sous le nom d'oubli catastrophique.

Comment MEMO fonctionne

MEMO propose une solution élégante : un module entraînable séparé, appelé « modèle mémoire ». Au lieu de toucher aux paramètres du LLM principal, les nouvelles connaissances sont codées dans ce module dédié, qui fonctionne comme une couche de mémoire supplémentaire, étendant les capacités du modèle sans le refondre. L'architecture de MEMO se compose de plusieurs composants modulaires :

  • LLM principal (gelé) — génère du texte comme d'habitude, sans aucun changement de paramètres
  • Modèle mémoire — un module entraînable compact qui mémorise les nouveaux faits et connaissances du corpus
  • Module d'intégration — relie la mémoire au modèle principal lors de la génération des réponses aux utilisateurs
  • Mécanisme de recherche — trouve les faits pertinents de la mémoire au moment de l'inférence pour la contextualisation
  • Pipeline d'entraînement — met à jour uniquement les paramètres du module mémoire, laissant le LLM intact

Avantages pratiques

Cette approche offre plusieurs avantages clés aux entreprises et aux chercheurs. Premièrement, c'est une économie radicale de ressources informatiques — seul le module mémoire compact doit être réentraîné, et non un LLM de plusieurs milliards avec des centaines de milliards de paramètres. Deuxièmement, le modèle principal reste stable : son comportement d'origine et ses connaissances précédemment acquises ne s'estompent pas lors de l'ajout de nouveaux faits.

Troisièmement, les connaissances peuvent être mises à jour rapidement en heures ou en jours, plutôt qu'en mois de cycles de réentraînement laborieux. Pour les applications d'entreprise, cela signifie la possibilité d'adapter rapidement et à faible coût les LLM prêts à l'emploi à ses besoins — ajouter des connaissances spécifiques au domaine, mettre à jour les informations en temps réel en réponse aux nouveaux événements, créer des variantes de modèles personnalisées pour différents produits et clients.

Ce que cela signifie

MEMO est une autre étape importante vers des architectures modulaires pour l'IA. Au lieu de considérer un grand modèle de langage comme une boîte noire indivisible qui doit être complètement réentraînée à chaque mise à jour des connaissances, les chercheurs montrent que la mémoire et les capacités d'origine peuvent être séparées. Cela ouvre la voie à des moyens plus flexibles, moins coûteux et plus efficaces de développer et d'adapter les modèles de langage.

ZK
Hamidun News
Actualités IA sans bruit. Sélection éditoriale quotidienne de plus de 400 sources. Produit de Zhemal Khamidun, Head of AI chez Alpina Digital.

Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?

AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.

Qu'en pensez-vous ?
Chargement des commentaires…