Liquid AI défie la course aux modèles toujours plus grands : l’architecture hybride de LFM2 change les règles du jeu

Q: Quelle est la source ?

Publication originale sur MarkTechPost. Hamidun News traite et adapte les contenus avec l'IA.

Q: Quand a-t-il été publié ?

25 févr. 2026. Temps de lecture : 3 min.

Liquid AI a lancé LFM2-24B-A2B, un modèle de langage de 24 milliards de paramètres doté d’une architecture hybride qui réunit mécanismes d’attention et…

Rédaction de Hamidun News

Veille IA · MarkTechPost

25 févr. 2026· 3 min

Traité par IA depuis MarkTechPost ; édité par Hamidun News

Liquid AI défie la course aux modèles toujours plus grands : l’architecture hybride de LFM2 change les règles du jeu — Source : MarkTechPost. Collage: Hamidun News.

◐ Écouter l'article

Pendant ces dernières années, l'industrie des grands modèles de langage a fonctionné selon un principe simple : plus de paramètres équivalent à de meilleurs résultats. OpenAI a augmenté GPT, Google a étendu Gemini, Meta a agrandi Llama. Mais en 2026, cette approche se heurte de plus en plus à des contraintes physiques — consommation énergétique des centres de données, coûts de la mémoire, vitesse d'inférence. La startup Liquid AI de Boston croit avoir trouvé une issue à cette impasse, et son nouveau modèle LFM2-24B-A2B n'est pas simplement une autre version, mais une prétention à une révolution architecturale.

Liquid AI est une entreprise née des recherches du MIT sur les dites « réseaux de neurones liquides » (liquid neural networks), inspirés par les systèmes nerveux biologiques. Contrairement aux transformers classiques, où chaque couche effectue une opération fixe, les réseaux liquides sont capables d'adapter leurs calculs en fonction des données d'entrée. C'est une approche fondamentalement différente du traitement de l'information, et l'équipe la développe de manière cohérente depuis plusieurs années. LFM2-24B-A2B est devenu l'aboutissement de ce travail — un modèle avec 24 milliards de paramètres, construit sur une architecture hybride qui combine le mécanisme classique d'attention avec des opérations de convolution.

Pour comprendre pourquoi cela est important, il faut saisir le problème. Les transformers standards, qui sous-tendent GPT, Claude et autres modèles, utilisent un mécanisme d'auto-attention qui permet à chaque token de "regarder" tous les autres tokens du contexte. C'est un outil puissant, mais sa complexité computationnelle croît quadratiquement avec la longueur du contexte. Doublez la fenêtre de contexte — et vous obtenez une quadruple augmentation des coûts de calcul. C'est pourquoi travailler avec de longs documents reste l'une des tâches les plus consommatrices de ressources pour les LLM modernes. Les couches de convolution, en revanche, traitent l'information localement et s'échellent linéairement, mais ont historiquement été considérées comme moins expressives pour les tâches linguistiques.

L'approche hybride de Liquid AI tente de prendre le meilleur des deux mondes. Les composants de convolution gèrent le traitement des motifs locaux — structures syntaxiques, dépendances à courte portée, modèles récurrents. Le mécanisme d'attention s'active là où il est nécessaire de capturer les connexions à longue portée dans le texte — références à des entités mentionnées antérieurement, chaînes logiques, raisonnement complexe. La désignation "A2B" dans le nom du modèle pointe vers une configuration spécifique de cet équilibre entre les blocs d'attention et de convolution. Essentiellement, le modèle décide lui-même quel type de traitement appliquer à un fragment particulier de données, rendant les calculs considérablement plus efficaces.

Vingt-quatre milliards de paramètres est un chiffre relativement modeste selon les normes de 2026, lorsque les modèles phares opèrent avec des centaines de milliards et même des milliers de milliards de paramètres. Mais c'est précisément la thèse principale de Liquid AI : l'efficacité architecturale est plus importante que la force brute. Si un modèle avec 24 milliards de paramètres peut rivaliser avec des modèles plusieurs fois plus grands tout en consommant significativement moins de coûts d'inférence, cela change l'économie de toute l'industrie. Moins de GPU pour traiter les requêtes — coûts des API plus bas. Moins de consommation énergétique — plus facile de déployer le modèle sur des appareils périphériques. Inférence plus rapide — meilleure expérience utilisateur.

Pour l'industrie dans son ensemble, la sortie du LFM2-24B-A2B s'inscrit dans une tendance plus large. De plus en plus de groupes de recherche et d'entreprises en arrivent à la conclusion que l'ère de la "mise à l'échelle stupide" prend fin. Mamba et autres architectures basées sur des espaces d'état, travaux sur les modèles épars avec Mixture of Experts, quantification et distillation — tout cela sont des tentatives pour extraire plus d'intelligence à partir de moins de calcul. Liquid AI suit son propre chemin, et son approche hybride semble l'une des solutions les plus élégantes au problème.

Cela dit, il est bon de maintenir un scepticisme sain. Les benchmarks complets du LFM2-24B-A2B doivent encore être étudiés et reproduits de manière indépendante. Les innovations architecturales semblent souvent impressionnantes sur papier mais rencontrent des problèmes inattendus lorsqu'elles sont mises à l'échelle en production — de la complexité d'entraînement à la compatibilité avec l'infrastructure d'optimisation existante. L'écosystème d'outils autour des transformers s'est construit au fil des années, et toute architecture alternative devra prouver sa viabilité non seulement en laboratoire.

Néanmoins, la direction que Liquid AI établit semble inévitable. L'industrie de l'intelligence artificielle a atteint un point où ajouter plus de paramètres produit des rendements décroissants, et les exigences en matière d'efficacité énergétique et de vitesse ne font que croître. Les entreprises qui trouveront des moyens de faire plus avec moins de ressources définiront le prochain chapitre du développement de l'IA. Et les architectures hybrides comme LFM2 pourraient bien être la clé de cet avenir.

Hamidun News

Actualités IA sans bruit. Sélection éditoriale quotidienne de plus de 400 sources. Produit de Zhemal Khamidun, Head of AI chez Alpina Digital.

Canal Telegram RSS hamidun.com

Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?

AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.

🎓 Academy — 7 jours gratuits Consultation gratuite