Liquid AI a lancé LFM2.5-230M : 213 tokens/s sur Galaxy S25 et prise en charge de llama.cpp

Liquid AI a lancé le plus petit modèle de sa gamme à poids ouverts : LFM2.5-230M. Avec 230 millions de paramètres, il atteint 213 tokens/s sur Galaxy S25…

Rédaction de Hamidun News

Veille IA · MarkTechPost

28 juin 2026· 2 min

Traité par IA depuis MarkTechPost ; édité par Hamidun News

Liquid AI a lancé LFM2.5-230M : 213 tokens/s sur Galaxy S25 et prise en charge de llama.cpp — Source : MarkTechPost. Collage: Hamidun News.

◐ Écouter l'article

Liquid AI a lancé LFM2.5-230M — le modèle le plus compact de la gamme avec poids ouverts. Avec 230 millions de paramètres, il tient sur un smartphone ou un ordinateur monoplaques et surpasse toujours les concurrents ayant trois à quatre fois plus de paramètres sur les tâches pour lesquelles il a été conçu.

Qu'est-ce que LFM et ce qui la distingue

LFM signifie Liquid Foundation Model — l'architecture propriétaire de Liquid AI, fondée par d'anciens élèves du MIT. L'approche diffère fondamentalement des transformers standards : au lieu du mécanisme d'attention classique, elle utilise un design hybride inspiré par les équations différentielles neurales. Le résultat — des modèles qui fonctionnent de manière plus efficace avec moins de paramètres.

LFM2.5-230M est le plus petit de la série, mais construit sur la même base que les versions plus puissantes. Il ne prétend pas être un assistant universel : le modèle est optimisé pour tool use (appeler des outils externes et des APIs dans des pipelines d'agents) et data extraction (extraction structurée de données à partir de texte non structuré). C'est précisément sur ces tâches qu'il démontre des résultats supérieurs à des concurrents considérablement plus grands.

Vitesse sur du matériel réel et précision sur les benchmarks

Liquid AI a testé les performances non sur des serveurs, mais sur des appareils grand public :

Galaxy S25 Ultra — 213 tokens par seconde
Raspberry Pi 5 — 42 tokens par seconde

Pour le contexte : la vitesse de lecture confortable pour un utilisateur est d'environ 15–25 tokens/s. Le modèle fonctionne sur un smartphone avec une marge de huit fois — suffisant même pour les applications interactives en temps réel.

Qu'est-ce que cela signifie concrètement : LFM2.5-230M peut s'exécuter hors ligne, sans clés API, sans frais de cloud et sans transmettre de données à des serveurs tiers. Pour les produits d'entreprise ayant des exigences de confidentialité, c'est un argument convaincant en soi.

Lors des tests de suivi d'instructions, le modèle a surpassé Qwen3.5-0.8B d'Alibaba (plus de trois fois plus grand) et Gemma 3 1B de Google (quatre fois plus grand). Ce n'est pas une victoire dans les classements généraux, mais spécifiquement sur les tâches pour lesquelles le modèle a été conçu.

Runtimes supportés

LFM2.5-230M est lancé avec poids ouverts et supporte l'intégralité de la pile d'inférence standard :

llama.cpp — exécution CPU sans GPU sur n'importe quel matériel
MLX — optimisé pour les puces Apple Silicon (M1–M4)
vLLM et SGLang — pour le déploiement serveur haute charge
ONNX — norme multiplateforme pour le déploiement en production

Couverture maximale : du MacBook au serveur Linux, du Samsung flagship à l'ordinateur monoplaques à 80 $. Pour les modèles ouverts, l'étendue du support de l'écosystème est l'un des principaux facteurs d'adoption dans le monde réel.

Ce que cela signifie

Liquid AI démontre clairement : l'efficacité architecturale supplante la course aux paramètres. Un modèle avec 230 millions de paramètres qui fonctionne sur un smartphone plus rapidement qu'un humain ne peut lire et surpasse les analogues quatre fois plus grands est un argument convaincant en faveur de la spécialisation plutôt que de l'universalité. Pour les développeurs d'applications IA mobiles et de pipelines d'agents, cela ouvre une nouvelle fenêtre de possibilités.

Hamidun News

Actualités IA sans bruit. Sélection éditoriale quotidienne de plus de 400 sources. Produit de Zhemal Khamidun, Head of AI chez Alpina Digital.

Canal Telegram RSS hamidun.com

Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?

AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.

🎓 Academy — 7 jours gratuits Consultation gratuite