Liquid AI lanzó LFM2.5-230M: 213 tokens/s en Galaxy S25 y soporte para llama.cpp

Liquid AI lanzó el modelo más pequeño de su línea de pesos abiertos: LFM2.5-230M. Tiene 230 millones de parámetros: 213 tokens/s en Galaxy S25 Ultra y 42 en…

Redacción de Hamidun News

Monitoreo de AI · MarkTechPost

28 jun 2026· 2 min

Procesado por IA desde MarkTechPost; editado por Hamidun News

Liquid AI lanzó LFM2.5-230M: 213 tokens/s en Galaxy S25 y soporte para llama.cpp — Fuente: MarkTechPost. Collage: Hamidun News.

◐ Escuchar artículo

Liquid AI lanzó LFM2.5-230M — el modelo más compacto de la línea con pesos abiertos. Con 230 millones de parámetros, cabe en un smartphone o computadora de placa única y aún supera a competidores con tres a cuatro veces más parámetros en las tareas para las que fue diseñado.

Qué es LFM y qué la diferencia

LFM significa Liquid Foundation Model — la arquitectura propietaria de Liquid AI, fundada por ex alumnos del MIT. El enfoque difiere fundamentalmente de los transformers estándar: en lugar del mecanismo de atención clásico, utiliza un diseño híbrido inspirado en ecuaciones diferenciales neurales. El resultado — modelos que funcionan de manera más eficiente con menos parámetros.

LFM2.5-230M es la más pequeña de la serie, pero construida sobre la misma base que versiones más poderosas. No pretende ser un asistente universal: el modelo está optimizado para tool use (invocar herramientas externas y APIs en pipelines de agentes) y data extraction (extracción estructurada de datos de texto no estructurado). Es precisamente en estas tareas donde demuestra resultados superiores a competidores significativamente más grandes.

Velocidad en hardware real y precisión en benchmarks

Liquid AI probó el desempeño no en servidores, sino en dispositivos de consumo:

Galaxy S25 Ultra — 213 tokens por segundo
Raspberry Pi 5 — 42 tokens por segundo

Para contexto: la velocidad de lectura confortable para un usuario es alrededor de 15–25 tokens/s. El modelo se ejecuta en un smartphone con un margen de ocho veces — suficiente incluso para aplicaciones interactivas en tiempo real.

¿Qué significa esto en la práctica?: LFM2.5-230M puede ejecutarse sin conexión, sin claves de API, sin costos de nube y sin transmitir datos a servidores terceros. Para productos corporativos con requisitos de confidencialidad, este es un argumento convincente en sí mismo.

En pruebas de seguimiento de instrucciones, el modelo superó a Qwen3.5-0.8B de Alibaba (más de tres veces más grande) y Gemma 3 1B de Google (cuatro veces más grande). Esta es una victoria no en clasificaciones generales, sino específicamente en las tareas para las que fue diseñado el modelo.

Runtimes soportados

LFM2.5-230M se lanza con pesos abiertos y soporta la pila de inferencia estándar completa:

llama.cpp — ejecución en CPU sin GPU en cualquier hardware
MLX — optimizado para chips Apple Silicon (M1–M4)
vLLM y SGLang — para implementación de servidor de alta carga
ONNX — estándar multiplataforma para implementación en producción

Cobertura máxima: desde MacBook hasta servidor Linux, desde Samsung flagship hasta una computadora de placa única de $80. Para modelos abiertos, la amplitud del soporte del ecosistema es uno de los principales factores para la adopción en el mundo real.

Lo que esto significa

Liquid AI demuestra claramente: la eficiencia arquitectónica desplaza la carrera por parámetros. Un modelo con 230 millones de parámetros que se ejecuta en un smartphone más rápido de lo que un humano puede leer y supera a análogos cuatro veces más grandes es un argumento convincente para la especialización sobre la universalidad. Para desarrolladores de aplicaciones de IA móvil y pipelines de agentes, esto abre una nueva ventana de posibilidades.

Hamidun News

Noticias de AI sin ruido. Selección editorial diaria de más de 400 fuentes. Producto de Zhemal Khamidun, Head of AI en Alpina Digital.

Canal de Telegram RSS hamidun.com

¿Quieres dejar de leer sobre IA y empezar a usarla?

AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.

🎓 Academy — 7 días gratis Consulta gratuita