Liquid AI lanzó LFM2.5-230M: 213 tokens/s en Galaxy S25 y soporte para llama.cpp
Liquid AI lanzó el modelo más pequeño de su línea de pesos abiertos: LFM2.5-230M. Tiene 230 millones de parámetros: 213 tokens/s en Galaxy S25 Ultra y 42 en…
Procesado por IA desde MarkTechPost; editado por Hamidun News
Liquid AI lanzó LFM2.5-230M — el modelo más compacto de la línea con pesos abiertos. Con 230 millones de parámetros, cabe en un smartphone o computadora de placa única y aún supera a competidores con tres a cuatro veces más parámetros en las tareas para las que fue diseñado.
Qué es LFM y qué la diferencia
LFM significa Liquid Foundation Model — la arquitectura propietaria de Liquid AI, fundada por ex alumnos del MIT. El enfoque difiere fundamentalmente de los transformers estándar: en lugar del mecanismo de atención clásico, utiliza un diseño híbrido inspirado en ecuaciones diferenciales neurales. El resultado — modelos que funcionan de manera más eficiente con menos parámetros.
LFM2.5-230M es la más pequeña de la serie, pero construida sobre la misma base que versiones más poderosas. No pretende ser un asistente universal: el modelo está optimizado para tool use (invocar herramientas externas y APIs en pipelines de agentes) y data extraction (extracción estructurada de datos de texto no estructurado). Es precisamente en estas tareas donde demuestra resultados superiores a competidores significativamente más grandes.
Velocidad en hardware real y precisión en benchmarks
Liquid AI probó el desempeño no en servidores, sino en dispositivos de consumo:
- Galaxy S25 Ultra — 213 tokens por segundo
- Raspberry Pi 5 — 42 tokens por segundo
Para contexto: la velocidad de lectura confortable para un usuario es alrededor de 15–25 tokens/s. El modelo se ejecuta en un smartphone con un margen de ocho veces — suficiente incluso para aplicaciones interactivas en tiempo real.
¿Qué significa esto en la práctica?: LFM2.5-230M puede ejecutarse sin conexión, sin claves de API, sin costos de nube y sin transmitir datos a servidores terceros. Para productos corporativos con requisitos de confidencialidad, este es un argumento convincente en sí mismo.
En pruebas de seguimiento de instrucciones, el modelo superó a Qwen3.5-0.8B de Alibaba (más de tres veces más grande) y Gemma 3 1B de Google (cuatro veces más grande). Esta es una victoria no en clasificaciones generales, sino específicamente en las tareas para las que fue diseñado el modelo.
Runtimes soportados
LFM2.5-230M se lanza con pesos abiertos y soporta la pila de inferencia estándar completa:
- llama.cpp — ejecución en CPU sin GPU en cualquier hardware
- MLX — optimizado para chips Apple Silicon (M1–M4)
- vLLM y SGLang — para implementación de servidor de alta carga
- ONNX — estándar multiplataforma para implementación en producción
Cobertura máxima: desde MacBook hasta servidor Linux, desde Samsung flagship hasta una computadora de placa única de $80. Para modelos abiertos, la amplitud del soporte del ecosistema es uno de los principales factores para la adopción en el mundo real.
Lo que esto significa
Liquid AI demuestra claramente: la eficiencia arquitectónica desplaza la carrera por parámetros. Un modelo con 230 millones de parámetros que se ejecuta en un smartphone más rápido de lo que un humano puede leer y supera a análogos cuatro veces más grandes es un argumento convincente para la especialización sobre la universalidad. Para desarrolladores de aplicaciones de IA móvil y pipelines de agentes, esto abre una nueva ventana de posibilidades.
¿Quieres dejar de leer sobre IA y empezar a usarla?
AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.
Lo esencial de la IA — una vez por semana
Siete historias que de verdad importaron, elegidas a mano. Sin ruido ni notas de prensa.
¡Listo! Revisa tu correo para la confirmación.