Liquid AI desafía la carrera por modelos más grandes: la arquitectura híbrida de LFM2 cambia las reglas
Liquid AI lanzó LFM2-24B-A2B, un modelo de lenguaje de 24 mil millones de parámetros con una arquitectura híbrida que combina mecanismos de atención y capas…
Procesado por IA desde MarkTechPost; editado por Hamidun News
Durante los últimos años, la industria de los grandes modelos de lenguaje ha operado bajo un principio simple: más parámetros equivalen a mejores resultados. OpenAI ha escalado GPT, Google ha expandido Gemini, Meta ha aumentado Llama. Pero en 2026, este enfoque se está encontrando cada vez más con limitaciones físicas — consumo de energía de los centros de datos, costos de memoria, velocidad de inferencia. La startup Liquid AI de Boston cree haber encontrado una salida a este callejón sin salida, y su nuevo modelo LFM2-24B-A2B no es simplemente otro lanzamiento, sino una declaración de revolución arquitectónica.
Liquid AI es una empresa que surgió de investigaciones del MIT en las llamadas "redes neuronales líquidas" (liquid neural networks), inspiradas en sistemas nerviosos biológicos. A diferencia de los transformers clásicos, donde cada capa realiza una operación fija, las redes líquidas son capaces de adaptar sus cálculos dependiendo de los datos de entrada. Este es un enfoque fundamentalmente diferente al procesamiento de información, y el equipo ha estado desarrollándolo consistentemente durante varios años. LFM2-24B-A2B se convirtió en la culminación de este trabajo — un modelo con 24 mil millones de parámetros, construido sobre una arquitectura híbrida que combina el mecanismo clásico de atención (attention) con operaciones convolucionarias.
Para entender por qué esto es importante, hay que comprender el problema. Los transformers estándar, que subyacen a GPT, Claude y otros modelos, utilizan un mecanismo de auto-atención que permite a cada token "mirar" todos los demás tokens en el contexto. Esta es una herramienta poderosa, pero su complejidad computacional crece cuadráticamente con la longitud del contexto. Duplica la ventana de contexto — y obtiene un aumento cuádruple en los costos computacionales. Por eso, trabajar con documentos largos sigue siendo una de las tareas más consumidoras de recursos para los LLM modernos. Las capas convolucionarias, por el contrario, procesan información localmente y se escalan linealmente, pero históricamente se han considerado menos expressivas para tareas de lenguaje.
El enfoque híbrido de Liquid AI intenta tomar lo mejor de ambos mundos. Los componentes convolucionarios manejan el procesamiento de patrones locales — estructuras sintácticas, dependencias de corto alcance, plantillas recurrentes. El mecanismo de atención se activa donde es necesario capturar conexiones de largo alcance en el texto — referencias a entidades mencionadas anteriormente, cadenas lógicas, razonamiento complejo. La designación "A2B" en el nombre del modelo apunta a una configuración específica de este equilibrio entre bloques de atención y convolución. Esencialmente, el modelo decide por sí mismo qué tipo de procesamiento aplicar a un fragmento particular de datos, haciendo que los cálculos sean significativamente más eficientes.
Veinticuatro mil millones de parámetros es una cifra relativamente modesta según los estándares de 2026, cuando los modelos insignia operan con cientos de miles de millones e incluso billones de parámetros. Pero esa es precisamente la tesis principal de Liquid AI: la eficiencia arquitectónica importa más que la fuerza bruta. Si un modelo con 24 mil millones de parámetros puede competir con modelos varias veces más grandes mientras consume significativamente menos costos de inferencia, esto cambia la economía de toda la industria. Menos GPUs para servir solicitudes — costos de API más bajos. Menor consumo de energía — más fácil desplegar el modelo en dispositivos periféricos. Inferencia más rápida — mejor experiencia del usuario.
Para la industria en su conjunto, el lanzamiento de LFM2-24B-A2B se inscribe en una tendencia más amplia. Cada vez más grupos de investigación y empresas llegan a la conclusión de que la era del "escalado tonto" está terminando. Mamba y otras arquitecturas basadas en espacios de estado, trabajos sobre modelos dispersos con Mixture of Experts, cuantización y destilación — todo esto son intentos de extraer más inteligencia de menos cómputo. Liquid AI va por su propio camino, y su enfoque híbrido parece una de las soluciones más elegantes al problema.
Dicho esto, es bueno mantener un escepticismo saludable. Los benchmarks completos de LFM2-24B-A2B aún necesitan ser estudiados y reproducidos de forma independiente. Las innovaciones arquitectónicas a menudo se ven impresionantes en el papel pero encuentran problemas inesperados cuando se escalan a producción — desde la complejidad del entrenamiento hasta la compatibilidad con la infraestructura de optimización existente. El ecosistema de herramientas alrededor de los transformers se construyó durante años, y cualquier arquitectura alternativa tendrá que demostrar su viabilidad no solo en el laboratorio.
Sin embargo, la dirección que Liquid AI está marcando parece inevitable. La industria de la inteligencia artificial ha llegado a un punto donde añadir más parámetros produce retornos decrecientes, y las demandas de eficiencia energética y velocidad solo crecen. Las empresas que encuentren formas de hacer más con menos recursos definirán el próximo capítulo en el desarrollo de IA. Y arquitecturas híbridas como LFM2 bien podrían ser la clave para ese futuro.
¿Quieres dejar de leer sobre IA y empezar a usarla?
AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.