MarkTechPost→ original

Poolside lanzó Laguna XS.2 y M.1 — modelos abiertos para programación con agentes

Poolside lanzó dos modelos para programación con agentes — Laguna XS.2 y M.1. XS.2 recibió pesos abiertos bajo Apache 2.0, se ejecuta localmente y logra un…

Procesado por IA desde MarkTechPost; editado por Hamidun News
Poolside lanzó Laguna XS.2 y M.1 — modelos abiertos para programación con agentes
Fuente: MarkTechPost. Collage: Hamidun News.
◐ Escuchar artículo

Poolside ha lanzado los primeros modelos de la familia Laguna — XS.2 y M.1 — y apuesta no por IA ordinaria para autocompletado, sino por agentes de código que pueden realizar tareas durante largos períodos y secuencialmente sin pérdida constante de contexto. La idea es que el modelo no solo escriba un fragmento de código, sino que lea un repositorio, realice cambios, ejecute pruebas, analice errores y lleve el cambio a un estado funcional en un único ciclo de trabajo.

Lo que presentó Poolside

El lanzamiento incluyó dos modelos y un entorno de agentes en el que la empresa entrena sus propios sistemas. El Laguna M.1 de punta es un gran modelo MoE con 225 mil millones de parámetros y 23 mil millones de parámetros activos por token.

Laguna XS.2 es notablemente más compacto: 33 mil millones de parámetros totales y 3 mil millones activos. Para el mercado, esta es una señal importante: Poolside no solo está lanzando un modelo de servidor para cargas pesadas, sino también una versión ligera para uso local.

XS.2 se convirtió en el primer modelo open-weight de la empresa. Poolside lo distribuye bajo la licencia Apache 2.

0 y enfatiza específicamente que el modelo puede ejecutarse en Mac con 36 GB de RAM a través de Ollama. Junto con los modelos, la empresa abrió una vista previa de investigación del agente de terminal pool y un cliente ACP con servidor. Este es el mismo entorno que Poolside utiliza internamente para entrenamiento RL y pruebas de cómo el agente resuelve tareas de ingeniería reales paso a paso.

Resultados en benchmarks

El argumento principal del lanzamiento son los resultados en pruebas de desarrollo aplicadas. Laguna M.1 obtuvo 72,5% en SWE-bench Verified, 67,3% en SWE-bench Multilingual, 46,9% en SWE-bench Pro y 40,7% en Terminal-Bench 2.

0. XS.2 obtiene resultados ligeramente inferiores, pero se ve muy fuerte en su categoría de peso: 68,2%, 62,4%, 44,5% y 30,1% respectivamente.

Para un modelo open-weight compacto, este es ya un nivel al que muchos agentes de codificación locales se orientarán. Estos números son importantes no solo por sí solos. SWE-bench Verified y Pro verifican si el modelo puede corregir errores reales en repositorios existentes, mientras que Terminal-Bench se acerca más al comportamiento del agente en la terminal, donde necesitas trabajar con archivos y comandos.

Poolside llama directamente a ambos modelos Laguna modelos para tareas de largo horizonte: cuando necesitas mantener el contexto, planificar una serie de pasos y no desmoronarse después de una larga cadena de llamadas de herramientas y verificaciones intermedias.

  • Laguna XS.2 es el primer modelo open-weight de Poolside
  • Los pesos de XS.2 están disponibles bajo la licencia Apache 2.0
  • La ventana de contexto de XS.2 es de 131.072 tokens
  • XS.2 se puede ejecutar localmente en Mac con 36 GB de RAM
  • Ambos modelos fueron entrenados con más de 30 billones de tokens

Cómo se hicieron los modelos

Ambos modelos Laguna se entrenaron desde cero en la propia infraestructura de Poolside, sin depender de otro modelo base. Para M.1, la empresa utilizó 6.

144 GPU NVIDIA Hopper interconectadas. La familia se basa en Mixture of Experts: en cada paso, solo se activa una parte de los "expertos", por lo que el modelo puede ser grande en número total de parámetros pero no tan costoso de ejecutar como modelos densos de escala comparable. Esto es especialmente importante para escenarios de agentes donde las llamadas de modelo son frecuentes.

Para XS.2, Poolside describe por separado un conjunto de soluciones de eficiencia: mezcla de Sliding Window Attention y atención global, cuantización de KV-cache a FP8 y una arquitectura con 256 expertos. Como resultado, el modelo obtuvo una ventana de contexto de 131k tokens y soporte para razonamiento nativo entre llamadas de herramientas.

Si eliminas el marketing, el significado es simple: un agente puede alternar entre pensar, trabajar con la terminal y los siguientes pasos sin una ruptura severa entre estas fases y con menores costos de memoria. Un énfasis separado en el anuncio es en el entrenamiento de agentes, no solo el modelo de lenguaje. Poolside construyó un sistema RL asincrónico donde los actores activan sandboxes, ejecutan tareas, recopilan trayectorias y casi continuamente las pasan al entrenador.

La empresa también afirma que el optimizador Muon permitió lograr la misma pérdida de entrenamiento en aproximadamente 15% menos pasos en comparación con AdamW. Esto no hace que Laguna sea un líder automático en todas las métricas, pero muestra la madurez de toda la pila, no solo un checkpoint exitoso.

Lo que esto significa

El mercado ahora tiene más que solo "modelos de código", sino sistemas diseñados para programación de agentes de pleno derecho. Para los desarrolladores, esto significa la aparición de otra base open-weight fuerte que puede ajustarse, cuantificarse y ejecutarse localmente. Para la industria en general, el lanzamiento de Laguna muestra un cambio del escenario "el modelo escribe una función" a un formato donde la IA realiza una larga tarea de ingeniería completa — y esto es exactamente alrededor de lo que se está construyendo la próxima ola de competencia ahora.

ZK
Hamidun News
Noticias de AI sin ruido. Selección editorial diaria de más de 400 fuentes. Producto de Zhemal Khamidun, Head of AI en Alpina Digital.

¿Quieres dejar de leer sobre IA y empezar a usarla?

AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.

¿Qué te parece?
Cargando comentarios…