MarkTechPost→ original

Cohere lanza Command A+: 218 mil millones de parámetros para agentes en dos GPUs

Cohere lanzó Command A+, un modelo abierto con 218 mil millones de parámetros para flujos de trabajo basados en agentes. Con cuantización W4A4, se ejecuta en do

Cohere lanza Command A+: 218 mil millones de parámetros para agentes en dos GPUs
Fuente: MarkTechPost. Collage: Hamidun News.
◐ Escuchar artículo

Cohere lanzó Command A+ — un modelo de código abierto de nueva generación para flujos de trabajo con agentes. Son 218 mil millones de parámetros en una arquitectura Sparse Mixture-of-Experts, combinando cuatro variantes anteriores de Command A en una solución universal.

Enorme potencia en un factor de forma compacto

El logro principal es la eficiencia sin pérdida de calidad. Gracias a la cuantización W4A4 (grabación de 4 bits de pesos y activaciones), el modelo se ejecuta en dos GPU H100. Los modelos competidores con 300+ mil millones de parámetros requieren ocho a dieciséis tarjetas gráficas.

Esto reduce el costo de implementación casi cuatro veces. La compatibilidad con 48 idiomas, incluidos ruso, chino y árabe, hace que Command A+ sea verdaderamente global. Para las empresas que construyen agentes para mercados internacionales, esto es crítico.

Pero lo más interesante es que este es el primer modelo de razonamiento multimodal de Cohere. Funciona con texto, video e imágenes simultáneamente, ampliando el alcance de tareas desde el procesamiento de grabaciones de reuniones hasta el análisis de capturas de pantalla y diagramas.

Para quién es útil esto

El código abierto es una ventaja clave. Los desarrolladores ahora pueden implementar Command A+ en sus propios servidores sin dependencia de la nube. Para startups y empresas con datos confidenciales (fintech, healthcare), esto es crítico.

  • Requisitos mínimos: dos H100 en lugar de dieciséis
  • Multimodalidad en un modelo (texto, video, imágenes)
  • Compatibilidad con 48 idiomas para mercados globales
  • Optimización Sparse MoE: solo 37B parámetros funcionan simultáneamente
  • Ciclo de vida simplificado: cuatro modelos se convirtieron en uno

Esto es especialmente importante para agentes que requieren actualizaciones frecuentes y adaptación a procesos específicos. Cuando el modelo se ejecuta localmente, el ciclo de desarrollo se acelera.

Contexto de competencia

Command A se lanzó anteriormente en cuatro variantes diferentes — para búsqueda, chat, codificación y análisis. Combinar en un modelo multimodal simplifica el ecosistema en medio de la feroz competencia con OpenAI, Anthropic y otros líderes. Cohere ofrece a las empresas una base de código abierto poderosa con la que pueden trabajar investigadores, startups y clientes empresariales.

Lo que esto significa

Los modelos abiertos grandes están volviéndose más competitivos con los propietarios. Cuando 218 mil millones de parámetros se ejecutan en dos tarjetas gráficas en lugar de un clúster de cientos de GPU, la barrera de entrada cae drásticamente. Para las empresas que construyen sus propios agentes, esto significa más control, costos más bajos y un ciclo de actualización más rápido.

ZK
Hamidun News
Noticias de AI sin ruido. Selección editorial diaria de más de 400 fuentes. Producto de Zhemal Khamidun, Head of AI en Alpina Digital.
¿Qué te parece?
Cargando comentarios…