Hugging Face Blog→ original

Cohere presentó North Mini Code — un modelo para desarrolladores y agentes de IA

Cohere presentó North Mini Code — un modelo de 30 mil millones de parámetros para programadores. Fue entrenado en codificación, trabajo en terminal e interacció

Procesado por IA desde Hugging Face Blog; editado por Hamidun News
Cohere presentó North Mini Code — un modelo para desarrolladores y agentes de IA
Fuente: Hugging Face Blog. Collage: Hamidun News.
◐ Escuchar artículo

Cohere lanzó North Mini Code — su primer modelo desarrollado específicamente para programadores. El modelo de 30 mil millones de parámetros con 3 mil millones de parámetros activos ya está disponible en Hugging Face bajo licencia Apache 2.0, fue entrenado en programación, trabajo con agentes de IA y terminal.

Arquitectura y rendimiento

North Mini Code se construye sobre la arquitectura Mixture of Experts: 128 expertos, de los cuales 8 están activos en cada momento. El modelo utiliza un mecanismo de atención en proporción 3:1 (local y global), así como activación SwiGLU. En calidad de codificación obtiene 33.4 puntos en el Índice de Codificación de Artificial Analysis — superando a Qwen 3.5 (35B), Gemma 4 (26B) e incluso Mistral Small (119B), a pesar de que estos son más grandes en tamaño.

Entrenamiento con refuerzo de dos etapas

En la primera etapa de ajuste fino supervisado, Cohere enfatizó la programación: 70% de los datos son código, 43% son ejemplos de interacción con herramientas (agentic tool-use), 27% son soluciones de problemas de competencia y científicos. La segunda etapa utilizó 4.5 mil millones de tokens de la más alta calidad para perfeccionar el comportamiento en escenarios de agentes. Luego aplicaron aprendizaje por refuerzo con recompensas verificables (RLVR), entrenando el modelo en dos tipos de tareas simultáneamente:

  • Trabajo con terminal (comandos bash, procesamiento de salida y errores)
  • Edición y depuración de código en archivos
  • Llamada a herramientas a través de API y entrada/salida estándar

Entrenado en diferentes marcos de trabajo a la vez

Cohere entrenó North Mini Code no en un solo marco de trabajo de agentes, sino en tres simultáneamente — SWE-Agent, mini-SWE-Agent y OpenCode. Esto es crítico: cada marco requiere su propio formato de comandos y procesamiento de resultados. Este enfoque hace que el modelo sea universal y confiable en cualquier entorno real.

«Entrenamos en varios marcos de trabajo de agentes en lugar de optimizar para una sola interfaz, para que el modelo sea resistente a diferentes herramientas», — explicaron en

Cohere.

Resultados: 7-8% mejor

Después del entrenamiento RLVR, el modelo mejoró resultados en un 7.9% en Terminal-Bench v2 y un 3.0% en SWE-Bench (comparación con la versión base). La evaluación humana en 85 ejemplos mostró 66.1% de victorias en tareas de edición de código. El modelo comete significativamente menos errores al trabajar con herramientas y maneja con más confianza cadenas largas de comandos.

Qué significa esto

North Mini Code es una señal de que los desarrolladores ya no necesitan modelos LLM generales. Las empresas entrenan modelos específicamente para código y agentes, porque funciona mejor. Para los desarrolladores esto significa: se puede implementar un poderoso asistente de IA directamente en el servidor, sin dependencia de APIs en la nube y servicios pagos.

ZK
Hamidun News
Noticias de AI sin ruido. Selección editorial diaria de más de 400 fuentes. Producto de Zhemal Khamidun, Head of AI en Alpina Digital.

¿Quieres dejar de leer sobre IA y empezar a usarla?

AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.

¿Qué te parece?
Cargando comentarios…