Hugging Face Blog→ original

Cohere apresenta North Mini Code — modelo para desenvolvedores e agentes de IA

Cohere apresentou North Mini Code — um modelo de 30 bilhões de parâmetros para programadores. Ele foi treinado em codificação, trabalho com terminal e interação

Processado por IA de Hugging Face Blog; editado por Hamidun News
Cohere apresenta North Mini Code — modelo para desenvolvedores e agentes de IA
Fonte: Hugging Face Blog. Colagem: Hamidun News.
◐ Ouvir artigo

Cohere lançou North Mini Code — seu primeiro modelo desenvolvido especialmente para programadores. O modelo de 30 bilhões de parâmetros com 3 bilhões de parâmetros ativos já está disponível no Hugging Face sob licença Apache 2.0, treinado em programação, funcionamento com agentes de IA e terminal.

Arquitetura e desempenho

North Mini Code foi construída na arquitetura Mixture of Experts: 128 especialistas, dos quais 8 estão ativos a cada momento. O modelo usa um mecanismo de atenção na proporção 3:1 (local e global), bem como ativação SwiGLU. Em qualidade de codificação, atinge 33,4 pontos no Coding Index da Artificial Analysis — superando Qwen3.5 (35B), Gemma 4 (26B) e até Mistral Small (119B), apesar de serem maiores em tamanho.

Treinamento de duas etapas com reforço

No primeiro estágio de fine-tuning supervisionado, Cohere enfatizou a programação: 70% dos dados são código, 43% são exemplos de interação com ferramentas (agentic tool-use), 27% são soluções de problemas de competição e científicos. O segundo estágio usou 4,5 bilhões de tokens de qualidade superior para refinar o comportamento em cenários de agentes. Depois, aplicou-se aprendizado por reforço com recompensas verificáveis (RLVR), treinando o modelo em dois tipos de tarefas simultaneamente:

  • Trabalho com terminal (comandos bash, processamento de saída e erros)
  • Edição e depuração de código em arquivos
  • Chamada de ferramentas via API e entrada/saída padrão

Treinamento em diferentes frameworks simultaneamente

Cohere treinou North Mini Code não em um framework de agentes, mas em três simultaneamente — SWE-Agent, mini-SWE-Agent e OpenCode. Isso é crítico: cada framework requer seu próprio formato de comandos e processamento de resultados. Essa abordagem torna o modelo universal e confiável em qualquer ambiente real.

«Treinamos em vários frameworks de agentes em vez de otimizar para uma única interface, para que o modelo fosse resistente a diferentes ferramentas», explicou

Cohere.

Resultados: 7-8% melhor

Após o treinamento RLVR, o modelo melhorou os resultados em 7,9% no Terminal-Bench v2 e em 3,0% no SWE-Bench (comparação com a versão de base). Uma avaliação humana em 85 exemplos mostrou 66,1% de vitórias em tarefas de edição de código. O modelo comete significativamente menos erros ao trabalhar com ferramentas e lida com mais confiança com longas cadeias de comandos.

O que isso significa

North Mini Code é um sinal de que os desenvolvedores não precisam mais de modelos LLM genéricos. As empresas estão treinando modelos especificamente para código e agentes, porque funciona melhor. Para os desenvolvedores, isso significa: você pode implantar um poderoso assistente de IA localmente, sem depender de APIs em nuvem e serviços pagos.

ZK
Hamidun News
Notícias de AI sem ruído. Seleção editorial diária de mais de 400 fontes. Produto de Zhemal Khamidun, Head of AI na Alpina Digital.

Quer parar de ler sobre IA e começar a usar?

AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.

O que você acha?
Carregando comentários…