Cohere apresenta North Mini Code — modelo para desenvolvedores e agentes de IA
Cohere apresentou North Mini Code — um modelo de 30 bilhões de parâmetros para programadores. Ele foi treinado em codificação, trabalho com terminal e interação
Processado por IA de Hugging Face Blog; editado por Hamidun News
Cohere lançou North Mini Code — seu primeiro modelo desenvolvido especialmente para programadores. O modelo de 30 bilhões de parâmetros com 3 bilhões de parâmetros ativos já está disponível no Hugging Face sob licença Apache 2.0, treinado em programação, funcionamento com agentes de IA e terminal.
Arquitetura e desempenho
North Mini Code foi construída na arquitetura Mixture of Experts: 128 especialistas, dos quais 8 estão ativos a cada momento. O modelo usa um mecanismo de atenção na proporção 3:1 (local e global), bem como ativação SwiGLU. Em qualidade de codificação, atinge 33,4 pontos no Coding Index da Artificial Analysis — superando Qwen3.5 (35B), Gemma 4 (26B) e até Mistral Small (119B), apesar de serem maiores em tamanho.
Treinamento de duas etapas com reforço
No primeiro estágio de fine-tuning supervisionado, Cohere enfatizou a programação: 70% dos dados são código, 43% são exemplos de interação com ferramentas (agentic tool-use), 27% são soluções de problemas de competição e científicos. O segundo estágio usou 4,5 bilhões de tokens de qualidade superior para refinar o comportamento em cenários de agentes. Depois, aplicou-se aprendizado por reforço com recompensas verificáveis (RLVR), treinando o modelo em dois tipos de tarefas simultaneamente:
- Trabalho com terminal (comandos bash, processamento de saída e erros)
- Edição e depuração de código em arquivos
- Chamada de ferramentas via API e entrada/saída padrão
Treinamento em diferentes frameworks simultaneamente
Cohere treinou North Mini Code não em um framework de agentes, mas em três simultaneamente — SWE-Agent, mini-SWE-Agent e OpenCode. Isso é crítico: cada framework requer seu próprio formato de comandos e processamento de resultados. Essa abordagem torna o modelo universal e confiável em qualquer ambiente real.
«Treinamos em vários frameworks de agentes em vez de otimizar para uma única interface, para que o modelo fosse resistente a diferentes ferramentas», explicou
Cohere.
Resultados: 7-8% melhor
Após o treinamento RLVR, o modelo melhorou os resultados em 7,9% no Terminal-Bench v2 e em 3,0% no SWE-Bench (comparação com a versão de base). Uma avaliação humana em 85 exemplos mostrou 66,1% de vitórias em tarefas de edição de código. O modelo comete significativamente menos erros ao trabalhar com ferramentas e lida com mais confiança com longas cadeias de comandos.
O que isso significa
North Mini Code é um sinal de que os desenvolvedores não precisam mais de modelos LLM genéricos. As empresas estão treinando modelos especificamente para código e agentes, porque funciona melhor. Para os desenvolvedores, isso significa: você pode implantar um poderoso assistente de IA localmente, sem depender de APIs em nuvem e serviços pagos.
Quer parar de ler sobre IA e começar a usar?
AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.