Cohere présente North Mini Code — un modèle pour les développeurs et les agents IA
Cohere a présenté North Mini Code — un modèle de 30 milliards de paramètres conçu pour les programmeurs. Entraîné sur la programmation, l'utilisation du termina
Traité par IA depuis Hugging Face Blog ; édité par Hamidun News
Cohere a lancé North Mini Code — son premier modèle développé spécialement pour les programmeurs. Le modèle de 30 milliards de paramètres, avec 3 milliards de paramètres actifs, est déjà disponible sur Hugging Face sous la licence Apache 2.0. Il a été entraîné sur la programmation, l'interaction avec les agents IA et l'utilisation du terminal.
Architecture et performances
North Mini Code est construit sur une architecture Mixture of Experts : 128 experts, dont 8 sont actifs à chaque moment. Le modèle utilise un mécanisme d'attention avec un ratio 3:1 (local et global), ainsi qu'une activation SwiGLU. En termes de qualité de codage, il obtient 33,4 points sur l'indice de codage d'Artificial Analysis — surpassant Qwen3.5 (35B), Gemma 4 (26B) et même Mistral Small (119B), malgré leur taille plus importante.
Entraînement à deux étapes avec apprentissage par renforcement
À la première étape du fine-tuning supervisé, Cohere a mis l'accent sur la programmation : 70 % des données sont du code, 43 % sont des exemples d'interaction avec les outils (utilisation d'outils d'agents), 27 % sont des solutions de problèmes de concours et scientifiques. La deuxième étape a utilisé 4,5 milliards de tokens de la plus haute qualité pour affiner le comportement dans les scénarios d'agents. Ensuite, ils ont appliqué l'apprentissage par renforcement avec des récompenses vérifiables (RLVR), entraînant le modèle sur deux types de tâches simultanément :
- Utilisation du terminal (commandes bash, traitement des sorties et des erreurs)
- Édition et débogage du code dans les fichiers
- Appel d'outils via API et entrée/sortie standard
Entraîné sur plusieurs frameworks à la fois
Cohere a entraîné North Mini Code non pas sur un seul framework d'agents, mais sur trois à la fois — SWE-Agent, mini-SWE-Agent et OpenCode. C'est critique : chaque framework nécessite son propre format de commandes et son traitement des résultats. Cette approche rend le modèle universel et fiable dans n'importe quel environnement réel.
«
Nous avons entraîné sur plusieurs frameworks d'agents au lieu d'optimiser pour une seule interface, afin que le modèle soit robuste face à différents outils », ont expliqué les responsables chez Cohere.
Résultats : 7-8 % de mieux
Après l'entraînement RLVR, le modèle a amélioré ses résultats de 7,9 % sur Terminal-Bench v2 et de 3,0 % sur SWE-Bench (comparé à la version de base). L'évaluation humaine sur 85 exemples a montré 66,1 % de succès dans les tâches d'édition de code. Le modèle commet considérablement moins d'erreurs lors de l'utilisation d'outils et gère plus efficacement les longues chaînes de commandes.
Qu'est-ce que cela signifie
North Mini Code est un signal indiquant que les développeurs n'ont plus besoin de modèles LLM générales. Les entreprises entraînent des modèles spécifiquement pour le code et les agents, car cela fonctionne mieux. Pour les développeurs, cela signifie qu'ils peuvent déployer un puissant assistant IA localement, sans dépendre des API cloud ni des services payants.
Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?
AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.