Composer 2.5 de Cursor : l'agent de code apprend à mieux gérer les tâches longues
Cursor a mis à jour Composer 2.5 — l'agent de code dans l'IDE. Il gère désormais mieux les tâches à long terme. L'essentiel : le modèle a été entraîné selon un
Traité par IA depuis Cursor Blog ; édité par Hamidun News
Cursor a lancé Composer 2.5 — une mise à jour de son agent IA pour travailler avec le code dans l'IDE. C'est un bond significatif en termes de capacités intellectuelles et de comportement par rapport à la version 2.
Qu'est-ce qui a changé
Composer 2.5 gère mieux les tâches à long terme, suit plus précisément les instructions complexes et est plus agréable à utiliser. L'équipe Cursor a amélioré le modèle en augmentant les volumes d'entraînement, en créant des environnements d'apprentissage par renforcement plus complexes et en implémentant de nouvelles méthodes. Toutes les améliorations ne sont pas visibles dans les tests et les benchmarks. Les mesures importantes sont le style de communication et la capacité à calibrer les efforts. Ce sont exactement ces aspects qui rendent le modèle plus pratique dans le travail réel.
Feedback ciblé
L'innovation principale est une nouvelle méthode d'entraînement avec retour d'information textuel. Le problème : quand le signal RL arrive pour toute la séquence multi-étapes (des centaines de milliers de jetons), il est difficile au modèle de comprendre quelle décision a conduit à l'erreur. Le résultat final est un signal bruyant. La solution : insérer un indice précisément au moment de l'erreur. Par exemple, si le modèle essaie d'appeler un outil inexistant, un indice « Outils disponibles : [liste] » est ajouté au contexte. Cela aide le modèle à se corriger immédiatement et à ne pas répéter l'erreur suivante.
«
Cela donne au modèle un signal d'apprentissage local pour le comportement que nous voulons changer, tout en préservant la tâche RL plus large sur toute la trajectoire »
Données synthétiques et mise à l'échelle
- Composer 2.5 est entraîné sur 25 fois plus de tâches synthétiques
- Les tâches sont créées dynamiquement pendant l'entraînement
- Une approche avec suppression de features des bases de code réelles est utilisée
- Le système sélectionne les tâches complexes directement pendant l'exécution d'entraînement
Pendant l'entraînement, la capacité de Composer à générer du code se développe au point qu'il commence à résoudre la plupart des tâches. Pour continuer la croissance de l'intelligence, l'équipe à la fois sélectionne des tâches plus complexes et les crée dynamiquement tout au long de l'exécution.
Et après ?
La base de Composer 2.5 est le point de contrôle ouvert Kimi K2.5 de Moonshot. Mais c'est une étape transitoire. Avec SpaceX, Cursor entraîne un modèle beaucoup plus grand à partir de zéro, en utilisant 10 fois plus de calculs. Colossus 2 dispose d'un million d'équivalents H100. Cursor s'attend à ce que le nouveau modèle soit un énorme bond en termes de capacités.
Ce que cela signifie
La génération de code a atteint un nouveau niveau. Les agents ne deviennent plus simplement un outil auxiliaire, mais des assistants à part entière pour les projets à long terme. Cela rapproche le moment où l'IA pourra diriger le développement de projet de manière presque autonome.
Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?
AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.