Cursor Blog→ original

Composer 2.5 de Cursor: agente de código entrenado para trabajar mejor con tareas largas

Cursor actualizó Composer 2.5, el agente de código en el IDE. Ahora funciona mejor con tareas a largo plazo. Lo principal: se entrenó con un nuevo método de ret

Procesado por IA desde Cursor Blog; editado por Hamidun News
Composer 2.5 de Cursor: agente de código entrenado para trabajar mejor con tareas largas
Fuente: Cursor Blog. Collage: Hamidun News.
◐ Escuchar artículo

Cursor lanzó Composer 2.5, la actualización de su agente de IA para trabajar con código en el IDE. Este es un salto significativo en capacidades mentales y comportamiento en comparación con la versión 2.

Qué cambió

Composer 2.5 maneja mejor las tareas a largo plazo, sigue instrucciones complejas con mayor precisión y es más agradable de usar. El equipo de Cursor mejoró el modelo aumentando los volúmenes de entrenamiento, creando entornos más complejos para el aprendizaje por refuerzo e implementando nuevos métodos. No todas las mejoras son visibles en pruebas y benchmarks. Las medidas importantes son el estilo de comunicación y la capacidad de calibrar el esfuerzo. Estos aspectos hacen que el modelo sea más práctico en el trabajo real.

Retroalimentación dirigida

La principal innovación es el nuevo método de entrenamiento con retroalimentación de texto. El problema: cuando la señal RL llega para toda la secuencia multitarea (cientos de miles de tokens), es difícil para el modelo entender qué decisión llevó al error. El resultado final es una señal ruidosa. La solución: insertar una sugerencia en el momento exacto del error. Por ejemplo, si el modelo intenta llamar a una herramienta inexistente, se agrega una sugerencia al contexto diciendo «Herramientas disponibles: [lista]». Esto ayuda al modelo a corregirse de inmediato y no cometer el error la próxima vez.

«Esto le da al modelo una señal de aprendizaje local para el

comportamiento que queremos cambiar, mientras se mantiene la tarea RL más amplia en toda la trayectoria»

Datos sintéticos y escalado

  • Composer 2.5 fue entrenada con 25 veces más tareas sintéticas
  • Las tareas se crean dinámicamente durante el entrenamiento
  • Se utiliza un enfoque de eliminación de características de bases de código reales
  • El sistema selecciona tareas complejas durante la ejecución del entrenamiento

Durante el entrenamiento, la capacidad de Composer para codificar crece tanto que comienza a resolver la mayoría de las tareas. Para continuar el crecimiento de la inteligencia, el equipo tanto selecciona tareas más complejas como las crea dinámicamente durante la ejecución.

Qué sigue

La base de Composer 2.5 es el checkpoint abierto Kimi K2.5 de Moonshot. Pero este es un paso transitorio. Junto con SpaceX, Cursor entrena un modelo mucho más grande desde cero, utilizando 10 veces más computación. Colossus 2 cuenta con un millón de equivalentes H100. Cursor espera que el nuevo modelo sea un salto enorme en capacidades.

Qué significa esto

La generación de código ha llegado a un nuevo nivel. Los agentes se convierten no solo en herramientas auxiliares, sino en asistentes completos para proyectos a largo plazo. Esto acerca el momento en que la IA puede dirigir el desarrollo de proyectos casi de forma independiente.

ZK
Hamidun News
Noticias de AI sin ruido. Selección editorial diaria de más de 400 fuentes. Producto de Zhemal Khamidun, Head of AI en Alpina Digital.

¿Quieres dejar de leer sobre IA y empezar a usarla?

AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.

¿Qué te parece?
Cargando comentarios…