Composer 2.5 do Cursor: agente de código treinado para trabalhar melhor com tarefas longas
Cursor atualizou o Composer 2.5 — agente de código na IDE. Agora funciona melhor com tarefas de longo prazo. O principal: foi treinado com novo método de feedba
Processado por IA de Cursor Blog; editado por Hamidun News
Cursor lançou o Composer 2.5 — atualização de seu agente de IA para trabalhar com código na IDE. Este é um salto significativo em capacidades mentais e comportamento em relação à versão 2.
O que mudou
O Composer 2.5 lida melhor com tarefas de longo prazo, segue com mais precisão instruções complexas e é mais agradável de usar. A equipe do Cursor melhorou o modelo aumentando os volumes de treinamento, criando ambientes de aprendizado por reforço mais complexos e implementando novos métodos. Nem todas as melhorias são visíveis em testes e benchmarks. As medições importantes são o estilo de comunicação e a capacidade de calibrar esforços. São esses aspectos que tornam o modelo mais prático no trabalho real.
Feedback direcionado
A principal inovação é um novo método de treinamento com feedback textual. O problema: quando o sinal de RL chega por toda a sequência multietapa (centenas de milhares de tokens), é difícil para o modelo entender qual solução levou ao erro. O resultado final é um sinal ruidoso. A solução: inserir uma dica exatamente no momento do erro. Por exemplo, se o modelo tenta chamar uma ferramenta inexistente, uma dica é adicionada ao contexto: "Ferramentas disponíveis: [lista]". Isso ajuda o modelo a se corrigir imediatamente e evitar cometer o erro novamente.
"Isso fornece ao modelo um sinal de aprendizado local para o
comportamento que queremos mudar, mantendo a tarefa de RL mais ampla em toda a trajetória"
Dados sintéticos e escalabilidade
- Composer 2.5 foi treinado em 25x mais tarefas sintéticas
- As tarefas são criadas dinamicamente durante o treinamento
- Uma abordagem de remoção de features de bases de código reais é usada
- O sistema seleciona tarefas complexas durante a execução do treinamento
Durante o treinamento, a capacidade de codificação do Composer cresce tanto que começa a resolver a maioria das tarefas. Para continuar o crescimento da inteligência, a equipe tanto seleciona tarefas mais complexas quanto as cria dinamicamente ao longo da execução.
Próximos passos
A base do Composer 2.5 é o checkpoint aberto Kimi K2.5 do Moonshot. Mas isso é apenas um passo intermediário. Junto com SpaceX, Cursor está treinando um modelo muito maior do zero, usando 10x mais poder computacional. Colossus 2 possui um milhão de H100-equivalentes. Cursor espera que o novo modelo seja um enorme salto em capacidades.
O que isso significa
A geração de código atingiu um novo nível. Os agentes não estão mais sendo apenas ferramentas auxiliares, mas parceiros completos em projetos de longo prazo. Isso aproxima o momento em que a IA poderá conduzir o desenvolvimento de um projeto quase independentemente.
Quer parar de ler sobre IA e começar a usar?
AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.