Cursor Blog→ original

Composer 2.5 do Cursor: agente de código treinado para trabalhar melhor com tarefas longas

Cursor atualizou o Composer 2.5 — agente de código na IDE. Agora funciona melhor com tarefas de longo prazo. O principal: foi treinado com novo método de feedba

Processado por IA de Cursor Blog; editado por Hamidun News
Composer 2.5 do Cursor: agente de código treinado para trabalhar melhor com tarefas longas
Fonte: Cursor Blog. Colagem: Hamidun News.
◐ Ouvir artigo

Cursor lançou o Composer 2.5 — atualização de seu agente de IA para trabalhar com código na IDE. Este é um salto significativo em capacidades mentais e comportamento em relação à versão 2.

O que mudou

O Composer 2.5 lida melhor com tarefas de longo prazo, segue com mais precisão instruções complexas e é mais agradável de usar. A equipe do Cursor melhorou o modelo aumentando os volumes de treinamento, criando ambientes de aprendizado por reforço mais complexos e implementando novos métodos. Nem todas as melhorias são visíveis em testes e benchmarks. As medições importantes são o estilo de comunicação e a capacidade de calibrar esforços. São esses aspectos que tornam o modelo mais prático no trabalho real.

Feedback direcionado

A principal inovação é um novo método de treinamento com feedback textual. O problema: quando o sinal de RL chega por toda a sequência multietapa (centenas de milhares de tokens), é difícil para o modelo entender qual solução levou ao erro. O resultado final é um sinal ruidoso. A solução: inserir uma dica exatamente no momento do erro. Por exemplo, se o modelo tenta chamar uma ferramenta inexistente, uma dica é adicionada ao contexto: "Ferramentas disponíveis: [lista]". Isso ajuda o modelo a se corrigir imediatamente e evitar cometer o erro novamente.

"Isso fornece ao modelo um sinal de aprendizado local para o

comportamento que queremos mudar, mantendo a tarefa de RL mais ampla em toda a trajetória"

Dados sintéticos e escalabilidade

  • Composer 2.5 foi treinado em 25x mais tarefas sintéticas
  • As tarefas são criadas dinamicamente durante o treinamento
  • Uma abordagem de remoção de features de bases de código reais é usada
  • O sistema seleciona tarefas complexas durante a execução do treinamento

Durante o treinamento, a capacidade de codificação do Composer cresce tanto que começa a resolver a maioria das tarefas. Para continuar o crescimento da inteligência, a equipe tanto seleciona tarefas mais complexas quanto as cria dinamicamente ao longo da execução.

Próximos passos

A base do Composer 2.5 é o checkpoint aberto Kimi K2.5 do Moonshot. Mas isso é apenas um passo intermediário. Junto com SpaceX, Cursor está treinando um modelo muito maior do zero, usando 10x mais poder computacional. Colossus 2 possui um milhão de H100-equivalentes. Cursor espera que o novo modelo seja um enorme salto em capacidades.

O que isso significa

A geração de código atingiu um novo nível. Os agentes não estão mais sendo apenas ferramentas auxiliares, mas parceiros completos em projetos de longo prazo. Isso aproxima o momento em que a IA poderá conduzir o desenvolvimento de um projeto quase independentemente.

ZK
Hamidun News
Notícias de AI sem ruído. Seleção editorial diária de mais de 400 fontes. Produto de Zhemal Khamidun, Head of AI na Alpina Digital.

Quer parar de ler sobre IA e começar a usar?

AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.

O que você acha?
Carregando comentários…