Habr AI→ original

Cursor e Microsoft Research Testam se Agentes de IA Precisam de Acesso Completo ao Debugger

Agentes de IA já sabem como coletar logs durante a execução, mas o próximo passo é fornecê-los com um debugger completo. O experimento da Microsoft Research…

Processado por IA de Habr AI; editado por Hamidun News
Cursor e Microsoft Research Testam se Agentes de IA Precisam de Acesso Completo ao Debugger
Fonte: Habr AI. Colagem: Hamidun News.
◐ Ouvir artigo

Para que um agente IA consiga corrigir bugs, apenas ler código e coletar logs não é mais suficiente: quando ele ganha acesso a um depurador real, começa a agir mais como um desenvolvedor humano e compreende muito melhor exatamente onde o programa quebra. No final de 2025, a Cursor lançou o Debug Mode — um modo no qual um agente pode coletar logs diretamente do tempo de execução e usá-los como uma fonte adicional de contexto. Para depuração prática, este é um passo importante: em vez de adivinhar a partir de rastreamentos de pilha, o modelo vê o que acontece durante a execução, quais valores passam pelas funções e em que ponto o sistema se comporta de forma inesperada.

Esta abordagem se mostrou intuitivamente compreensível também para os desenvolvedores: pela reação da comunidade, ficou claro que a ideia é percebida não como mais um modo de marketing, mas como uma ferramenta genuinamente útil para o trabalho diário com bugs. Mas o registro de logs não é a única maneira de aproximar a IA da prática de engenharia normal. A próxima pergunta soa ainda mais direta: se o agente já vive ao lado da IDE, por que não dar a ele as mesmas ferramentas que os humanos usam?

Estamos falando sobre pontos de interrupção, execução passo a passo, visualização do estado do programa e avaliar expressão na linha correta. Isso é exatamente o que pesquisadores do Microsoft Research testaram no framework experimental Debug2Fix. Em sua configuração, um subagente separado recebeu ferramentas para interagir com o depurador e em tarefas do GitBug-Java e SWE-Bench-Live lidou com bugs aproximadamente 20% melhor do que um agente regular sem tal acesso.

Esta não é uma melhoria cosmética: para tarefas de correção automática de código, essa diferença já muda o valor prático da ferramenta. A ideia é clara. Logs quase sempre ajudam a revelar sintomas, mas um depurador permite que você chegue à mecânica da falha.

Um agente pode fazer mais do que simplesmente ler que um valor se mostrou incorreto; pode rastrear o momento em que ficou incorreto, qual ramificação da condição foi acionada, o que está nos objetos agora e como a expressão se comportará ao testar uma hipótese no local. Essencialmente, o modelo recebe não apenas observação, mas também um experimento controlado. Para depuração de estados complexos, condições de corrida, valores null inesperados ou erros de lógica de negócios, isso pode ser crítico, porque aqui a análise estática e até mesmo logs detalhados frequentemente são insuficientes.

Diante desse contexto, faz sentido que assistentes IDE totalmente funcionais estejam começando a ir além da simples leitura de arquivos. Se o agente já estiver incorporado no ambiente de desenvolvimento, o acesso ao depurador não parece exótico, mas uma expansão natural das capacidades. É por isso que a versão recente do assistente para IntelliJ inclui um Debug Agent que pode interagir com o depurador diretamente na IDE.

O cenário fica quase humano: o agente executa o programa, para no ponto certo, observa o estado, testa a hipótese e só então sugere uma correção. Esta é uma diferença importante em relação à abordagem em que o modelo se baseia principalmente em registro de logs e sinais indiretos de um problema. O que é mais interessante nessa história não é apenas a melhoria de qualidade nos benchmarks, mas a própria pergunta: o que é mais útil para o desenvolvedor IA do futuro — bom acesso a logs de tempo de execução ou "mãos" reais dentro do depurador?

Ainda não há uma resposta completa em um único experimento, mas já está claro que o mercado está se movimentando em duas direções ao mesmo tempo. Um caminho aposta na observação de qualidade da execução do programa, o outro — na intervenção ativa no processo de depuração. Se a segunda abordagem confirmar sua vantagem em um número maior de casos reais, os assistentes de codificação IA deixarão de ser apenas autocompletar inteligente e se tornarão parceiros completos que sabem não apenas como escrever código, mas também como chegar metodicamente à raiz de um bug.

ZK
Hamidun News
Notícias de AI sem ruído. Seleção editorial diária de mais de 400 fontes. Produto de Zhemal Khamidun, Head of AI na Alpina Digital.

Quer parar de ler sobre IA e começar a usar?

AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.

O que você acha?
Carregando comentários…