Habr AI→ original

Cursor y Microsoft Research Prueban si los Agentes de IA Necesitan Acceso Completo al Depurador

Los agentes de IA ya saben cómo recopilar registros durante la ejecución, pero el siguiente paso es proporcionarles un depurador completo. El experimento de…

Procesado por IA desde Habr AI; editado por Hamidun News
Cursor y Microsoft Research Prueban si los Agentes de IA Necesitan Acceso Completo al Depurador
Fuente: Habr AI. Collage: Hamidun News.
◐ Escuchar artículo

Para que un agente de IA corrija bugs, simplemente leer código y recopilar registros ya no es suficiente: cuando obtiene acceso a un depurador real, comienza a actuar más como un desarrollador humano y comprende mucho mejor exactamente dónde se rompe el programa. A finales de 2025, Cursor lanzó Debug Mode — un modo en el que un agente puede recopilar registros directamente del tiempo de ejecución y usarlos como una fuente adicional de contexto. Para la depuración práctica, este es un paso importante: en lugar de adivinar a partir de rastreos de pila, el modelo ve qué sucede durante la ejecución, qué valores pasan a través de las funciones y en qué punto el sistema se comporta inesperadamente.

Este enfoque resultó ser intuitivamente comprensible también para los desarrolladores: por la reacción de la comunidad, quedó claro que la idea se percibe no como otro modo de marketing, sino como una herramienta genuinamente útil para el trabajo cotidiano con bugs. Pero el registro no es la única forma de acercar la IA a la práctica de ingeniería normal. La siguiente pregunta suena aún más directa: si el agente ya vive junto al IDE, ¿por qué no darle las mismas herramientas que utilizan los humanos?

Hablamos de puntos de interrupción, ejecución paso a paso, visualización del estado del programa y evaluación de expresiones en la línea correcta. Esto es exactamente lo que investigadores de Microsoft Research probaron en el marco experimental Debug2Fix. En su configuración, un subagente separado recibió herramientas para interactuar con el depurador y en tareas de GitBug-Java y SWE-Bench-Live se desempeñó aproximadamente un 20% mejor que un agente regular sin tal acceso.

Esta no es una mejora cosmética: para tareas de corrección automática de código, esta diferencia ya cambia el valor práctico de la herramienta. La idea es clara. Los registros casi siempre ayudan a revelar síntomas, pero un depurador le permite llegar a la mecánica del fallo.

Un agente puede hacer más que simplemente leer que un valor resultó ser incorrecto; puede rastrear el momento en que se volvió incorrecto, qué rama de la condición se activó, qué hay en los objetos en este momento y cómo se comportará la expresión al probar una hipótesis en el lugar. Esencialmente, el modelo recibe no solo observación sino también un experimento controlado. Para depurar estados complejos, condiciones de carrera, valores nulos inesperados o errores de lógica empresarial, esto puede ser crítico, porque aquí el análisis estático e incluso los registros detallados a menudo son insuficientes.

Ante este panorama, tiene sentido que los asistentes IDE completos comiencen a ir más allá de la simple lectura de archivos. Si el agente ya está integrado en el entorno de desarrollo, el acceso al depurador no parece exótico sino una expansión natural de las capacidades. Por eso en la versión reciente del asistente para IntelliJ aparece un Debug Agent que puede interactuar con el depurador directamente en el IDE.

El escenario resulta casi humano: el agente ejecuta el programa, se detiene en el punto correcto, observa el estado, prueba la hipótesis y solo entonces sugiere una corrección. Esta es una diferencia importante respecto al enfoque donde el modelo se basa principalmente en registros e indicios indirectos de un problema. Lo más interesante de esta historia no es solo la mejora de calidad en los puntos de referencia, sino la pregunta en sí: ¿qué es más útil para el desarrollador de IA del futuro — un buen acceso a registros en tiempo de ejecución o "manos" reales dentro del depurador?

Todavía no hay una respuesta completa en un solo experimento, pero ya es evidente que el mercado se está moviendo en dos direcciones simultáneamente. Un camino apuesta por la observación de calidad de la ejecución del programa, el otro — por la intervención activa en el proceso de depuración. Si el segundo enfoque confirma su ventaja en un mayor número de casos reales, los asistentes de codificación de IA dejarán rápidamente de ser simplemente autocompletar inteligente y se convertirán en socios de pleno derecho que saben no solo cómo escribir código, sino también cómo llegar metódicamente a la raíz de un bug.

ZK
Hamidun News
Noticias de AI sin ruido. Selección editorial diaria de más de 400 fuentes. Producto de Zhemal Khamidun, Head of AI en Alpina Digital.

¿Quieres dejar de leer sobre IA y empezar a usarla?

AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.

¿Qué te parece?
Cargando comentarios…