Cómo funcionan los agentes de AI para escribir código y qué es importante saber sobre ellos
Ars Technica publicó un análisis detallado de cómo funcionan los agentes de AI para coding, desde Cursor y GitHub Copilot hasta Devin y Claude Code. Entre…
Procesado por IA desde Ars Technica; editado por Hamidun News
El programador de 2025 cada vez menos escribe código desde cero. Formula una tarea, lanza un agente de IA y observa cómo genera docenas de archivos, refactoriza la arquitectura e incluso ejecuta pruebas. Herramientas como Cursor, GitHub Copilot Workspace, Devin y Claude Code se han transformado de experimentos exóticos en realidad cotidiana para cientos de miles de desarrolladores en el último año. Pero pocos usuarios entienden realmente qué sucede bajo el capó. Ars Technica publicó un análisis detallado de la mecánica interna de los agentes de IA para escritura de código, y las conclusiones merecen la atención de cualquiera que confíe a la máquina al menos parte de su trabajo.
El fundamento de cualquier agente de codificación es un gran modelo de lenguaje, sea GPT-4o, Claude 3.5 Sonnet o Gemini. Pero el modelo en sí es solo un motor.
Un agente es toda una estructura de ingeniería a su alrededor. El primer y quizás el problema más crítico que resuelven los desarrolladores de agentes es la limitación de la ventana de contexto. Incluso los modelos más avanzados tienen una finita: 128 o 200 mil tokens suena impresionante, pero un proyecto de software real puede contener millones de líneas de código.
Los agentes lo resuelven mediante un conjunto de trucos: indexan la base de código, construyen mapas semánticos del repositorio, extraen solo fragmentos relevantes y comprimen el contexto, descartando lo que el modelo ya ha "procesado". Esencialmente, el agente actúa como un bibliotecario inteligente que proporciona al modelo exactamente los libros que necesita para responder una pregunta específica, en lugar de descargar toda la biblioteca sobre la mesa.
El segundo mecanismo clave son las cadenas de razonamiento, o chain-of-thought. En lugar de generar una respuesta de una sola vez, el agente divide una tarea compleja en pasos secuenciales. Primero analiza la estructura del proyecto, luego formula un plan de cambios, luego implementa cada paso, verifica el resultado y ajusta el rumbo si es necesario.
Esto no es solo un dispositivo estilístico — la investigación muestra que el razonamiento paso a paso reduce radicalmente la cantidad de errores al resolver problemas complejos. Algunos agentes van más allá y utilizan lo que se llama arquitectura multi-agente: un modelo actúa como "arquitecto" y descompone la tarea, otro escribe código, un tercero se encarga de la revisión, un cuarto se encarga de las pruebas. Se comunican entre sí a través de prompts estructurados, imitando el trabajo de un equipo de desarrollo real.
Así es como está construido Devin de Cognition y varios otros sistemas avanzados.
Pero detrás de demostraciones impresionantes se esconden limitaciones serias que vale la pena recordar. La principal es las alucinaciones. Un agente puede usar con confianza una API inexistente, llamar a funciones con argumentos incorrectos o crear código que se ve impecable pero contiene errores lógicos sutiles. El problema se agrava por el hecho de que los agentes operan de forma autónoma: si un autocompletador clásico como el Copilot temprano sugería una línea que el desarrollador evaluaba inmediatamente, entonces un agente moderno puede generar cientos de líneas en una docena de archivos. Verificar tal volumen manualmente es una tarea no trivial, y la tentación de simplemente hacer clic en "aceptar todo" es grande.
Un dolor de cabeza separado es la seguridad. La investigación ya ha documentado casos en que agentes de IA introdujeron vulnerabilidades en el código: desde inyecciones SQL hasta manejo inseguro de entrada de usuario. El modelo optimiza código para "funciona", no para "es seguro", y sin requisitos explícitos de seguridad puede elegir el camino más simple, pero inseguro. Para equipos que trabajan con datos sensibles o sistemas financieros, esto no es un riesgo abstracto, sino una amenaza concreta.
También hay un efecto más sutil que la industria apenas comienza a darse cuenta. Cuando un desarrollador depende de un agente para escribir una porción significativa del código, gradualmente pierde una comprensión profunda de su propia base de código. El código escrito por una máquina a menudo es estilísticamente ajeno al equipo, utiliza patrones desconocidos y es más difícil de depurar. Emerge una paradoja: una herramienta diseñada para acelerar el desarrollo puede ralentizar el mantenimiento del producto a largo plazo.
Todo esto no significa que deba abandonar los agentes de IA. Realmente aceleran las tareas rutinarias, ayudan a aprender frameworks desconocidos y disminuyen la barrera de entrada para la programación. Pero debe tratarlos como un pasante muy capaz, pero inexperto: puede hacer mucho, pero cada resultado requiere revisión de un colega sénior. Entender exactamente cómo el agente toma decisiones — cómo comprime contexto, cómo divide tareas, dónde están sus puntos ciegos — se transforma de curiosidad académica en habilidad práctica. En un mundo donde agentes de IA escriben cada vez más código, la alfabetización en su mecánica se convierte en una competencia tan fundamental para desarrolladores como conocer Git o ser capaz de leer registros.
¿Quieres dejar de leer sobre IA y empezar a usarla?
AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.