OpenAI reveló cómo sus agentes escriben código (y por qué no es magia)
OpenAI rompió su silencio. Tras meses en los que la empresa guardaba secretos tan cuidadosamente como la fórmula de la Coca-Cola, los desarrolladores de…
Procesado por IA desde Ars Technica; editado por Hamidun News
OpenAI rompió su silencio. Tras meses en los que la empresa guardaba secretos tan cuidadosamente como la fórmula de la Coca-Cola, los desarrolladores de repente divulgaron detalles sobre cómo sus modelos se transforman de herramientas avanzadas de autocompletado de texto en ingenieros completos. Se trata de la arquitectura técnica de los agentes de codificación, y este análisis nos ofrece una oportunidad rara de vislumbrar un futuro donde la programación deja de ser trabajo manual. Hay que decir que el nombre OpenAI ha lucido bastante irónico en los últimos años, pero este post técnico nos devuelve a los tiempos en que la empresa realmente compartía su experiencia.
En el centro de atención está el llamado "agent loop" o ciclo de agente. Antes, estábamos acostumbrados a que las redes neuronales simplemente generaran un fragmento de código en respuesta a una solicitud. Si no funcionaba, ese era tu problema.
Ahora el enfoque ha cambiado fundamentalmente. OpenAI describe un sistema que funciona de forma iterativa: el modelo escribe código, lo ejecuta inmediatamente en una "sandbox" cerrada, recibe un informe de errores del compilador y vuelve al principio para corregir sus propios fallos. Este proceso se repite hasta que las pruebas se superan correctamente.
En esencia, la empresa automatizó el proceso por el que pasa cualquier desarrollador junior en su primer año de trabajo, solo que lo hace miles de veces más rápido.
¿Por qué es importante justo ahora? Seamos sinceros: últimamente, Claude 3.5 Sonnet de Anthropic ha desanimado bastante al equipo de Sam Altman, tomando el liderazgo en programación. Publicar detalles técnicos no es solo un gesto de buena fe, sino un intento de demostrar que OpenAI sigue controlando el pensamiento arquitectónico. Están apostando no por el tamaño del modelo, sino por la complejidad del sistema que lo rodea. Resultó que incluso un modelo menos potente con las herramientas de depuración adecuadas puede mostrar mejores resultados que un "supercomputador desnudo". Este es un cambio fundamental en la industria: estamos pasando de una carrera de parámetros a una carrera de arquitecturas de agentes.
Es interesante cómo OpenAI describe el trabajo con contexto. Los agentes ahora no solo leen un archivo único—pueden "mirar alrededor" en el repositorio, entendiendo las conexiones entre diferentes partes del proyecto. Esto resuelve el principal problema de la codificación con IA—cuando se corrige una línea, el modelo rompe toda la arquitectura de la aplicación.
Ahora el agente primero construye un mapa de dependencias y solo entonces se pone manos a la obra con el teclado virtual. Este enfoque permite resolver tareas al nivel de SWE-bench—la prueba más difícil para la IA, donde hay que corregir bugs reales en proyectos de código abierto en GitHub. Y a juzgar por los números que proporciona la empresa, estamos en el umbral de un momento en que la IA podrá cerrar hasta la mitad de los tickets rutinarios de Jira sin intervención humana.
Por supuesto, la ironía no falta. Mientras OpenAI enseña a los agentes a escribir código perfecto, los desarrolladores de todo el mundo comienzan a preguntarse: ¿no estarán escribiendo una herramienta para su propio desempleo ahora? Sin embargo, la sustitución completa del ser humano aún está lejos.
El principal problema son las "alucinaciones lógicas," cuando el código es sintácticamente correcto e incluso pasa las pruebas, pero hace algo completamente diferente de lo que pidió el negocio. Los agentes de OpenAI aún no han aprendido a cuestionar especificaciones mal redactadas, y esa es nuestra salvación temporal. Sin embargo, la dirección es clara: el desarrollo de software se está transformando en un proceso de supervisión de un ejército de agentes autónomos, en lugar de escribir líneas manualmente.
Lo fundamental: la era de los prompts de código simple está llegando a su fin, y la era de los sistemas complejos de agentes está comenzando. ¿Podrá OpenAI mantener su liderazgo en este segmento, o las startups más flexibles la adelantarán?
¿Quieres dejar de leer sobre IA y empezar a usarla?
AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.