OpenAI Actualizó Codex: Gestión de Escritorio, Generación de Imágenes y Memoria de Tareas
OpenAI lanzó un gran paquete de actualizaciones para su sistema de desarrollo de agentes Codex. Ahora puede gestionar aplicaciones en el escritorio de Mac…
Procesado por IA desde The Verge; editado por Hamidun News
OpenAI ha actualizado Codex — un sistema de agente para automatización de desarrollo — añadiendo la capacidad de gestionar aplicaciones de escritorio, generar imágenes y mantener memoria de tareas anteriores. El paquete de actualización fue lanzado en medio de la intensificación de la competencia con Anthropic y se posiciona directamente como una respuesta al creciente dominio de Claude Code. Antes de esta actualización, Codex operaba principalmente en un entorno de navegador y ejecutaba tareas en contenedores aislados — sin acceso directo a lo que sucedía en la pantalla del usuario.
Ahora el sistema ha ganado acceso completo al escritorio de macOS: el agente puede abrir, gestionar e interactuar con cualquier aplicación instalada — desde Xcode hasta Figma, desde Slack hasta la terminal nativa. Un punto clave: Codex opera en segundo plano y no toma el control de la interfaz mientras el usuario está ocupado con otra tarea. Múltiples agentes pueden actuar en paralelo e independientemente, cada uno resolviendo su propia subtarea.
El contexto de esta actualización es importante. Según The Verge, OpenAI ha redistribuido recursos significativos específicamente para competir con Claude Code de Anthropic. Este último ha ganado una popularidad excepcional entre desarrolladores profesionales — gracias a la ejecución precisa de instrucciones complejas en terminal, comprensión profunda de la arquitectura de grandes bases de código y la capacidad de realizar trabajos en proyectos reales sin supervisión manual constante. El nuevo paquete de Codex es el intento directo de OpenAI de cerrar esta brecha funcional. La empresa ha designado explícitamente una prioridad: hacer de Codex una herramienta que los desarrolladores eligen por defecto, en lugar de por hábito.
Expandir el agente al escritorio es un paso lógico para cualquier herramienta que pretenda ser un asistente de desarrollador completo. Un desarrollador rara vez trabaja solo en un editor de código: necesita ejecutar una prueba en un navegador, verificar el resultado visual en una herramienta de diseño, cambiar a la terminal, verificar registros, abrir documentación. Si el agente ve todo este contexto — no solo el contenido de archivos en el repositorio — puede tomar decisiones más informadas y ejecutar tareas con menos interrupciones del usuario.
Las actualizaciones también incluyen generación de imágenes integrada directamente en la interfaz de Codex y memoria a largo plazo: el agente recuerda los resultados de sesiones anteriores, contexto del proyecto y preferencias del equipo. Esto aborda uno de los principales puntos débiles al trabajar con agentes — la necesidad de explicar la arquitectura del proyecto, estilo de código y convenciones adoptadas cada vez nuevamente. La memoria no es solo una conveniencia: los agentes sin contexto tienden a repetir los mismos errores y pierden de vista la tarea al cambiar entre sesiones.
Codex como producto tiene una larga historia. La primera versión apareció en 2021 y se convirtió en la base técnica para GitHub Copilot — una herramienta que esencialmente creó el mercado de asistentes de IA para desarrolladores. OpenAI luego lo relanzó como una herramienta de agente independiente. La actualización actual añade una capa de control de computadora, previamente implementada en Operator — la empresa está consolidando tecnologías dispares en un único producto. Para los desarrolladores, esto significa un agente capaz de trabajar tanto con código como con GUI, y con memoria del proyecto.
Aún no está claro qué tan estable es la gestión de escritorio en condiciones reales y no triviales. OpenAI reconoce que algunas capacidades están en etapa temprana. Las demostraciones se ven convincentes, pero la verdadera prueba son escenarios complejos: depuración simultánea en varias ventanas, pruebas con verificación visual, trabajo con aplicaciones heredadas sin una API abierta.
La carrera por herramientas de agente para desarrollo ha alcanzado un nuevo nivel. Claude Code, Cursor, Devin, Windsurf — todos los principales actores están formando su respuesta a una pregunta: ¿quién es capaz de ejecutar una tarea de desarrollo de principio a fin con intervención humana mínima, sin romper lo que ya funciona? La respuesta se verá no en los anuncios, sino en la práctica en las próximas semanas.
¿Quieres dejar de leer sobre IA y empezar a usarla?
AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.