OpenAI integra tecnologías Sky en Codex para Mac y mejora la gestión de aplicaciones en segundo plano
OpenAI ha integrado tecnologías Sky en Codex para Mac y ha mejorado significativamente el modo de gestión de computadora. El agente ahora trabaja con…
Procesado por IA desde Habr AI; editado por Hamidun News
OpenAI ha convertido Codex para Mac de una herramienta de escritura de código en un operador de escritorio completo: el agente ahora puede gestionar aplicaciones en segundo plano, cambiar entre múltiples ventanas y realizar tareas rutinarias sin traerlas al primer plano ni requerir intervención constante del usuario.
La actualización clave está relacionada con la tecnología Sky — una startup de macOS que OpenAI adquirió oficialmente junto con el equipo de desarrolladores.
A nivel de producto, esto ya no parece un experimento secundario. Codex ahora tiene un modo integrado de control de computadora que permite al agente ver dónde hace clic, introducir texto, abrir aplicaciones y trabajar en múltiples ventanas a la vez.
Lo importante es que todo esto sucede en segundo plano: el usuario puede continuar su trabajo mientras el agente maneja simultáneamente tareas en otras aplicaciones.
Para el entorno Mac, donde muchos procesos aún se automatizan mal, este es un cambio notable.
Técnicamente, el nuevo enfoque es interesante porque Codex no depende únicamente de la grabación de pantalla e imitación de clics basados en imágenes. En su lugar, el sistema utiliza mecanismos de accesibilidad de macOS que le permiten leer la jerarquía de elementos de la interfaz — botones, campos de entrada, listas, pestañas y otros objetos dentro de una ventana.
Para el modelo de lenguaje, esto es mucho más rico que una simple captura de pantalla: no solo recibe una imagen, sino una descripción estructurada de la interfaz y puede entender con más precisión qué hay delante de él.
Como resultado, el agente encuentra más fácil seleccionar la acción correcta y depende menos de escenarios frágiles con coordenadas del cursor o scripts alternativos.
Por eso la nueva versión de Codex se ve más fuerte que muchas soluciones competidoras.
La mayoría de los sistemas de control de computadora hoy en día todavía se construyen sobre una combinación de capturas de pantalla, OCR y automatización básica a través de comandos del sistema. Este enfoque funciona mientras la interfaz es predecible, pero falla rápidamente en aplicaciones del mundo real.
Codex, según las primeras críticas, maneja mejor las tareas en las que necesita navegar por ventanas complejas, desplazarse por feeds largos, abrir elementos anidados y ejecutar secuencialmente cadenas de acciones.
Una ventaja adicional son los cursores paralelos: varios agentes pueden trabajar en el mismo Mac simultáneamente sin interferir entre sí ni robarse el foco.
El valor práctico de la actualización es evidente en escenarios cotidianos. Codex puede abrir una aplicación de música e iniciar el álbum correcto, incluso si el comando no está perfectamente formulado. Puede revisar múltiples aplicaciones de trabajo — por ejemplo, un mensajero, cliente RSS y lector — y luego compilar un breve resumen de ellos.
Puede instalar archivos, abrirlos, verificar el resultado y continuar la depuración sin cambiar manualmente entre ventanas.
Los humanos a menudo pueden hacer estas acciones más rápidamente, pero ese no es el punto principal: el agente asume el trabajo rutinario que puede ejecutarse en segundo plano, especialmente donde no hay API, comandos de consola o soporte completo de AppleScript.
Para OpenAI, este es también un movimiento estratégico. Codex se parece cada vez menos a un asistente de código ordinario y cada vez más a un centro de control de agentes.
Primero, la empresa lanzó la aplicación Codex para macOS el 2 de febrero de 2026, y el 16 de abril agregó una actualización importante con control de computadora en segundo plano, memoria, automaciones y nuevos complementos.
Según OpenAI, el servicio ya es utilizado por más de 3 millones de desarrolladores por semana, y la empresa está claramente tratando de expandir los casos de uso más allá del IDE: desde la escritura de código hasta la prueba de interfaz, trabajo con documentos, navegadores y aplicaciones de escritorio.
La conclusión principal es simple: OpenAI está apostando no solo por modelos más fuertes, sino por un control más profundo sobre el entorno del usuario.
Si Codex realmente mantiene su precisión y velocidad actual, el mercado de agentes de IA podría cambiar rápidamente de ventanas de chat a asistentes en segundo plano que pueden trabajar en aplicaciones reales tan confiadamente como trabajan con texto y código hoy.
¿Quieres dejar de leer sobre IA y empezar a usarla?
AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.