OpenAI intègre les technologies Sky dans Codex pour Mac et améliore la gestion des applications en arrière-plan
OpenAI a intégré les technologies Sky dans Codex pour Mac et a considérablement amélioré le mode de gestion informatique. L'agent fonctionne désormais avec…
Traité par IA depuis Habr AI ; édité par Hamidun News
OpenAI a transformé Codex pour Mac d'un outil d'écriture de code en un opérateur de bureau à part entière : l'agent peut désormais gérer les applications en arrière-plan, basculer entre plusieurs fenêtres et exécuter des tâches routinières sans les mettre au premier plan et sans nécessiter une intervention constante de l'utilisateur.
La mise à jour clé est liée à la technologie Sky — une startup macOS qu'OpenAI a officiellement acquise avec l'équipe de développeurs.
Au niveau du produit, ce n'est plus une simple expérience. Codex dispose désormais d'un mode de contrôle d'ordinateur intégré qui permet à l'agent de voir où il clique, d'entrer du texte, d'ouvrir des applications et de travailler dans plusieurs fenêtres à la fois.
L'important est que tout cela se déroule en arrière-plan : l'utilisateur peut continuer son travail pendant que l'agent traite simultanément les tâches dans d'autres applications.
Pour l'environnement Mac, où beaucoup de processus sont encore mal automatisés, c'est un changement notable.
Techniquement, la nouvelle approche est intéressante car Codex ne repose pas uniquement sur l'enregistrement d'écran et l'imitation de clics basés sur des images. Au lieu de cela, le système utilise les mécanismes d'accessibilité de macOS qui lui permettent de lire la hiérarchie des éléments de l'interface — boutons, champs de saisie, listes, onglets et autres objets dans une fenêtre.
Pour le modèle de langage, c'est beaucoup plus riche qu'une simple capture d'écran : il reçoit non seulement une image, mais une description structurée de l'interface et peut mieux comprendre ce qui se trouve devant lui.
En conséquence, l'agent trouve plus facile de sélectionner l'action correcte et dépend moins de scénarios fragiles avec les coordonnées du curseur ou les scripts de contournement.
C'est pourquoi la nouvelle version de Codex semble plus forte que de nombreuses solutions concurrentes.
La plupart des systèmes de contrôle d'ordinateur d'aujourd'hui sont toujours construits sur une combinaison de captures d'écran, OCR et d'automatisation basique via des commandes système. Cette approche fonctionne tant que l'interface est prévisible, mais s'effondre rapidement dans les applications réelles.
Codex, selon les premiers commentaires, gère mieux les tâches où vous devez naviguer dans des fenêtres complexes, faire défiler des flux longs, ouvrir des éléments imbriqués et exécuter séquentiellement des chaînes d'actions.
Un avantage supplémentaire est les curseurs parallèles : plusieurs agents peuvent travailler sur le même Mac simultanément sans s'interférer et sans détourner le focus.
La valeur pratique de la mise à jour est évidente dans les scénarios quotidiens. Codex peut ouvrir une application musicale et lancer le bon album, même si la commande n'est pas parfaitement formulée. Il peut examiner plusieurs applications de travail — par exemple, un messager, un client RSS et un lecteur — puis en compiler un bref résumé.
Il peut installer des fichiers, les ouvrir, vérifier le résultat et continuer le débogage sans basculer manuellement entre les fenêtres.
Les humains peuvent souvent faire ces actions plus rapidement, mais ce n'est pas l'essentiel : l'agent prend en charge le travail de routine qui peut s'exécuter en arrière-plan, surtout là où il n'y a pas d'API, de commandes de console ou de support AppleScript complet.
Pour OpenAI, c'est aussi un mouvement stratégique. Codex ressemble de moins en moins à un assistant de code ordinaire et de plus en plus à un centre de contrôle d'agents.
D'abord, l'entreprise a lancé l'application Codex pour macOS le 2 février 2026, et le 16 avril a ajouté une mise à jour importante avec contrôle d'ordinateur en arrière-plan, mémoire, automations et nouveaux plugins.
Selon OpenAI, le service est déjà utilisé par plus de 3 millions de développeurs par semaine, et l'entreprise tente clairement d'élargir les cas d'usage au-delà de l'IDE : de l'écriture de code au test d'interface, au travail avec les documents, les navigateurs et les applications de bureau.
La conclusion principale est simple : OpenAI mise non seulement sur des modèles plus puissants, mais aussi sur un contrôle plus profond de l'environnement utilisateur.
Si Codex maintient vraiment sa précision et sa vitesse actuelles, le marché des agents IA pourrait rapidement passer des fenêtres de chat aux assistants de fond qui peuvent travailler dans les applications réelles aussi confiamment qu'ils ne le font avec le texte et le code aujourd'hui.
Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?
AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.