OpenAI a mis à jour Codex : gestion du bureau, génération d'images et mémoire des tâches
OpenAI a publié un grand ensemble de mises à jour pour son système de développement d'agents Codex. Il peut désormais gérer les applications sur le bureau…
Traité par IA depuis The Verge ; édité par Hamidun News
OpenAI a mis à jour Codex — un système d'agent pour l'automatisation du développement — en ajoutant la capacité de gérer les applications de bureau, générer des images et conserver la mémoire des tâches passées. Le paquet de mise à jour a été lancé au milieu de l'intensification de la concurrence avec Anthropic et est directement positionné comme une réponse à la domination croissante de Claude Code. Avant cette mise à jour, Codex fonctionnait principalement dans un environnement de navigateur et exécutait des tâches dans des conteneurs isolés — sans accès direct à ce qui se passait sur l'écran de l'utilisateur.
Maintenant, le système a obtenu un accès complet au bureau de macOS : l'agent peut ouvrir, gérer et interagir avec n'importe quelle application installée — de Xcode à Figma, de Slack au terminal natif. Un point clé : Codex fonctionne en arrière-plan et ne prend pas le contrôle de l'interface pendant que l'utilisateur est occupé par une autre tâche. Plusieurs agents peuvent agir en parallèle et indépendamment, chacun résolvant sa propre sous-tâche.
Le contexte de cette mise à jour est important. Selon The Verge, OpenAI a redistribué des ressources importantes spécifiquement pour concurrencer Claude Code d'Anthropic. Ce dernier a acquis une popularité exceptionnelle parmi les développeurs professionnels — grâce à l'exécution précise d'instructions de terminal complexes, à la compréhension profonde de l'architecture des grandes bases de code et à la capacité de mener des travaux sur des projets réels sans supervision manuelle constante. Le nouveau paquet Codex est la tentative directe d'OpenAI de combler cet écart fonctionnel. L'entreprise a explicitement désigné une priorité : faire de Codex un outil que les développeurs choisissent par défaut, plutôt que par habitude.
Étendre l'agent au bureau est une étape logique pour tout outil prétendant au rôle d'assistant développeur complet. Un développeur travaille rarement uniquement dans un éditeur de code : vous devez exécuter un test dans un navigateur, vérifier le résultat visuel dans un outil de conception, basculer vers le terminal, vérifier les journaux, ouvrir la documentation. Si l'agent voit tout ce contexte — pas seulement le contenu des fichiers du référentiel — il peut prendre des décisions plus éclairées et exécuter des tâches avec moins d'interruptions de l'utilisateur.
Les mises à jour incluent également la génération d'images intégrée directement dans l'interface de Codex et la mémoire à long terme : l'agent se souvient des résultats des sessions précédentes, du contexte du projet et des préférences de l'équipe. Cela résout l'un des principaux points douloureux lorsque vous travaillez avec des agents — le besoin d'expliquer l'architecture du projet, le style de code et les conventions adoptées chaque fois à nouveau. La mémoire n'est pas qu'une commodité : les agents sans contexte ont tendance à répéter les mêmes erreurs et à perdre de vue la tâche lors du passage entre les sessions.
Codex en tant que produit a une longue histoire. La première version est apparue en 2021 et est devenue la base technique de GitHub Copilot — un outil qui a essentiellement créé le marché des assistants IA pour les développeurs. OpenAI l'a ensuite relancé en tant qu'outil d'agent autonome. La mise à jour actuelle ajoute une couche de contrôle informatique, précédemment implémentée dans Operator — l'entreprise consolide des technologies disparates en un seul produit. Pour les développeurs, cela signifie un agent capable de travailler à la fois avec du code et une GUI, et avec une mémoire du projet.
Il n'est toujours pas clair à quel point la gestion du bureau fonctionne bien dans des conditions réelles et non triviales. OpenAI reconnaît que certaines capacités en sont à un stade précoce. Les démonstrations semblent convaincantes, mais le vrai test ce sont des scénarios complexes : débogage simultané sur plusieurs fenêtres, test avec vérification visuelle, travail avec des applications héritées sans API ouverte.
La course aux outils d'agent pour le développement a atteint un nouveau niveau. Claude Code, Cursor, Devin, Windsurf — tous les principaux acteurs façonnent leur réponse à une seule question : qui est capable d'exécuter une tâche de développement du début à la fin avec une intervention humaine minimale, sans casser ce qui fonctionne déjà ? La réponse sera visible non pas dans les annonces, mais dans la pratique dans les semaines à venir.
Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?
AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.