OpenAI lance GPT-5.4 : pari sur les agents informatiques, pas seulement sur le code

Le 5 mars 2026, OpenAI a lancé GPT-5.4, son modèle phare avec contrôle natif de l’ordinateur, tool search et mode xhigh pour les tâches complexes. Le changement le plus notable est le passage d’un modèle simplement solide à un agent AI fonctionnel. Sur les benchmarks, le modèle progresse fortement dans les scénarios agentiques et la navigation web, mais les tests appliqués montrent un tableau mitigé : backend et logique solides, tandis que la mise en page visuelle reste défaillante dans les détails.

Khamidun Zhemal

Veille IA · Habr AI

30 avr. 2026· 3 min

Traité par IA depuis Habr AI ; édité par Hamidun News

OpenAI lance GPT-5.4 : pari sur les agents informatiques, pas seulement sur le code — Source : Habr AI. Collage: Hamidun News.

◐ Écouter l'article

OpenAI a lancé GPT-5.4 le 5 mars 2026 — un nouveau vaisseau amiral qui combine un codage puissant, un raisonnement et un contrôle natif de l'ordinateur. L'accent principal de la version s'est déplacé d'un « chatbot intelligent » vers un agent IA qui non seulement répond aux questions, mais peut également exécuter des chaînes d'actions dans les interfaces et les outils de travail.

Pari sur les Agents

La principale nouveauté de GPT-5.4 est le Computer Use intégré. Le modèle peut travailler à partir de captures d'écran, gérer le curseur, cliquer sur des boutons, remplir des formulaires et vérifier les résultats.

Pour les développeurs, cela signifie une transition plus mature de la simple génération de texte aux scénarios d'agents : les bots peuvent naviguer sur les sites Web, exécuter des étapes du navigateur et effectuer des opérations routinières sans un script codifié pour chaque clic. Ce n'est plus une fonctionnalité pour les vidéos de démonstration, mais une couche fondamentale pour les processus commerciaux réels où un agent doit voir l'interface et confirmer qu'une action a réellement fonctionné. Selon les données officielles d'OpenAI, l'amélioration est particulièrement notable là où le modèle doit agir de manière autonome plutôt que de simplement écrire du code dans le vide.

Sur OSWorld-Verified, GPT-5.4 a atteint 75,0% par rapport à 47,3% pour GPT-5.2, et sur BrowseComp — 82,7% par rapport à 65,8%.

Pendant ce temps, l'amélioration dans SWE-Bench Pro a été plus modeste : 57,7% par rapport à 55,6%. C'est un bon signal pour ceux qui construisent des assistants et des agents de flux de travail, et plus réservé pour ceux qui attendaient une percée inconditionnelle en programmation.

Contrôle natif de l'ordinateur via des captures d'écran et des actions d'interface
Tool Search pour les grands ensembles d'outils sans gonfler le prompt
Mode de raisonnement `xhigh` pour les tâches lourdes
Jusqu'à 1 million de tokens de contexte dans Codex avec support expérimental
Taux d'erreurs factuelles plus faible par rapport à GPT-5.2

Ce Que les Tests Ont Montré

En pratique, le tableau n'était pas aussi uniforme que dans les benchmarks de présentation. Dans un test visuel, le modèle a été invité à construire un tableau de bord de maison intelligente complexe, puis à rendre lui-même le résultat et à corriger les erreurs après auto-vérification. La composition générale et le style étaient reconnaissables, mais les détails laissaient à désirer : le texte chevauchait les blocs, les marges s'écartaient, certains éléments étaient coupés, et le thermostat néomorphe annoncé s'avérait être un simple cercle.

C'est-à-dire que le modèle saisit déjà la sensation d'une « interface haut de gamme », mais il est encore loin d'être un développeur frontend sénior autonome. Cependant, dans le scénario backend, GPT-5.4 semblait plus convaincant.

Sur une tâche concernant un limiteur de débit prêt pour la production pour FastAPI et Redis, le modèle ne s'est pas limité à une solution basique, mais a construit un schéma complet avec un typage strict, un script Lua pour l'atomicité et un fallback local en cas de panne de Redis. Dans un test logique avec des conditions d'horaire conflictuelles, il a également fonctionné correctement : il n'a pas inventé une réponse « de quelque manière », mais a prouvé de manière cohérente qu'aucune solution n'existe. C'est un marqueur important de maturité : le modèle reconnaît plus souvent les contradictions au lieu d'halluciner avec confiance.

Prix et Disponibilité

OpenAI a lancé GPT-5.4 le 5 mars 2026 directement dans l'API, Codex et ChatGPT en tant que GPT-5.4 Thinking.

À partir du lancement, le modèle a commencé à remplacer GPT-5.2 Thinking pour les utilisateurs payants de ChatGPT Plus, Team et Pro, tandis que GPT-5.4 Pro est devenu disponible aux niveaux Pro et Enterprise.

Pour les développeurs, c'est peut-être une nouvelle tout aussi importante que les benchmarks eux-mêmes : le nouveau vaisseau amiral n'est pas resté une démo de laboratoire, mais s'est immédiatement intégré aux produits de production. La tarification de l'API semble plus agressive que ce qu'on aurait pu attendre du vaisseau amiral d'OpenAI : 2,50 $ par million de tokens d'entrée, 0,25 $ pour l'entrée en cache et 15 $ par million de tokens de sortie. Oui, le modèle est plus cher que GPT-5.

2 par token, mais OpenAI mise sur une meilleure efficacité des tokens : si un agent résout une tâche en moins d'étapes et ne vagabonde pas autant dans le contexte, l'économie globale pourrait être tout à fait raisonnable même pour les petites équipes.

Ce Que Cela Signifie

GPT-5.4 ne ressemble pas à un « remplacement magique du développeur », mais cela montre clairement où se dirige le marché. La prochaine compétition ne porte pas seulement sur la qualité des réponses, mais sur la capacité du modèle à voir les interfaces, utiliser les outils, retenir un contexte long et mener les tâches à terme. Pour les entreprises, cela signifie une simple chose : la valeur se déplace des prompts uniques vers les agents qui peuvent travailler dans le cadre de processus réels. C'est dans de tels scénarios que la question de savoir quelle plateforme convient le mieux au travail réel — plutôt qu'aux démos spectaculaires ponctuelles — sera maintenant décidée.

Hamidun News

Actualités IA sans bruit. Sélection éditoriale quotidienne de plus de 50 sources. Produit de Zhemal Khamidun, Head of AI chez Alpina Digital.

Canal Telegram RSS hamidun.com

Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?

AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.

🎓 Academy — 7 jours gratuits Consultation gratuite