OpenAI lance GPT-5.5 : modèle d'agent plus puissant que GPT-5.4, mais le prix de l'API a doublé
OpenAI a lancé GPT-5.5 et mise sur des scénarios d'agents : le modèle planifie les étapes de façon autonome, utilise des outils et maintient mieux le…
Traité par IA depuis AI News ; édité par Hamidun News
OpenAI le 23 avril a présenté GPT-5.5 et a positionné la sortie non pas comme une mise à jour ordinaire de modèle, mais comme la base pour les agents d'IA opérationnels. L'entreprise affirme que la nouvelle version planifie mieux, utilise les outils et achève les tâches complexes en plusieurs étapes sans sollicitations constantes des humains.
Sur Quoi Elle Mise
L'idée principale de la sortie est que GPT-5.5 doit fonctionner non pas comme un chatbot pour les réponses isolées, mais comme un exécuteur de tâches longues sur l'ordinateur. Selon la description d'OpenAI, le modèle est plus fort en programmation d'agents, travail avec les interfaces, analyse de données, préparation de documents et tâches de recherche.
Au lieu d'un scénario où les utilisateurs décrivent manuellement chaque étape, on propose aux entreprises de confier au modèle des tâches « sales » multi-parties et de le laisser construire le plan lui-même, vérifier les résultats intermédiaires et progresser vers la réponse finale. OpenAI insiste particulièrement sur le fait que la croissance des capacités n'a pas ralenti le modèle en production. GPT-5.
5, selon l'entreprise, maintient la latence par token de GPT-5.4 mais consomme moins de tokens pour les mêmes tâches dans Codex. Le modèle a également été développé et déployé aux côtés des systèmes NVIDIA GB200 et GB300 NVL72, ce qui montre que les sorties de modèles de frontier sont désormais liées non seulement aux algorithmes mais aussi à l'infrastructure.
« C'est un vrai pas en avant vers le type d'informatique que nous attendons dans le futur », a déclaré
Greg Brockman.
Où la Croissance est Visible
L'argument le plus fort d'OpenAI est les benchmarks liés non pas à des questions académiques mais au travail pratique d'agents. GPT-5.5 a montré des gains notables là où les modèles doivent non seulement répondre mais planifier une séquence d'actions, invoquer des outils, maintenir un contexte long et accomplir une tâche. Parallèlement, la sortie ne ressemble pas à une victoire inconditionnelle dans toutes les catégories : dans certaines évaluations externes, les concurrents maintiennent des positions fortes, en particulier là où l'orchestration des outils via MCP est importante.
- Terminal-Bench 2.0 : 82,7% contre 75,1% pour GPT-5.4 et 69,4% pour Claude Opus 4.7.
- SWE-Bench Pro : 58,6% pour résoudre les vrais problèmes GitHub en une seule tentative.
- MRCR v2 sur 1 million de tokens : 74,0% contre 36,6% pour GPT-5.4, presque un doublement dans le contexte long.
- BrowseComp en version Pro : 90,1%, mais dans MCP Atlas la tête reste avec Claude Opus 4.7, et GPT-5.5 n'avait pas de résultat publié là.
Prix et Accès
La partie la plus controversée de la sortie est l'économie. Pour l'API, OpenAI a fixé le prix à 5 dollars par million de tokens d'entrée et 30 dollars par million de tokens de sortie, tandis que les tarifs de GPT-5.4 étaient la moitié : 2,50 et 15 dollars respectivement.
GPT-5.5 Pro est encore plus cher—30 dollars pour l'entrée et 180 pour la sortie. OpenAI objecte que comparer seulement le prix par token n'est plus suffisant : le modèle résout les mêmes tâches avec moins de tokens, donc le coût réel d'un scénario de travail, selon l'entreprise, augmente non pas le double mais environ 20%.
L'accès à GPT-5.5 a d'abord été dirigé vers ChatGPT et Codex pour les tarifs payants Plus, Pro, Business et Enterprise, l'accès API suivant le 24 avril. Au sein même d'OpenAI, la sortie est présentée comme déjà un outil opérationnel : l'entreprise dit que Codex est utilisé hebdomadairement par plus de 85% des employés.
Les exemples incluent le traitement de six mois de demandes de discours publics, l'analyse de 24 771 formulaires fiscaux K-1 totalisant 71 637 pages, et l'automatisation des rapports commerciaux hebdomadaires, économisant 5–10 heures par semaine aux employés.
Ce Que Cela Signifie
GPT-5.5 montre où le marché se dirige : les modèles sont maintenant vendus non pas comme « un autre chat intelligent » mais comme une couche pour le travail numérique autonome. Pour les affaires, la question n'est plus seulement quel modèle est plus intelligent, mais combien coûte une tâche achevée, en tenant compte des tentatives, des vérifications et de l'intégration avec les outils. C'est le domaine où OpenAI entend justifier son prix plus élevé.
Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?
AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.