ZDNet AI→ original

OpenAI a Lancé GPT-5.4 Mini et Nano — Qualité Quasi-Flagship à Moindre Coût

OpenAI a lancé GPT-5.4 mini et nano — des versions légères de la famille GPT-5.4 pour les tâches rapides et massives. Mini est presque comparable au modèle…

Traité par IA depuis ZDNet AI ; édité par Hamidun News
OpenAI a Lancé GPT-5.4 Mini et Nano — Qualité Quasi-Flagship à Moindre Coût
Source : ZDNet AI. Collage: Hamidun News.
◐ Écouter l'article

Le 17 mars 2026, OpenAI a présenté GPT-5.4 mini et GPT-5.4 nano — deux versions compactes de la famille GPT-5.4 pour les tâches où la vitesse, le coût et la capacité à exécuter des modèles à grande échelle sont cruciaux. L'intérêt principal est que la mini s'est rapprochée de manière surprenante de la GPT-5.4 complète sur plusieurs benchmarks clés, beaucoup plus que ce que l'on attend généralement d'un modèle « léger ».

Quasi Flagship

La GPT-5.4 mini n'est pas positionnée comme un compromis réduit, mais comme un modèle fonctionnel pour les produits réels. Selon OpenAI, sur SWE-Bench Pro elle a obtenu 54,4% contre 57,7% pour la GPT-5.4 complète, et sur OSWorld-Verified — 72,1% contre 75,0%. L'écart existe, mais il ne ressemble plus à un abîme. De plus, la mini fonctionne plus que deux fois plus vite que la génération précédente GPT-5 mini, ce qui pour les scénarios orientés utilisateur est souvent plus important que quelques points de pourcentage supplémentaires sur un benchmark.

La GPT-5.4 nano cadette va encore plus loin en matière d'efficacité. OpenAI l'appelle la version la plus petite et la moins chère de GPT-5.4 et la recommande pour la classification, l'extraction de données, le classement et les sous-agents de code simples. Ce n'est pas un modèle pour tout, mais plutôt un bloc de construction pour les grands systèmes où un agent puissant planifie le travail tandis qu'un ensemble de petits modèles rapides gère les tâches routinières. Cette approche sort de plus en plus des laboratoires pour entrer dans les services appliqués.

Où Cela Sera Utile

L'intérêt de cette version dépasse les nouveaux noms — il reflète un changement de focus : de plus en plus, les produits d'IA cherchent non pas la qualité maximale de réponse, mais l'équilibre entre qualité, latence et coût de chaque requête. Si un modèle répond rapidement, utilise bien les outils et ne casse pas sur les tâches multimodales, il procure souvent plus de valeur commerciale qu'un flagship lourd qui prend plus de temps pour réfléchir et coûte plus cher par requête. Pour les services ayant un grand nombre de requêtes, cela se traduit immédiatement par l'économie du produit et la rétention d'utilisateurs.

  • Assistants IA pour le code avec corrections et débogage rapides
  • Sous-agents qui recherchent en parallèle dans les bases de code et la documentation
  • Systèmes de computer use qui lisent les captures d'écran et les interfaces
  • Applications multimodales travaillant avec le texte et les images en temps réel
  • Tâches massives en arrière-plan comme la classification et l'extraction de champs

OpenAI souligne séparément les scénarios avec plusieurs modèles de différentes classes. Dans ce schéma, un grand modèle se charge de la planification, de la coordination et de la vérification finale, tandis que mini ou nano exécutent des sous-tâches étroites en parallèle. Pour les développeurs, cela signifie une orchestration moins chère sans perte complète de qualité. Pour l'utilisateur final — des produits plus réactifs où l'IA ne semble plus lente et lourde. Et cela compte plus que n'importe quel saut unique dans les benchmarks bruts.

Prix et Disponibilité

La GPT-5.4 mini a une gamme d'applications assez large. Le modèle est disponible en API, Codex et ChatGPT, supporte les entrées texte et visuelles, tool use, function calling, recherche web, recherche de fichiers, computer use et skills. Fenêtre de contexte — 400 000 tokens. Prix — $0,75 par million de tokens d'entrée et $4,50 par million de tokens de sortie. Dans Codex, la mini n'utilise que 30% du quota de GPT-5.4, elle peut donc être utilisée pour des tâches auxiliaires moins chères et des sous-agents en parallèle.

GPT-5.4 nano n'est disponible que via API et coûte encore moins : $0,20 par million de tokens d'entrée et $1,25 par million de tokens de sortie. Dans ChatGPT, la mini est déjà disponible pour les utilisateurs Free et Go via le mode Thinking, et pour les autres elle peut être utilisée comme fallback pour GPT-5.4 Thinking. En pratique, cela divise la gamme très clairement : la mini devient le modèle de travail de masse pour les produits quotidiens, et la nano — un moteur utilitaire pour les opérations simples, fréquentes et bon marché en backend.

Ce Que Cela Signifie

Le lancement de GPT-5.4 mini et nano montre que la course des modèles entre dans une nouvelle phase : les gagnants seront non seulement les plus puissants, mais aussi ceux qui livrent des résultats quasi flagship à faible coût et latence minimale. Pour le marché, cela signale que la prochaine vague de produits d'IA sera construite non autour d'un modèle « le plus intelligent », mais autour de combinaisons de modèles grands et petits. Ce sont ces combinaisons, et non les super-modèles isolés, qui définiront le prochain cycle de l'IA appliquée.

ZK
Hamidun News
Actualités IA sans bruit. Sélection éditoriale quotidienne de plus de 400 sources. Produit de Zhemal Khamidun, Head of AI chez Alpina Digital.

Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?

AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.

Qu'en pensez-vous ?
Chargement des commentaires…