3DNews AI→ original

OpenAI présente GPT-5.4 mini et nano pour le code, les sous-agents et les charges de travail AI à grande échelle

OpenAI a lancé GPT-5.4 mini et nano, des versions compactes de son modèle phare pour les tâches où la vitesse et le coût sont déterminants. Mini est plus de…

Traité par IA depuis 3DNews AI ; édité par Hamidun News
OpenAI présente GPT-5.4 mini et nano pour le code, les sous-agents et les charges de travail AI à grande échelle
Source : 3DNews AI. Collage: Hamidun News.
◐ Écouter l'article

OpenAI a lancé GPT-5.4 mini et GPT-5.4 nano — deux versions compactes de sa gamme phare, conçues non pas pour un raisonnement record, mais pour des scénarios rapides et à grande échelle. L'entreprise mise sur des modèles qui sont moins chers, plus rapides et conservent néanmoins une part importante des capacités de la GPT-5.4 en taille complète.

Les points forts de mini

GPT-5.4 mini est l'aîné des deux nouveautés. Selon OpenAI, elle a montré des améliorations notables par rapport à GPT-5 mini en programmation, logique, utilisation d'outils et analyse multimodale, et s'est avérée plus de deux fois plus rapide.

Sur le benchmark SWE-Bench Pro, le modèle a obtenu 54,4% contre 45,7% pour GPT-5 mini, et en OSWorld-Verified, qui teste la capacité à travailler avec des interfaces via des captures d'écran, il a montré 72,1% contre 42,0% pour la version mini précédente. Cela importe non seulement pour les jolis graphiques. OpenAI positionne directement GPT-5.

4 mini comme un modèle de travail pour les tâches où la latence est perceptible pour l'utilisateur : autocomplétion et correction de code, cycles de débogage rapides, subagents pour les opérations auxiliaires, et systèmes qui lisent des captures d'écran et interagissent avec les interfaces. L'idée est simple : il ne faut pas envoyer chaque tâche au modèle le plus cher si une version plus petite peut la traiter presque aussi bien, mais significativement plus rapidement.

Où nano est utile

GPT-5.4 nano est le modèle le plus petit et le moins cher de la nouvelle gamme. OpenAI la recommande non pas comme un moteur de chat universel, mais comme un outil utilitaire pour des opérations simples mais fréquentes.

Ce sont des scénarios où le débit importe plus que la profondeur du raisonnement : analyse de flux de documents, classification, extraction de champs, classement des résultats et support pour des sous-tâches de code simples. Même nano a obtenu 52,4% sur SWE-Bench Pro, surpassant significativement GPT-5 mini. Ensemble, mini et nano s'intègrent bien dans une architecture où un modèle grand planifie le travail et plusieurs petits l'exécutent en parallèle.

Dans Codex, c'est exactement le scénario qu'OpenAI promeut : GPT-5.4 peut coordonner le processus, tandis que GPT-5.4 mini se charge de tâches spécifiques comme la recherche dans la base de code, la lecture de fichiers volumineux et le traitement de la documentation.

Cette approche divisée aide à garder sous contrôle à la fois la latence et le budget.

  • Assistants IA rapides pour écrire et éditer du code
  • Subagents pour la recherche de dépôts et l'analyse de fichiers volumineux
  • Outils qui comprennent les captures d'écran et gèrent les interfaces
  • Classification, extraction de données et classement dans les pipelines à grande échelle
  • Exécution plus économique des tâches auxiliaires sans compromettre la qualité globale du système

Accès et tarification

À partir du 17 mars 2026, GPT-5.4 mini est disponible immédiatement dans l'API, Codex et ChatGPT. Dans l'API, le modèle prend en charge le texte, les images, l'appel de fonction, la recherche sur le web, la recherche de fichiers, computer use et skills.

La fenêtre de contexte est de 400 000 tokens, et le prix est de 0,75 dollar par million de tokens d'entrée et 4,50 dollars par million de tokens de sortie. Pour les services ayant un grand nombre de requêtes parallèles, c'est l'un des principaux arguments de vente. Dans Codex, mini n'utilise que 30% du quota de GPT-5.

4 complète, elle peut donc être utilisée pour des sous-tâches parallèles bon marché. Dans ChatGPT, le modèle a un rôle plus limité : pour les utilisateurs Free et Go, il est disponible via le mode Thinking, et pour les autres, il sert de fallback quand la limite de GPT-5.4 Thinking est atteinte.

GPT-5.4 nano, quant à elle, n'est disponible que via l'API et coûte 0,20 dollar par million de tokens d'entrée et 1,25 dollar par million de tokens de sortie.

Ce que cela signifie

OpenAI construit de plus en plus une gamme non autour d'un modèle « meilleur », mais autour d'un ensemble de rôles : un grand modèle réfléchit et coordonne, les petits gèrent rapidement la routine. Pour les développeurs et les produits IA, c'est une bonne nouvelle : le coût des systèmes d'agents peut être réduit sans une baisse drastique de qualité, surtout là où la vitesse, le parallélisme et le haut volume de requêtes importent.

ZK
Hamidun News
Actualités IA sans bruit. Sélection éditoriale quotidienne de plus de 400 sources. Produit de Zhemal Khamidun, Head of AI chez Alpina Digital.

Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?

AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.

Qu'en pensez-vous ?
Chargement des commentaires…