OpenAI a présenté un modèle ultrarapide de codage pour contourner les puces Nvidia
OpenAI a annoncé GPT-5.3-Codex-Spark, un modèle de langage spécialisé dans l'écriture de code qui affiche un gain de performance multiplié par 15. La…
Traité par IA depuis Ars Technica ; édité par Hamidun News
OpenAI a présenté GPT-5.3-Codex-Spark — un modèle spécialisé pour la génération de code qui fonctionne 15 fois plus rapidement que la version précédente. Mais la vraie nouvelle ne porte pas tant sur la vitesse que sur la façon dont OpenAI l'a réalisée : l'entreprise a optimisé l'architecture pour des puces non standard de la taille d'une assiette, contournant effectivement la dépendance critique vis-à-vis des rares processeurs graphiques Nvidia. Cette démarche démontre le désir d'OpenAI de contrôler toute la pile — du logiciel au matériel physique — et met simultanément en évidence la concurrence croissante sur le marché des processeurs d'IA spécialisés.
Au cours des deux dernières années, Nvidia est devenue un goulot d'étranglement pour toutes les grandes entreprises d'IA. Les GPU H100 et A100, devenus la norme pour l'entraînement des grands modèles de langage, sont en énorme demande, mais l'offre est insuffisante. Les prix sont élevés, les livraisons sont retardées, et les restrictions géopolitiques compliquent encore les choses.
OpenAI, Meta, Google — tous cherchent des moyens de réduire la dépendance vis-à-vis de Nvidia ou d'optimiser l'utilisation des ressources disponibles. L'entreprise x.AI d'Elon Musk a récemment annoncé sa propre puce, Apple fait la même chose avec son Neural Engine, et Amazon investit dans les processeurs Trainium et Inferentia.
Le marché se fragmente, et OpenAI a décidé de ne pas rester en arrière.
GPT-5.3-Codex-Spark est un développement ciblé. Si les modèles universels comme GPT-4o doivent gérer plusieurs tâches, alors Codex est concentré sur une seule : écrire du code aussi rapidement et précisément que possible.
Cela a permis aux ingénieurs d'OpenAI d'effectuer une optimisation importante. L'architecture a été retravaillée pour les spécificités du codage, les couches de calcul inutiles ont été supprimées, les opérations tensorielles ont été restructurées. Le résultat est la même sortie de qualité avec des coûts de calcul minimaux.
Mais le changement principal concerne la couche matérielle. OpenAI a développé ou repensé des puces non standard qui fonctionnent nativement avec cette architecture. Ces processeurs sont plus compacts que les GPU standard, s'intègrent plus facilement, consomment moins d'énergie et de refroidissement — tout ce qui rend les centres de données moins chers et plus résilients aux défaillances.
L'augmentation de performance de 15 fois est impressionnante, mais le chiffre nécessite du contexte. Il ne signifie probablement pas que le modèle effectue les calculs directs 15 fois plus rapidement. Il s'agit du temps end-to-end de génération de code — de la demande de l'utilisateur au résultat final. Ici, les améliorations s'accumulent : architecture optimisée, puces spécialisées, pipeline de traitement retravaillé. C'est une approche typique pour l'industrie de l'IA : l'algorithme le plus efficace sur le matériel le plus efficace donne le résultat maximal.
Pour l'industrie, cela signifie plusieurs choses à la fois. Premièrement, la pression sur Nvidia s'intensifie. Si d'autres entreprises commencent à utiliser avec succès leurs propres puces, la demande de GPU pourrait diminuer. Deuxièmement, cela renforce la tendance vers l'intégration verticale dans les laboratoires d'IA. Apple, Google, Meta et maintenant OpenAI — tous développent leurs propres puces. Troisièmement, pour les développeurs, c'est une bonne nouvelle : un générateur de code plus rapide et moins cher pourrait réduire le coût d'utilisation des API et rendre les assistants d'IA plus accessibles.
Mais OpenAI ne se libérera pas complètement de Nvidia. Les modèles universels nécessitent toujours des GPU puissants lors de l'entraînement. Les propres puces d'OpenAI semblent être optimisées spécifiquement pour l'inférence — l'exécution de modèles déjà entraînés. Cela a du sens : l'entraînement se produit rarement, mais les demandes des utilisateurs arrivent constamment. OpenAI a trouvé un moyen de contrôler la couche où elle peut tirer profit de l'échelle. Et c'est le bon mouvement stratégique.
Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?
AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.