36Kr (36氪)→ original

OpenAI a présenté son premier modèle AI basé sur des puces Cerebras

OpenAI a officiellement présenté GPT-5.3-Codex-Spark, son premier modèle fonctionnant sur du matériel de la startup Cerebras Systems. Cette nouveauté est une…

Traité par IA depuis 36Kr (36氪) ; édité par Hamidun News
OpenAI a présenté son premier modèle AI basé sur des puces Cerebras
Source : 36Kr (36氪). Collage: Hamidun News.
◐ Écouter l'article

OpenAI a fait un mouvement stratégique vers l'indépendance technologique : l'entreprise a présenté GPT-5.3-Codex-Spark — le premier modèle d'intelligence artificielle développé spécifiquement pour fonctionner sur les puces Cerebras Systems. Ce n'est pas simplement un nouveau produit, mais une démonstration qu'OpenAI est prête à diversifier ses partenariats matériels et à réduire sa dépendance envers Nvidia, qui domine le marché des accélérateurs d'IA.

Codex-Spark est positionné comme une version optimisée du bien connu outil Codex pour l'automatisation de l'écriture de code — d'un côté, plus facile à utiliser, de l'autre, nettement plus rapide dans l'exécution des tâches. Le lancement du modèle coïncide avec une intensification de la concurrence dans le segment des assistants d'IA pour développeurs, où OpenAI affronte Google Gemini et Claude d'Anthropic.

Le contexte de cette décision réside dans les contraintes systémiques croissantes qu'OpenAI a rencontrées. L'entreprise achète globalement des GPUs Nvidia, mais cela crée une vulnérabilité : à tout moment, les approvisionnements peuvent être restreints, les prix peuvent augmenter, et Nvidia peut imposer ses propres conditions. Cerebras Systems propose une alternative avec sa propre architecture WSE (Wafer Scale Engine) — une puce conçue différemment et offrant un équilibre différent entre débit et efficacité énergétique. Pour OpenAI, c'est une nécessité stratégique : diversifier les sources de performance signifie une position de marché plus résiliente et une vulnérabilité réduite aux facteurs externes.

GPT-5.3-Codex-Spark n'est pas entièrement un nouveau modèle, mais une version optimisée de Codex, spécifiquement adaptée aux caractéristiques des puces Cerebras. C'est une solution technique importante : différentes architectures nécessitent différentes approches pour la distribution de la mémoire, la parallélisation du calcul et la mise en cache des données.

Les ingénieurs d'OpenAI ont repensé la structure du modèle pour qu'il utilise de manière maximale et efficace la topologie spécifique de Cerebras. Le résultat est une augmentation notable de la vitesse sans perte de précision dans la génération de code. Pour les développeurs, cela signifie une boucle de rétroaction plus rapide : les demandes d'autocomplétion de code s'exécuteront avec une latence minimale, ce qui est critique pour l'écosystème IDE et le développement continu.

La taille et le poids du modèle ont également joué un rôle dans cette optimisation. Codex-Spark est positionné comme une version « légère », ce qui permet un chargement plus rapide du modèle en mémoire et réduit les exigences de bande passante du réseau. Dans un monde où chaque milliseconde de latence affecte l'expérience utilisateur, cela a de l'importance. Particulièrement dans le contexte de la concurrence : Google Gemini et Claude offrent déjà des outils intégrés pour la manipulation de code, mais les développeurs critiquent souvent leur vitesse. Codex-Spark peut capturer une partie de ce public s'il est réellement plus rapide tout en maintenant une haute précision dans les suggestions.

Ce mouvement reflète une tendance plus large de l'industrie : le monopole de GPU de Nvidia est instable et tous les grands acteurs commencent à chercher des alternatives. Apple a développé son propre Neural Engine, Google a investi dans TPU, Amazon a créé Trainium et Inferentia. OpenAI, étant un développeur de modèles plutôt qu'un fabricant de puces, a choisi un chemin différent : le partenariat avec Cerebras lui permet de rester flexible et de ne pas être liée à un seul fournisseur.

Le lancement de Codex-Spark marque le début d'une nouvelle phase de la stratégie d'OpenAI — non seulement créer les meilleurs modèles, mais aussi assurer qu'ils fonctionnent sur du matériel diversifié. Cela complique la vie des concurrents qui dépendent toujours du matériel standard et renforce la position d'OpenAI sur le marché des outils d'IA pour développeurs. La question maintenant est de savoir comment cette stratégie fonctionnera efficacement en pratique et si Cerebras peut adapter ses puces assez rapidement pour répondre à la demande croissante.

ZK
Hamidun News
Actualités IA sans bruit. Sélection éditoriale quotidienne de plus de 400 sources. Produit de Zhemal Khamidun, Head of AI chez Alpina Digital.

Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?

AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.

Qu'en pensez-vous ?
Chargement des commentaires…