Nvidia veut couvrir toute la stack du data center AI — des puces au réseau et au stockage

Q: Quelle est la source ?

Publication originale sur ZDNet AI. Hamidun News traite et adapte les contenus avec l'IA.

Q: Quand a-t-il été publié ?

30 avr. 2026. Temps de lecture : 3 min.

À GTC 2026, Nvidia a présenté un nouveau pari : vendre non seulement des GPU, mais tout le data center AI pour les charges de travail AI d'entreprise. La…

Rédaction de Hamidun News

Veille IA · ZDNet AI

30 avr. 2026· 3 min

Traité par IA depuis ZDNet AI ; édité par Hamidun News

Nvidia veut couvrir toute la stack du data center AI — des puces au réseau et au stockage — Source : ZDNet AI. Collage: Hamidun News.

◐ Écouter l'article

Nvidia au GTC 2026 a montré qu'elle ne veut plus être simplement un fournisseur de GPU. L'entreprise offre aux clients un centre de données IA entier comme un seul produit — du calcul et des réseaux au stockage de contexte et au logiciel de gestion.

Parier sur la Verticale

Le principal signal de la présentation de Jensen Huang n'était pas à propos d'une nouvelle puce, mais d'une architecture commerciale. Nvidia a construit une gamme de racks sur scène et a essentiellement dit au marché: l'infrastructure IA sera moins chère, plus rapide et plus rentable si vous achetez non pas des composants individuels, mais l'ensemble de la stack d'un seul fournisseur. Ce n'est plus le modèle « nous vendons des accélérateurs et vous assemblez le reste », mais une tentative de transformer un centre de données en un système entièrement conçu par Nvidia.

Huang promeut depuis longtemps l'idée d'une usine IA — une usine qui produit des tokens et de l'intelligence tout comme une usine produit des pièces. Maintenant, cette idée est devenue encore plus radicale: Nvidia veut contrôler non seulement le calcul, mais aussi le réseau, la mémoire, le stockage des données intermédiaires, la couche CPU et le logiciel qui relie tout cela. Sur fond de boom des systèmes d'agents, une telle approche a du sens logique: le goulot d'étranglement n'est plus seulement les GPU, mais tout ce qui déplace les données entre eux.

Ce qui a Été Intégré dans la Stack

Dans la nouvelle configuration, Nvidia a assemblé plusieurs racks, chacun résolvant un problème séparé dans un centre de données IA. Ensemble, ils forment presque un kit complet pour les entreprises qui construisent de grands clusters pour l'entraînement et l'inférence et ne veulent pas avoir affaire à des dizaines de fournisseurs disparates dans un seul schéma.

Vera Rubin NVL72 — système rack-scale phare avec 72 GPUs Rubin et 36 CPUs Vera.
Vera CPU Rack — rack séparé avec 256 CPUs pour les tâches IA d'agents, où l'appel d'outils, SQL et l'exécution de code importent.
BlueField-4 STX — couche de stockage et livraison rapide du KV-cache, dont les grands modèles de langage ont besoin lors de l'inférence.
Spectrum-6 SPX — nouveau réseau Ethernet pour connecter les racks et mettre à l'échelle les clusters.
Groq 3 LPX — rack d'inférence avec 256 accélérateurs LPU axé sur la faible latence et le grand contexte.

L'objectif de cet assemblage est que Nvidia ne vend plus seulement de la « puissance brute » sous forme de GPUs. Elle couvre ces parties du système où les millisecondes, les watts et l'argent sont habituellement perdus: le déplacement de données entre les puces, le travail avec le contexte, la latence réseau, les tâches CPU pour les agents et l'équilibrage global de la charge. Plus le modèle est grand et plus son contexte est important, plus ces frais généraux deviennent visibles.

Où Nvidia Voit l'Avantage

L'argument le plus évident de Nvidia est l'économie de l'inférence. L'entreprise affirme que la combinaison de Vera Rubin et Groq 3 LPX réduit les accès à la DRAM externe en raison du grand volume de SRAM dans le LPU, réduisant ainsi la latence et accélérant la livraison de tokens. Selon Nvidia, un tel schéma peut fournir jusqu'à 35 fois plus de débit par mégawatt pour les modèles avec des billions de paramètres, et jusqu'à 10 fois plus de revenus par watt dans les scénarios avec des tokens « premium » coûteux.

«

Ce qui prenait autrefois un jour entier de requêtes sera désormais fait en moins d'une heure. »

Un pari particulier a été fait sur la couche CPU. Nvidia affirme directement que même à l'ère des GPU, les agents se heurtent constamment à des tâches informatiques ordinaires: appel d'outils, requêtes SQL, compilation de code et exécution de code en sandbox. C'est pourquoi l'entreprise met ses propres CPUs Vera au centre et ajoute des DPUs et un stockage de contexte spécialisé à proximité. Cela étend les ambitions de Nvidia bien au-delà des accélérateurs et montre que l'entreprise veut capturer une part encore plus importante de la marge dans l'infrastructure IA.

Ce que Cela Signifie

Pour le marché, c'est une autre étape vers des centres de données IA intégrés verticalement, où un seul fournisseur est responsable de presque tout. Pour les clients, un tel modèle peut offrir un déploiement plus simple et une meilleure efficacité, mais au prix d'une dépendance plus forte à Nvidia. Pour les concurrents — des acteurs CPU et réseau aux fournisseurs de systèmes de stockage — c'est un signal que Nvidia ne joue plus uniquement sur le terrain des GPU.

Hamidun News

Actualités IA sans bruit. Sélection éditoriale quotidienne de plus de 400 sources. Produit de Zhemal Khamidun, Head of AI chez Alpina Digital.

Canal Telegram RSS hamidun.com

Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?

AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.

🎓 Academy — 7 jours gratuits Consultation gratuite