Bloomberg Tech→ original

Дефицит памяти стал главным узким местом в AI-инфраструктуре — Huang

На конференции Dell World в Лас-Вегасе CEO Nvidia Jensen Huang заявил, что дефицит высокоскоростной памяти (HBM) — самое критичное узкое место в цепи поставок д

Дефицит памяти стал главным узким местом в AI-инфраструктуре — Huang
Source : Bloomberg Tech. Collage: Hamidun News.
◐ Écouter l'article

Lors de la conférence Dell World à Las Vegas, le PDG de Nvidia Jensen Huang a soulevé un problème critique affectant l'ensemble de l'industrie de l'IA : la pénurie de mémoire haute vitesse. Dans une conversation avec le PDG de Dell Michael Dell et le journaliste de Bloomberg Ed Ludlow, Huang a déclaré directement que la pénurie de mémoire est devenue plus aiguë que les goulots d'étranglement de la fabrication des puces eux-mêmes. C'est un aveu franc que le rythme du déploiement de l'infrastructure IA ralentit non pas à cause d'un manque de GPUs en soi, mais à cause de l'incapacité à produire la quantité requise de mémoire.

Pourquoi la Mémoire est Devenue Rare

La mémoire haute vitesse HBM (High Bandwidth Memory) est un type spécial de mémoire incorporée directement dans l'accélérateur. Elle stocke les paramètres des réseaux de neurones et les calculs intermédiaires, permettant au GPU de fonctionner à vitesse maximale sans latence lors de l'accès à la mémoire système plus lente. Les H100 et H200 de Nvidia disposent entre 80 et 141 gigabytes de cette mémoire.

Le problème est que la demande de HBM croît exponentiellement, tandis que la production ne suit même pas le rythme de la croissance linéaire. Il y a un an, les grandes entreprises commandaient des centaines de GPUs; maintenant c'est des milliers; bientôt des millions seront nécessaires. La production de mémoire est un cycle technologique de plusieurs années : les nouvelles usines sont construites sur cinq à sept ans, la technologie devient de plus en plus complexe, et il y a très peu de concurrents dans ce segment.

Qui Est le Plus Durement Touché

Les principaux producteurs de mémoire — Samsung et SK Hynix sud-coréens, ainsi que Micron américain — ont du mal à suivre la croissance de la demande. Les trois entreprises investissent des dizaines de milliards dans de nouvelles capacités de production, mais même cela n'est pas suffisant : le manque croît déjà géométriquement. Cela crée une cascade de problèmes dans toute la chaîne d'approvisionnement :

  • Les prix augmentent: les GPUs avec suffisamment de mémoire deviennent 1,5 à 2 fois plus chers sur le marché secondaire
  • Incertitude stratégique: les entreprises ne savent pas si elles recevront l'équipement requis en temps voulu
  • Compromis architecturaux: contraints d'utiliser des modèles plus étroits, distribuer les calculs sur un plus grand nombre de GPUs
  • Stratification du marché: ceux qui assurent en premier les contrats d'approvisionnement en mémoire obtiendront un avantage concurrentiel significatif

Même Dell, l'un des plus grands intégrateurs de serveurs, dépend des approvisionnements en mémoire. L'entreprise ne peut pas vendre plus de serveurs IA haute performance s'il n'y a pas de GPUs, et les GPUs restent incomplets sans capacité mémoire suffisante.

Comment l'Industrie Répond

Nvidia travaille activement sur de nouvelles générations de mémoire — HBM3e et HBM4 sont déjà en développement, avec une bande passante et des performances attendues élevées. Cependant, le calendrier de développement, de qualification et de production de masse de nouvelles normes de mémoire est mesuré en années, non en mois. En parallèle, l'entreprise et ses partenaires recherchent des solutions de contournement logicielles : optimisation des logiciels, nouvelles architectures de réseaux de neurones qui nécessitent moins de mémoire par unité de performance. Mais cela aussi a des limites strictes — tous les modèles ne peuvent pas être réduits sans perdre la qualité de la sortie.

Huang a déclaré : ce n'est pas un problème à court terme qui sera résolu en mois.

La pénurie de mémoire restera un facteur limitant sérieux pendant au moins les prochaines années.

Ce Que Cela Signifie pour l'Industrie de l'IA

La pénurie de mémoire devient un nouveau plafond pour le rythme du déploiement de l'infrastructure IA. Toutes les entreprises ne pourront pas déployer des modèles de langage volumineux à l'échelle et selon le calendrier nécessaires. Cela crée une stratification claire du marché : ceux qui assurent en premier l'accès à la mémoire se développeront plus rapidement, tandis que ceux qui traînent seront à la traîne. Pour les investisseurs en capital-risque et les startups, cela signifie que l'obtention du bon équipement devient un facteur de succès aussi critique que l'idée et l'équipe elle-même. Cela rappelle l'ère de la pénurie de silicium, lorsque le simple fait d'avoir des puces offrait un avantage concurrentiel.

ZK
Hamidun News
Actualités IA sans bruit. Sélection éditoriale quotidienne de plus de 400 sources. Produit de Zhemal Khamidun, Head of AI chez Alpina Digital.
Qu'en pensez-vous ?
Chargement des commentaires…