Bloomberg Tech→ original

Jensen Huang и Michael Dell о революции AI-агентов и памяти

Бизнес в спешке к agentic AI. Jensen Huang из Nvidia и глава Dell Michael Dell обсудили грядущую революцию: автономные AI-агенты потребуют беспрецедентных объём

Jensen Huang и Michael Dell о революции AI-агентов и памяти
Source : Bloomberg Tech. Collage: Hamidun News.
◐ Écouter l'article

À la conférence Dell World à Las Vegas, le PDG de NVIDIA Jensen Huang et le responsable de Dell Technologies Michael Dell ont discuté de l'avenir des agents IA, de la demande critique de mémoire et de la façon dont cette ère de transition nécessite une réévaluation des priorités d'ingénierie.

Le Défi Principal: La Mémoire Éclipse le Calcul

Pendant de nombreuses années à l'ère du LLM, l'architecture des serveurs a été optimisée pour les GPU. Mais avec l'arrivée de l'IA agentic, le tableau change fondamentalement. Les agents IA sont des systèmes qui ne font pas simplement générer du texte—ils exécutent des tâches multi-étapes dans les navigateurs, interagissent avec les API et prennent des décisions basées sur le contexte.

Pour cela, vous avez besoin de mémoire. Beaucoup de mémoire. Dans une interview à Bloomberg, Jensen Huang a souligné que les volumes de mémoire doivent croître exponentiellement.

Alors que l'inférence de modèles de texte se contente de dizaines de gigaoctets, l'IA agentic nécessite des centaines de gigaoctets de RAM sur un seul serveur. C'est un défi pour les architectes de systèmes et une opportunité pour les entreprises qui réorientent leur production vers HBM (High Bandwidth Memory) et des systèmes avec une nouvelle topologie. Huang l'a répété maintes fois: la mémoire croîtra plus vite que le calcul.

Cela inverse les priorités d'investissement.

Exemples d'IA Agentic Déjà en Action

OpenAI a lancé Operator—un agent navigateur qui peut de manière autonome remplir des formulaires, comparer les prix et effectuer des achats. Google a présenté Gemini 2.0 avec le mode agentic, capable de s'intégrer aux services Workspace.

Tous ces systèmes exigent d'énormes quantités de mémoire au moment de l'inférence: l'agent doit simultanément voir l'écran, se souvenir de l'historique des tâches, appeler les API externes et évaluer les alternatives. Sur des GPU modestes, cela fonctionne lentement et souvent avec des erreurs. C'est précisément pour cela que Jensen Huang et Michael Dell parlent de la mémoire comme du goulot d'étranglement critique.

Ce n'est pas une théorie—c'est la pratique que les développeurs voient déjà et que les fournisseurs de cloud expérimentent en ce moment.

Infrastructure de Nouvelle Génération

Michael Dell a expliqué que Dell World 2026 présente les systèmes PowerEdge et un écosystème de solutions réorienté vers l'IA agentic. Là où les TFLOPS (opérations en virgule flottante) étaient autrefois la métrique principale, c'est maintenant la bande passante de la mémoire et les volumes de stockage. Dell a déjà lancé de nouvelles configurations de serveurs:

  • Intégration HBM—chips High Bandwidth Memory sur les cartes à côté des GPU pour minimiser la latence lors de l'accès à la mémoire
  • Refonte du refroidissement—nouvelles solutions thermiques, puisque la mémoire plus le calcul nécessitent 1,5 fois plus d'énergie
  • Architecture réseau—les liens entre les nœuds de mémoire nécessitent une capacité de gigabit, pas de kilobit
  • Réévaluation des solutions de type TPU—chips spécialisés pour les charges de travail IA agentic, pas seulement pour l'inférence LLM

Ces changements ne sont pas cosmétiques. Ils nécessitent une refonte des pipelines de production, un examen de la chaîne d'approvisionnement et une requalification complète des administrateurs système.

Géopolitique et le Marché Chinois

Les deux PDG ont indirectement abordé la situation géopolitique. Jensen Huang a répété à plusieurs reprises que les restrictions d'exportation vers la Chine sont un défi sérieux pour NVIDIA, mais pas une sentence de mort. La stratégie est simple: investir dans la croissance de la mémoire et accélérer le développement de nano-serveurs, qui sont plus faciles à intégrer et nécessitent une densité computationnelle inférieure.

Michael Dell a ajouté que la croissance des volumes de mémoire compense les pertes dans des régions géographiques spécifiques. Si la Chine représente 15% du marché, mais que la mémoire exige des mises à niveau sur 100% du marché, alors tous les fabricants dans d'autres pays gagnent. Les deux PDG ont également noté que l'Europe et l'Amérique du Nord poussent le développement de l'IA agentic et sont prêts à investir.

Contre cette toile de fond, les efforts de NVIDIA et Dell se réorientent vers le côté atlantique de la planète.

Ce Que Cela Signifie

L'architecture memory-first n'est pas simplement un changement d'ingénierie—c'est un changement de paradigme. Les entreprises qui seront les premières à repenser leurs centres de données et configurations de serveurs pour l'IA agentic capturont une part significative du marché du calcul contractuel. NVIDIA et Dell appuient leurs paroles par des produits concrets: les nouveaux systèmes PowerEdge basés sur la série NVIDIA H avec mémoire étendue—c'est une réponse directe à la demande du marché. Dès aujourd'hui, les grands fournisseurs de cloud négocient avec Dell et NVIDIA des commandes de mise à niveau de leurs centres de données.

ZK
Hamidun News
Actualités IA sans bruit. Sélection éditoriale quotidienne de plus de 400 sources. Produit de Zhemal Khamidun, Head of AI chez Alpina Digital.
Qu'en pensez-vous ?
Chargement des commentaires…