Habr AI→ original

Jensen Huang a montré comment Nvidia redéfinit l’infrastructure de l’AI agentique

Lors de la GTC 2026, Jensen Huang a déplacé le débat sur l’AI des puces vers l’infrastructure dans son ensemble. Nvidia présente Vera Rubin comme un système…

Traité par IA depuis Habr AI ; édité par Hamidun News
Jensen Huang a montré comment Nvidia redéfinit l’infrastructure de l’AI agentique
Source : Habr AI. Collage: Hamidun News.
◐ Écouter l'article

La présentation de Jensen Huang à la GTC 2026 s'est avérée être bien plus qu'une simple vitrine de nouveaux chips NVIDIA. Le signal principal était ailleurs : pour l'IA agentic, l'entreprise redéfinit le concept même d'infrastructure — des CPUs et des racks à la couche d'orchestration, en passant par les politiques de sécurité et la qualité des données.

Plus Que Du GPU

Le chiffre le plus percutant de la conférence — un objectif de $1 trillion pour Blackwell et Vera Rubin d'ici 2027. Mais il y a quelque chose de plus important : NVIDIA vend de plus en plus non pas des accélérateurs isolés, mais une usine d'inférence complète. Dans un monde où un agent coordonne des dizaines de sous-agents, navigue entre les outils et maintient un contexte long, le goulot d'étranglement n'est plus seulement les GPUs.

Essentiels sont les CPUs pour la coordination, le réseau, le stockage et la vitesse de déplacement des données entre toutes ces couches. La plateforme Vera Rubin reflète précisément ce changement. NVIDIA parle d'une pile complète, où les CPUs Vera, les GPUs Rubin, les composants réseau et la mémoire sont conçus comme un système unique avec un coût de token inférieur et une efficacité d'inférence plus élevée.

Pour l'entreprise, c'est un pivot significatif : vous devez calculer non seulement le nombre de GPUs, mais toute l'économie des charges agentic — de l'orchestration et du stockage de contexte à la flexibilité des contrats et au prix de chaque requête.

  • Racks de CPU pour la couche d'orchestration
  • Systèmes de GPU pour l'inférence massive
  • une couche séparée de mémoire et de stockage de contexte
  • tissu réseau pour l'échange continu de données
  • coût du token comme nouveau KPI de base

OpenClaw et Contrôle

Le deuxième signal fort — le pari sur OpenClaw, une plateforme open-source pour l'IA agentic. Huang l'a essentiellement positionnée comme le Linux de l'ère agentic : ce n'est plus simplement une bibliothèque, mais une couche fondamentale sur laquelle on peut construire des agents personnels et corporatifs, connecter des modèles, des fichiers, des outils et des compétences personnalisées. Au-dessus, NVIDIA a lancé NemoClaw et le runtime OpenShell — un toolkit pour l'exécution plus sécurisée des agents avec des politiques d'accès, un routage de confidentialité et des restrictions réseau.

Pourquoi cela importe : la plupart des règles IA corporatif ont été écrites selon l'ancien modèle « l'humain pose une question — le modèle répond ». L'IA agentic casse cette logique. Maintenant, le système doit contrôler qui et quand obtient accès aux données, quels outils un agent peut invoquer, s'il peut générer des sous-agents et comment reconstruire la chaîne d'actions après.

Si cette couche n'est pas réfléchie à l'avance, les entreprises obtiendront non pas une accélération, mais une nouvelle classe d'incidents.

Les Données Au Centre À Nouveau

Le troisième apprentissage de la GTC 2026 — les données structurées redeviennent le cœur de l'IA d'entreprise. C'est clairement visible dans le partenariat IBM et NVIDIA : l'accélération GPU est venue directement dans la couche SQL de Presto au sein de watsonx.data, pour exécuter les grands datasets corporatifs plus rapidement et réduire les coûts d'analyse. Autrement dit, la conversation se déplace des « modèles intelligents » abstraits vers une question très pratique : à quelle vitesse, de manière propre et gérable, les données de l'entreprise parviennent-elles aux agents.

«

Les données sont la vérité fondamentale qui donne à l'IA le contexte et le sens. »

Dans cette phrase, il y a à la fois un compliment et un avertissement pour les équipes de données. Si les données sont bien décrites, cohérentes et accessibles selon des règles claires, l'IA agentic devient plus fiable et utile. Si elles sont éparses, contradictoires et mal documentées, les agents mettront à l'échelle les erreurs aussi sûrement qu'ils mettent à l'échelle le travail utile aujourd'hui. C'est pourquoi la question principale après la GTC ne sonne pas comme « où acheter plus de GPUs, » mais « les données de l'entreprise sont-elles prêtes à soutenir des systèmes autonomes. »

Ce Que Cela Signifie

La GTC 2026 a montré que la prochaine course en IA ne sera pas seulement pour les chips, mais pour la qualité des données, l'orchestration et les règles de gouvernance des agents. Les gagnants ne seront pas ceux qui tentent de rattraper les hyperscalers en matériel, mais ceux qui reconsidèrent déjà les contrats d'infrastructure, les politiques d'accès et l'architecture des données pour un monde où les agents travaillent constamment et à grande échelle.

ZK
Hamidun News
Actualités IA sans bruit. Sélection éditoriale quotidienne de plus de 400 sources. Produit de Zhemal Khamidun, Head of AI chez Alpina Digital.

Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?

AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.

Qu'en pensez-vous ?
Chargement des commentaires…