Nvidia quiere cubrir toda la stack del centro de datos de AI — de los chips a la red y el almacenamiento
En GTC 2026, Nvidia presentó una nueva apuesta: vender no solo GPUs, sino todo el centro de datos de AI para cargas empresariales de AI. La stack incluye…
Procesado por IA desde ZDNet AI; editado por Hamidun News
Nvidia en GTC 2026 mostró que ya no quiere ser solo un proveedor de GPU. La empresa está ofreciendo a los clientes un centro de datos de IA completo como un único producto — desde computación y redes hasta almacenamiento de contexto y software de gestión.
Apostando por la Vertical
La principal señal de la presentación de Jensen Huang no fue sobre un nuevo chip, sino sobre arquitectura empresarial. Nvidia construyó una línea de racks en el escenario y básicamente le dijo al mercado: la infraestructura de IA será más barata, más rápida y más rentable si compras no componentes individuales, sino todo el stack de un único proveedor. Este ya no es el modelo de "vendemos aceleradores y tú ensamblas el resto", sino un intento de convertir un data center en un sistema completamente diseñado por Nvidia.
Huang ha estado promoviendo durante mucho tiempo la idea de una fábrica de IA — una fábrica que produce tokens e inteligencia así como una planta produce piezas. Ahora esa idea se ha vuelto aún más radical: Nvidia quiere controlar no solo la computación, sino también la red, memoria, almacenamiento de datos intermedios, la capa de CPU y el software que une todo esto. Con el trasfondo del boom de sistemas de agentes, tal enfoque tiene sentido lógico: el cuello de botella ya no es solo las GPU, sino todo lo que mueve datos entre ellas.
Qué Entró en el Stack
En la nueva configuración, Nvidia ensambló varios racks, cada uno resolviendo un problema separado en un centro de datos de IA. Juntos, forman casi un kit completo para empresas que construyen grandes clusters para entrenamiento e inferencia y no quieren lidiar con docenas de proveedores heterogéneos en un único esquema.
- Vera Rubin NVL72 — sistema rack-scale insignia con 72 GPUs Rubin y 36 CPUs Vera.
- Vera CPU Rack — rack separado con 256 CPUs para tareas de IA de agentes, donde las llamadas de herramientas, SQL y la ejecución de código importan.
- BlueField-4 STX — capa de almacenamiento y entrega rápida de KV-cache, que los grandes modelos de lenguaje necesitan durante la inferencia.
- Spectrum-6 SPX — nueva red Ethernet para conectar racks y escalar clusters.
- Groq 3 LPX — rack de inferencia con 256 aceleradores LPU enfocado en baja latencia y contexto grande.
El punto de este ensamblaje es que Nvidia ahora vende no solo "potencia bruta" en forma de GPU. Cubre aquellas partes del sistema donde se pierden habitualmente milisegundos, vatios y dinero: mover datos entre chips, trabajar con contexto, latencia de red, tareas de CPU para agentes y equilibrio general de carga. Cuanto más grande el modelo y más grande su contexto, más notables se vuelven estos costos generales.
Dónde Nvidia Ve la Ventaja
El argumento más obvio de Nvidia es la economía de la inferencia. La empresa afirma que la combinación de Vera Rubin y Groq 3 LPX reduce accesos a DRAM externa debido al gran volumen de SRAM en el LPU, reduciendo así la latencia y acelerando la entrega de tokens. Según Nvidia, tal esquema puede proporcionar hasta 35 veces más throughput por megavatio para modelos con billones de parámetros, y hasta 10 veces más ingresos por vatio en escenarios con tokens "premium" caros.
"Lo que antes requería un día entero de solicitudes ahora se hará en
menos de una hora."
Se ha hecho una apuesta especial en la capa de CPU. Nvidia afirma directamente que incluso en la era de las GPU, los agentes constantemente encuentran tareas computacionales regulares: llamadas de herramientas, consultas SQL, compilación de código y ejecución de código en sandbox. Por eso la empresa coloca sus propias CPUs Vera en el centro y añade DPUs y almacenamiento de contexto especializado cerca. Esto amplía las ambiciones de Nvidia mucho más allá de los aceleradores y muestra que la empresa quiere capturar aún más margen en la infraestructura de IA.
Qué Significa Esto
Para el mercado, este es otro paso hacia centros de datos de IA integrados verticalmente, donde un único proveedor es responsable de casi todo. Para los clientes, tal modelo puede proporcionar implementación más simple y mejor eficiencia, pero al costo de una dependencia más fuerte de Nvidia. Para los competidores — desde actores de CPU y redes hasta proveedores de sistemas de almacenamiento — esta es una señal de que Nvidia ya no juega solo en el campo de las GPU.
¿Quieres dejar de leer sobre IA y empezar a usarla?
AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.