3DNews AI→ original

Nvidia presenta Vera Rubin: siete chips y una plataforma completa para fábricas de AI

Nvidia anunció Vera Rubin no como otro GPU, sino como un stack completo para fábricas de AI: Rubin GPU, Vera CPU, NVLink 6, ConnectX-9, BlueField-4…

Procesado por IA desde 3DNews AI; editado por Hamidun News
Nvidia presenta Vera Rubin: siete chips y una plataforma completa para fábricas de AI
Fuente: 3DNews AI. Collage: Hamidun News.
◐ Escuchar artículo

Nvidia presentó no solo un acelerador Vera Rubin, sino una plataforma completa para fábricas de IA: desde GPUs y CPUs hasta interfaces de red, DPUs, sistemas de almacenamiento y switches Ethernet. La empresa presenta esto como el siguiente paso después de Blackwell — una infraestructura donde racks y clústeres se diseñan como un único supercomputador para IA agéntica.

Plataforma Completa

En lugar de anunciar otro "GPU más rápido", Nvidia presentó un stack completo de siete chips y varios tipos de racks que cubren diferentes etapas del trabajo con IA: preentrenamiento, posentrenamiento, test-time scaling e inferencia para sistemas agénticos. En el centro de la plataforma están la GPU Rubin y la CPU Vera, con NVLink 6, ConnectX-9 SuperNIC, BlueField-4, Spectrum-6 y aceleradoras de inferencia Groq 3 LPX construidas alrededor de ellas. Según el diseño de la empresa, todo esto debe funcionar no como una colección de servidores separados, sino como un único circuito computacional conectado.

Nvidia enfatiza específicamente un cambio de servidores individuales a sistemas a escala de POD y rack. La lógica es simple: los modelos modernos y los agentes de IA se encuentran con restricciones no solo en aceleradoras, sino también en redes, memoria, almacenamiento de caché KV, enfriamiento y consumo de energía. Por lo tanto, Vera Rubin se vende no como un chip individual, sino como una arquitectura para una fábrica de IA completa que puede ensamblarse a partir de módulos prefabricados adaptados a un tipo específico de carga de trabajo y presupuesto.

"Vera

Rubin es un salto generacional: siete chips innovadores, cinco racks y un supercomputador gigantesco."

Qué Hay en el Stack

La configuración básica Vera Rubin NVL72 combina 72 GPUs Rubin y 36 CPUs Vera en un único rack. Los componentes se conectan a través de NVLink 6, mientras que ConnectX-9 y BlueField-4 manejan la conectividad de red y la descarga de tareas de infraestructura. Nvidia afirma que tal sistema entrena grandes modelos de mixture-of-experts usando cuatro veces menos GPUs que la plataforma Blackwell, y en inferencia proporciona hasta 10 veces más rendimiento por vatio con un costo de token diez veces menor. Alrededor de este rack, la empresa ensambló varios bloques especializados adicionales:

  • Vera CPU Rack — hasta 256 procesadores Vera para aprendizaje por refuerzo y cargas de trabajo agénticas
  • Groq 3 LPX Rack — 256 chips LPU para inferencia de baja latencia y contexto largo
  • BlueField-4 STX — capa de almacenamiento y procesamiento de caché KV para modelos y agentes
  • Spectrum-6 SPX — rack Ethernet para rápido intercambio de datos entre nodos
  • Quantum-X800 / Spectrum-X — escalado de clústeres entre racks

Se hizo énfasis especial en el rack de CPU Vera: está diseñado para escenarios donde los agentes necesitan no solo generar una respuesta, sino verificar repetidamente opciones de acción en entornos externos. Según Nvidia, Vera entrega resultados 50% más rápido que CPUs tradicionales y es dos veces más eficiente en energía. Para inferencia de modelos de contexto largo, la empresa añadió Groq 3 LPX: 256 LPUs en un rack, 128 GB de SRAM en chip, y hasta 640 TB/s de rendimiento interno.

Economía y Escala

La parte más importante del anuncio no es la lista de componentes, sino la economía de operación. Nvidia promete hasta 35 veces mayor rendimiento de inferencia por megavatio al combinar Vera Rubin con Groq 3 LPX, y BlueField-4 STX debe acelerar operaciones de caché KV hasta cinco veces en comparación con arquitecturas de almacenamiento más tradicionales. Para la red Ethernet Spectrum-6, la empresa reclama hasta cinco veces mejora en eficiencia energética óptica y aumento de diez veces en confiabilidad al usar optics coempaquetadas.

Junto con el hardware, Nvidia introdujo la plataforma DSX para centros de datos Vera Rubin. La versión DSX Max-Q, según la empresa, permite desplegar hasta 30% más infraestructura de IA en un centro de datos con el mismo presupuesto de energía, mientras que DSX Flex permite utilizar el sistema de energía del centro de datos como un activo más flexible. Los envíos de socios de productos basados en Vera Rubin deben comenzar en la segunda mitad de 2026.

Los primeros socios incluyen AWS, Google Cloud, Microsoft Azure, Oracle Cloud, CoreWeave, Lambda, Together AI, así como Dell, HPE, Lenovo y Supermicro.

Lo Que Significa

Nvidia se está alejando cada vez más de la venta de aceleradoras individuales y cada vez más hacia el papel de proveedor de arquitectura completa para fábricas de IA. Para el mercado, esto señala que la competencia ya no será impulsada solo por el rendimiento de GPU, sino también por el precio del token, la eficiencia de la red, el manejo de la memoria y qué tan rápido puede desplegarse un clúster completo para IA agéntica.

ZK
Hamidun News
Noticias de AI sin ruido. Selección editorial diaria de más de 400 fuentes. Producto de Zhemal Khamidun, Head of AI en Alpina Digital.

¿Quieres dejar de leer sobre IA y empezar a usarla?

AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.

¿Qué te parece?
Cargando comentarios…