Nvidia apresenta Vera Rubin: sete chips e uma plataforma completa para fábricas de AI
A Nvidia anunciou Vera Rubin não como mais um GPU, mas como uma stack completa para fábricas de AI: Rubin GPU, Vera CPU, NVLink 6, ConnectX-9, BlueField-4…
Processado por IA de 3DNews AI; editado por Hamidun News
A Nvidia apresentou não apenas um acelerador Vera Rubin, mas uma plataforma completa para fábricas de IA: de GPUs e CPUs até interfaces de rede, DPUs, sistemas de armazenamento e switches Ethernet. A empresa apresenta isso como o próximo estágio após Blackwell — uma infraestrutura onde racks e clusters são projetados como um único supercomputador para IA agêntica.
Plataforma Completa
Em vez de anunciar outro "GPU mais rápido", a Nvidia apresentou um stack completo de sete chips e vários tipos de racks que cobrem diferentes estágios do trabalho com IA: pré-treinamento, pós-treinamento, test-time scaling e inferência para sistemas agênticos. No centro da plataforma estão o GPU Rubin e a CPU Vera, com NVLink 6, ConnectX-9 SuperNIC, BlueField-4, Spectrum-6 e aceleradoras de inferência Groq 3 LPX construídas ao redor deles. De acordo com o projeto da empresa, tudo isso deve funcionar não como uma coleção de servidores separados, mas como um único circuito computacional conectado.
A Nvidia enfatiza especificamente uma mudança de servidores individuais para sistemas em escala de POD e rack. A lógica é simples: modelos modernos e agentes de IA enfrentam restrições não apenas em aceleradoras, mas também em rede, memória, armazenamento de KV-cache, resfriamento e consumo de energia. Portanto, Vera Rubin é vendido não como um chip individual, mas como uma arquitetura para uma fábrica de IA inteira que pode ser montada a partir de módulos prontos adaptados a um tipo específico de carga de trabalho e orçamento.
"Vera
Rubin é um salto geracional: sete chips inovadores, cinco racks e um supercomputador gigantesco."
O Que Está no Stack
A configuração básica Vera Rubin NVL72 combina 72 GPUs Rubin e 36 CPUs Vera em um único rack. Os componentes são conectados através do NVLink 6, enquanto ConnectX-9 e BlueField-4 lidam com conectividade de rede e descarregamento de tarefas de infraestrutura. A Nvidia afirma que tal sistema treina grandes modelos de mixture-of-experts usando quatro vezes menos GPUs que a plataforma Blackwell, e em inferência fornece até 10 vezes mais throughput por watt com custo de token dez vezes menor. Ao redor deste rack, a empresa montou vários blocos especializados adicionais:
- Vera CPU Rack — até 256 processadores Vera para aprendizado por reforço e cargas de trabalho agênticas
- Groq 3 LPX Rack — 256 chips LPU para inferência de baixa latência e contexto longo
- BlueField-4 STX — camada de armazenamento e processamento de KV-cache para modelos e agentes
- Spectrum-6 SPX — rack Ethernet para rápida troca de dados entre nós
- Quantum-X800 / Spectrum-X — escalonamento de clusters entre racks
Ênfase especial foi colocada no rack de CPU Vera: é projetado para cenários onde agentes precisam não apenas gerar uma resposta, mas verificar repetidamente opções de ação em ambientes externos. De acordo com a Nvidia, Vera entrega resultados 50% mais rápido que CPUs tradicionais e é duas vezes mais eficiente em energia. Para inferência de modelos com contexto longo, a empresa adicionou Groq 3 LPX: 256 LPUs em um rack, 128 GB de SRAM no chip, e até 640 TB/s de throughput interno.
Economia e Escala
A parte mais importante do anúncio não é a lista de componentes, mas a economia de operação. A Nvidia promete até 35 vezes maior throughput de inferência por megawatt ao combinar Vera Rubin com Groq 3 LPX, e BlueField-4 STX deve acelerar operações de KV-cache até cinco vezes em comparação com arquiteturas de armazenamento mais tradicionais. Para a rede Ethernet Spectrum-6, a empresa reclama até cinco vezes melhoria em eficiência energética óptica e aumento de dez vezes na confiabilidade ao usar optics co-empacotadas.
Junto com o hardware, a Nvidia introduziu a plataforma DSX para data centers Vera Rubin. A versão DSX Max-Q, de acordo com a empresa, permite implantar até 30% mais infraestrutura de IA em um data center com o mesmo orçamento de energia, enquanto DSX Flex permite usar o sistema de energia do data center como um ativo mais flexível. As remessas de parceiros de produtos baseados em Vera Rubin devem começar na segunda metade de 2026.
Os primeiros parceiros incluem AWS, Google Cloud, Microsoft Azure, Oracle Cloud, CoreWeave, Lambda, Together AI, bem como Dell, HPE, Lenovo e Supermicro.
O Que Isso Significa
A Nvidia está cada vez mais se afastando da venda de aceleradoras individuais e cada vez mais na direção do papel de fornecedor de arquitetura completa para fábricas de IA. Para o mercado, isso sinaliza que a concorrência não será mais impulsionada apenas pelo desempenho de GPU, mas também pelo preço de token, eficiência de rede, manipulação de memória e quanto rápido um cluster inteiro para IA agêntica pode ser implantado.
Quer parar de ler sobre IA e começar a usar?
AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.