Nvidia apresenta Vera Rubin: sete chips e uma plataforma completa para fábricas de AI

Q: Qual é a fonte?

Publicado originalmente em 3DNews AI. O Hamidun News processa e adapta os materiais com IA.

Q: Quando foi publicado?

30 de abr. de 2026. Tempo de leitura: 3 min.

A Nvidia anunciou Vera Rubin não como mais um GPU, mas como uma stack completa para fábricas de AI: Rubin GPU, Vera CPU, NVLink 6, ConnectX-9, BlueField-4…

Redação da Hamidun News

Monitoramento de AI · 3DNews AI

30 de abr. de 2026· 3 min

Processado por IA de 3DNews AI; editado por Hamidun News

Nvidia apresenta Vera Rubin: sete chips e uma plataforma completa para fábricas de AI — Fonte: 3DNews AI. Colagem: Hamidun News.

◐ Ouvir artigo

A Nvidia apresentou não apenas um acelerador Vera Rubin, mas uma plataforma completa para fábricas de IA: de GPUs e CPUs até interfaces de rede, DPUs, sistemas de armazenamento e switches Ethernet. A empresa apresenta isso como o próximo estágio após Blackwell — uma infraestrutura onde racks e clusters são projetados como um único supercomputador para IA agêntica.

Plataforma Completa

Em vez de anunciar outro "GPU mais rápido", a Nvidia apresentou um stack completo de sete chips e vários tipos de racks que cobrem diferentes estágios do trabalho com IA: pré-treinamento, pós-treinamento, test-time scaling e inferência para sistemas agênticos. No centro da plataforma estão o GPU Rubin e a CPU Vera, com NVLink 6, ConnectX-9 SuperNIC, BlueField-4, Spectrum-6 e aceleradoras de inferência Groq 3 LPX construídas ao redor deles. De acordo com o projeto da empresa, tudo isso deve funcionar não como uma coleção de servidores separados, mas como um único circuito computacional conectado.

A Nvidia enfatiza especificamente uma mudança de servidores individuais para sistemas em escala de POD e rack. A lógica é simples: modelos modernos e agentes de IA enfrentam restrições não apenas em aceleradoras, mas também em rede, memória, armazenamento de KV-cache, resfriamento e consumo de energia. Portanto, Vera Rubin é vendido não como um chip individual, mas como uma arquitetura para uma fábrica de IA inteira que pode ser montada a partir de módulos prontos adaptados a um tipo específico de carga de trabalho e orçamento.

"Vera

Rubin é um salto geracional: sete chips inovadores, cinco racks e um supercomputador gigantesco."

O Que Está no Stack

A configuração básica Vera Rubin NVL72 combina 72 GPUs Rubin e 36 CPUs Vera em um único rack. Os componentes são conectados através do NVLink 6, enquanto ConnectX-9 e BlueField-4 lidam com conectividade de rede e descarregamento de tarefas de infraestrutura. A Nvidia afirma que tal sistema treina grandes modelos de mixture-of-experts usando quatro vezes menos GPUs que a plataforma Blackwell, e em inferência fornece até 10 vezes mais throughput por watt com custo de token dez vezes menor. Ao redor deste rack, a empresa montou vários blocos especializados adicionais:

Vera CPU Rack — até 256 processadores Vera para aprendizado por reforço e cargas de trabalho agênticas
Groq 3 LPX Rack — 256 chips LPU para inferência de baixa latência e contexto longo
BlueField-4 STX — camada de armazenamento e processamento de KV-cache para modelos e agentes
Spectrum-6 SPX — rack Ethernet para rápida troca de dados entre nós
Quantum-X800 / Spectrum-X — escalonamento de clusters entre racks

Ênfase especial foi colocada no rack de CPU Vera: é projetado para cenários onde agentes precisam não apenas gerar uma resposta, mas verificar repetidamente opções de ação em ambientes externos. De acordo com a Nvidia, Vera entrega resultados 50% mais rápido que CPUs tradicionais e é duas vezes mais eficiente em energia. Para inferência de modelos com contexto longo, a empresa adicionou Groq 3 LPX: 256 LPUs em um rack, 128 GB de SRAM no chip, e até 640 TB/s de throughput interno.

Economia e Escala

A parte mais importante do anúncio não é a lista de componentes, mas a economia de operação. A Nvidia promete até 35 vezes maior throughput de inferência por megawatt ao combinar Vera Rubin com Groq 3 LPX, e BlueField-4 STX deve acelerar operações de KV-cache até cinco vezes em comparação com arquiteturas de armazenamento mais tradicionais. Para a rede Ethernet Spectrum-6, a empresa reclama até cinco vezes melhoria em eficiência energética óptica e aumento de dez vezes na confiabilidade ao usar optics co-empacotadas.

Junto com o hardware, a Nvidia introduziu a plataforma DSX para data centers Vera Rubin. A versão DSX Max-Q, de acordo com a empresa, permite implantar até 30% mais infraestrutura de IA em um data center com o mesmo orçamento de energia, enquanto DSX Flex permite usar o sistema de energia do data center como um ativo mais flexível. As remessas de parceiros de produtos baseados em Vera Rubin devem começar na segunda metade de 2026.

Os primeiros parceiros incluem AWS, Google Cloud, Microsoft Azure, Oracle Cloud, CoreWeave, Lambda, Together AI, bem como Dell, HPE, Lenovo e Supermicro.

O Que Isso Significa

A Nvidia está cada vez mais se afastando da venda de aceleradoras individuais e cada vez mais na direção do papel de fornecedor de arquitetura completa para fábricas de IA. Para o mercado, isso sinaliza que a concorrência não será mais impulsionada apenas pelo desempenho de GPU, mas também pelo preço de token, eficiência de rede, manipulação de memória e quanto rápido um cluster inteiro para IA agêntica pode ser implantado.

Hamidun News

Notícias de AI sem ruído. Seleção editorial diária de mais de 400 fontes. Produto de Zhemal Khamidun, Head of AI na Alpina Digital.

Canal do Telegram RSS hamidun.com

Quer parar de ler sobre IA e começar a usar?

AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.

🎓 Academy — 7 dias grátis Consultoria grátis