Nvidia quer cobrir toda a stack do data center de AI — dos chips à rede e ao armazenamento

Q: Qual é a fonte?

Publicado originalmente em ZDNet AI. O Hamidun News processa e adapta os materiais com IA.

Q: Quando foi publicado?

30 de abr. de 2026. Tempo de leitura: 3 min.

Na GTC 2026, a Nvidia apresentou uma nova aposta: vender não apenas GPUs, mas todo o data center de AI para cargas corporativas de AI. A stack inclui Vera…

Redação da Hamidun News

Monitoramento de AI · ZDNet AI

30 de abr. de 2026· 3 min

Processado por IA de ZDNet AI; editado por Hamidun News

Nvidia quer cobrir toda a stack do data center de AI — dos chips à rede e ao armazenamento — Fonte: ZDNet AI. Colagem: Hamidun News.

◐ Ouvir artigo

A Nvidia no GTC 2026 mostrou que não quer mais ser apenas um fornecedor de GPU. A empresa está oferecendo aos clientes um data center de IA inteiro como um único produto — desde computação e redes até armazenamento de contexto e software de gerenciamento.

Apostando na Vertical

O principal sinal da apresentação de Jensen Huang não foi sobre um novo chip, mas sobre arquitetura empresarial. A Nvidia construiu uma linha de racks no palco e basicamente disse ao mercado: a infraestrutura de IA será mais barata, mais rápida e mais lucrativa se você comprar não componentes individuais, mas o stack completo de um único fornecedor. Este não é mais o modelo de "vendemos aceleradores e você monta o resto", mas uma tentativa de transformar um data center em um sistema totalmente projetado pela Nvidia.

Huang há muito tempo vem promovendo a ideia de uma fábrica de IA — uma fábrica que produz tokens e inteligência assim como uma planta produz peças. Agora essa ideia ficou ainda mais radical: a Nvidia quer controlar não apenas a computação, mas também a rede, memória, armazenamento de dados intermediários, a camada de CPU e o software que conecta tudo isso. Diante do boom de sistemas de agentes, essa abordagem faz sentido lógico: o gargalo não é mais apenas GPUs, mas tudo aquilo que move dados entre elas.

O Que Entrou no Stack

Na nova configuração, a Nvidia montou vários racks, cada um resolvendo um problema separado em um data center de IA. Juntos, formam quase um kit completo para empresas que constroem grandes clusters para treinamento e inferência e não querem lidar com dezenas de fornecedores heterogêneos em um único esquema.

Vera Rubin NVL72 — sistema rack-scale de ponta com 72 GPUs Rubin e 36 CPUs Vera.
Vera CPU Rack — rack separado com 256 CPUs para tarefas de IA de agentes, onde chamadas de ferramentas, SQL e execução de código são importantes.
BlueField-4 STX — camada de armazenamento e entrega rápida de KV-cache, que grandes modelos de linguagem precisam durante inferência.
Spectrum-6 SPX — nova rede Ethernet para conectar racks e escalar clusters.
Groq 3 LPX — rack de inferência com 256 aceleradores LPU focado em baixa latência e grande contexto.

O ponto dessa montagem é que a Nvidia agora vende não apenas "potência bruta" na forma de GPUs. Ela cobre aquelas partes do sistema onde milissegundos, watts e dinheiro são geralmente perdidos: movimentação de dados entre chips, trabalho com contexto, latência de rede, tarefas de CPU para agentes e balanceamento geral de carga. Quanto maior o modelo e maior seu contexto, mais notáveis essas despesas gerais se tornam.

Onde a Nvidia Vê a Vantagem

O argumento mais óbvio da Nvidia é a economia de inferência. A empresa afirma que a combinação de Vera Rubin e Groq 3 LPX reduz acessos a DRAM externa devido ao grande volume de SRAM no LPU, reduzindo assim a latência e acelerando a entrega de tokens. Segundo a Nvidia, tal esquema pode fornecer até 35 vezes mais throughput por megawatt para modelos com trilhões de parâmetros, e até 10 vezes mais receita por watt em cenários com tokens "premium" caros.

"O que costumava exigir um dia inteiro de requisições agora será feito

em menos de uma hora."

Uma aposta especial foi feita na camada de CPU. A Nvidia afirma diretamente que até na era das GPUs, os agentes constantemente enfrentam tarefas computacionais regulares: chamadas de ferramentas, consultas SQL, compilação de código e execução de código em sandbox. É por isso que a empresa coloca suas próprias CPUs Vera no centro e adiciona DPUs e armazenamento de contexto especializado próximo. Isso expande as ambições da Nvidia muito além dos aceleradores e mostra que a empresa quer capturar ainda mais margem na infraestrutura de IA.

O Que Isso Significa

Para o mercado, este é outro passo em direção a data centers de IA integrados verticalmente, onde um único fornecedor é responsável por quase tudo. Para os clientes, tal modelo pode fornecer implantação mais simples e melhor eficiência, mas ao custo de uma dependência mais forte da Nvidia. Para os concorrentes — desde players de CPU e redes até fornecedores de sistemas de armazenamento — este é um sinal de que a Nvidia não está mais jogando apenas no campo de GPU.

Hamidun News

Notícias de AI sem ruído. Seleção editorial diária de mais de 400 fontes. Produto de Zhemal Khamidun, Head of AI na Alpina Digital.

Canal do Telegram RSS hamidun.com

Quer parar de ler sobre IA e começar a usar?

AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.

🎓 Academy — 7 dias grátis Consultoria grátis