Nvidia quer cobrir toda a stack do data center de AI — dos chips à rede e ao armazenamento
Na GTC 2026, a Nvidia apresentou uma nova aposta: vender não apenas GPUs, mas todo o data center de AI para cargas corporativas de AI. A stack inclui Vera…
Processado por IA de ZDNet AI; editado por Hamidun News
A Nvidia no GTC 2026 mostrou que não quer mais ser apenas um fornecedor de GPU. A empresa está oferecendo aos clientes um data center de IA inteiro como um único produto — desde computação e redes até armazenamento de contexto e software de gerenciamento.
Apostando na Vertical
O principal sinal da apresentação de Jensen Huang não foi sobre um novo chip, mas sobre arquitetura empresarial. A Nvidia construiu uma linha de racks no palco e basicamente disse ao mercado: a infraestrutura de IA será mais barata, mais rápida e mais lucrativa se você comprar não componentes individuais, mas o stack completo de um único fornecedor. Este não é mais o modelo de "vendemos aceleradores e você monta o resto", mas uma tentativa de transformar um data center em um sistema totalmente projetado pela Nvidia.
Huang há muito tempo vem promovendo a ideia de uma fábrica de IA — uma fábrica que produz tokens e inteligência assim como uma planta produz peças. Agora essa ideia ficou ainda mais radical: a Nvidia quer controlar não apenas a computação, mas também a rede, memória, armazenamento de dados intermediários, a camada de CPU e o software que conecta tudo isso. Diante do boom de sistemas de agentes, essa abordagem faz sentido lógico: o gargalo não é mais apenas GPUs, mas tudo aquilo que move dados entre elas.
O Que Entrou no Stack
Na nova configuração, a Nvidia montou vários racks, cada um resolvendo um problema separado em um data center de IA. Juntos, formam quase um kit completo para empresas que constroem grandes clusters para treinamento e inferência e não querem lidar com dezenas de fornecedores heterogêneos em um único esquema.
- Vera Rubin NVL72 — sistema rack-scale de ponta com 72 GPUs Rubin e 36 CPUs Vera.
- Vera CPU Rack — rack separado com 256 CPUs para tarefas de IA de agentes, onde chamadas de ferramentas, SQL e execução de código são importantes.
- BlueField-4 STX — camada de armazenamento e entrega rápida de KV-cache, que grandes modelos de linguagem precisam durante inferência.
- Spectrum-6 SPX — nova rede Ethernet para conectar racks e escalar clusters.
- Groq 3 LPX — rack de inferência com 256 aceleradores LPU focado em baixa latência e grande contexto.
O ponto dessa montagem é que a Nvidia agora vende não apenas "potência bruta" na forma de GPUs. Ela cobre aquelas partes do sistema onde milissegundos, watts e dinheiro são geralmente perdidos: movimentação de dados entre chips, trabalho com contexto, latência de rede, tarefas de CPU para agentes e balanceamento geral de carga. Quanto maior o modelo e maior seu contexto, mais notáveis essas despesas gerais se tornam.
Onde a Nvidia Vê a Vantagem
O argumento mais óbvio da Nvidia é a economia de inferência. A empresa afirma que a combinação de Vera Rubin e Groq 3 LPX reduz acessos a DRAM externa devido ao grande volume de SRAM no LPU, reduzindo assim a latência e acelerando a entrega de tokens. Segundo a Nvidia, tal esquema pode fornecer até 35 vezes mais throughput por megawatt para modelos com trilhões de parâmetros, e até 10 vezes mais receita por watt em cenários com tokens "premium" caros.
"O que costumava exigir um dia inteiro de requisições agora será feito
em menos de uma hora."
Uma aposta especial foi feita na camada de CPU. A Nvidia afirma diretamente que até na era das GPUs, os agentes constantemente enfrentam tarefas computacionais regulares: chamadas de ferramentas, consultas SQL, compilação de código e execução de código em sandbox. É por isso que a empresa coloca suas próprias CPUs Vera no centro e adiciona DPUs e armazenamento de contexto especializado próximo. Isso expande as ambições da Nvidia muito além dos aceleradores e mostra que a empresa quer capturar ainda mais margem na infraestrutura de IA.
O Que Isso Significa
Para o mercado, este é outro passo em direção a data centers de IA integrados verticalmente, onde um único fornecedor é responsável por quase tudo. Para os clientes, tal modelo pode fornecer implantação mais simples e melhor eficiência, mas ao custo de uma dependência mais forte da Nvidia. Para os concorrentes — desde players de CPU e redes até fornecedores de sistemas de armazenamento — este é um sinal de que a Nvidia não está mais jogando apenas no campo de GPU.
Quer parar de ler sobre IA e começar a usar?
AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.