Meta transfere IA agêntica para dezenas de milhões de núcleos AWS Graviton em vez de GPU
Meta está expandindo sua parceria com AWS e transferindo parte de suas cargas de trabalho de IA para processadores Graviton. Isso não é sobre GPUs para…
Processado por IA de TechCrunch; editado por Hamidun News
Meta está efetivamente apostando em uma nova camada de infraestrutura de IA: a empresa assinou um acordo com a AWS para implantar dezenas de milhões de núcleos Graviton para cargas de trabalho de IA baseadas em agentes. Isso não é apenas mais uma compra de GPU para treinamento de modelos, mas um sinal de que o mercado está começando a se dividir em duas grandes direções. Uma envolve o treinamento de modelos cada vez maiores em aceleradores.
A segunda envolve atender a um grande número de cenários baseados em agentes pós-treinamento, onde o desempenho de pico importa menos do que custo, eficiência energética e desempenho previsível em escala. De acordo com um comunicado oficial da Amazon de 24 de abril de 2026, a implementação começa com dezenas de milhões de núcleos Graviton e pode ser expandida conforme as necessidades da Meta crescerem. A Amazon observa que a Meta já se tornou um dos maiores clientes de Graviton do mundo.
Estamos falando sobre CPUs AWS Graviton, não GPUs: são processadores ARM desenvolvidos pela Amazon, disponíveis através da nuvem AWS. Meta planeja executar parte de sua infraestrutura que suporta seus serviços de IA e processa bilhões de interações nesses núcleos, onde fluxos de trabalho multi-etapas complexos precisam ser coordenados.
Por que isso é importante: o boom de IA baseada em agentes está mudando a própria estrutura da demanda por hardware. As GPUs continuam sendo essenciais ao treinar grandes modelos ou executar inferência particularmente pesada. Mas assim que agentes são colocados em camadas sobre esses modelos, a proporção de diferentes tipos de tarefas aumenta rapidamente — raciocínio em tempo real, geração de código, busca, planejamento de sequência de ações, orquestração de chamadas de ferramentas e gerenciamento de longas cadeias de passos.
Essas cargas de trabalho frequentemente afetam não apenas aceleradores, mas também CPU, memória, comunicação entre nós e o custo de cada solicitação. Para empresas na escala da Meta, isso não é mais um detalhe técnico, mas uma questão econômica para toda a plataforma de IA. Para a AWS, o acordo com Meta é várias vitórias ao mesmo tempo.
Primeiro, a Amazon obtém um sinal de mercado muito visível: seus próprios chips podem ser usados não apenas dentro da AWS, mas também em uma das infraestruturas de IA mais exigentes do mundo. Segundo, isso ajuda a trazer parte dos gastos da Meta de volta para a AWS. Em agosto de 2025, a Meta assinou um acordo de nuvem de seis anos com o Google Cloud por mais de 10 bilhões de dólares, e diante disso, o novo contrato com a Amazon parece um passo em direção a um esquema de compra de computação mais diversificado.
Terceiro, a AWS fortalece sua posição em um novo segmento: não apenas "nuvem para modelos", mas fornecedora de uma pilha completa para IA baseada em agentes.
Há também outro contexto. Em 20 de abril de 2026, a Anthropic anunciou uma expansão de sua parceria com a Amazon e um compromisso de gastar mais de 100 bilhões de dólares na AWS ao longo de dez anos, incluindo capacidade baseada em Trainium. Diante disso, a parceria Meta-Graviton mostra que a Amazon está tentando se estabelecer em múltiplas camadas de infraestrutura de IA: em aceleradores para treinamento e inferência, e separadamente em CPUs para cargas de trabalho baseadas em agentes e serviços.
O argumento adicional da Amazon é a economia. Graviton5, de acordo com a empresa, foi criado especificamente para esses cenários, oferecendo até 192 núcleos, cache maior e até 25% de melhoria de desempenho em relação à geração anterior. Para os clientes, isso significa uma tentativa de reduzir o custo das operações de IA sem sacrificar a escala.
A conclusão principal é simples: a corrida pelos chips de IA não é mais apenas sobre a escassez de GPU e o domínio da Nvidia. Os grandes atores estão começando a montar pilhas de computação híbrida, onde cada categoria de hardware lida com seu próprio domínio: GPUs para treinamento, aceleradores especializados para parte da inferência, CPUs para orquestração, cadeias de agentes e cargas de trabalho de aplicação em massa. O acordo Meta-AWS mostra que a próxima competição é sobre quem fornecerá o melhor preço por unidade de trabalho de IA útil.
E se os produtos baseados em agentes realmente se tornarem a interface principal para os modelos, a demanda por tais arquiteturas de CPU crescerá não menos rapidamente do que a demanda por aceleradores de IA clássicos.
Quer parar de ler sobre IA e começar a usar?
AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.