3DNews AI→ original

Meta revelou um plano para quatro chips MTIA de AI para inferência, mas sem abandonar Nvidia e AMD

Meta revelou o roadmap de quatro aceleradores MTIA, que devem assumir uma fatia cada vez maior das cargas de trabalho de AI nos data centers da empresa. O…

Processado por IA de 3DNews AI; editado por Hamidun News
Meta revelou um plano para quatro chips MTIA de AI para inferência, mas sem abandonar Nvidia e AMD
Fonte: 3DNews AI. Colagem: Hamidun News.
◐ Ouvir artigo

Meta revelou um plano para desenvolver sua própria linha de aceleradores de IA MTIA: nos próximos dois anos, a empresa quer lançar quatro gerações de chips para tarefas de ranking, recomendação e IA generativa. No entanto, não será possível abandonar completamente a Nvidia e AMD — Meta vê seu próprio silício como um complemento às compras de hardware de terceiros, não como uma substituição imediata.

Por que Meta precisa de seus próprios chips

A razão principal é simples: a carga de infraestrutura da Meta está crescendo muito rápido, e GPUs universais estão ficando cada vez mais caras. A empresa está expandindo a capacidade do data center para Facebook, Instagram e seus próprios serviços generativos, então está tentando ganhar mais controle sobre os custos de inferência — o estágio quando um modelo já está treinado e responde às consultas dos usuários. Para tal trabalho, nem sempre é necessário o acelerador mais versátil.

Às vezes, é mais lucrativo construir um chip para cenários internos específicos e extrair a melhor eficiência por watt e por dólar. Meta diz que já usa centenas de milhares de chips MTIA para inferência em recomendações, conteúdo orgânico e publicidade. Essencialmente, não se trata de um experimento de laboratório, mas de uma parte incorporada da infraestrutura de produção.

Diante disso, a empresa está acelerando o desenvolvimento de novas gerações. Outro número significativo: em 2026, Meta espera despesas de capital no nível de $115–135 bilhões, e uma parte significativa desses investimentos vai para infraestrutura de IA. Seus próprios aceleradores devem ajudar não apenas a escalar mais rápido, mas também a reduzir a dependência de preços e suprimentos de fornecedores externos.

Como é o roteiro

No centro do novo roteiro estão quatro chips MTIA que Meta planeja implantar em uma velocidade muito maior do que é típico na indústria. Enquanto muitos chips de IA são atualizados a cada um ou dois anos, Meta quer se mover em intervalos de aproximadamente seis meses. Isso se tornou possível devido a uma abordagem modular: novas gerações são projetadas para se encaixarem em racks já preparados e infraestrutura de rede sem redesenho completo do site.

  • MTIA 300 já está em produção e projetado para tarefas de ranking e recomendação.
  • MTIA 400 será o próximo estágio e, de acordo com a empresa, está sendo preparado para implantação nos data centers da Meta.
  • MTIA 450 está sendo projetado principalmente para inferência de IA generativa.
  • MTIA 500 continuará na mesma linha e deverá fortalecer a infraestrutura em 2027.

A partir do MTIA 400, Meta projeta não apenas o chip em si, mas um sistema completo ao seu redor: múltiplos racks de servidor, rede e resfriamento líquido. Essa abordagem é importante porque em grandes clusters de IA, os limites de desempenho há muito tempo são limitados não apenas pela computação, mas também pela entrega de dados, consumo de energia e dissipação de calor. Quanto melhor a empresa otimiza toda a pilha, menos ela paga a mais pela versatilidade que nem sempre precisa.

Por que isso não é uma substituição para Nvidia

Apesar do anúncio de grande repercussão, Meta não posiciona diretamente o MTIA como uma alternativa que deslocará Nvidia ou AMD de seus data centers. Em vez disso, a empresa fala sobre uma abordagem de "portfólio": diferentes tipos de cargas de trabalho requerem diferentes chips, e simplesmente não há uma solução universal para tudo. Nos próximos anos, os aceleradores externos permanecerão criticamente importantes, especialmente onde os cenários mais pesados de treinamento de grandes modelos ou acesso rápido a ecossistemas de hardware e software já prontos são necessários.

A aposta da Meta é diferente: mover para seus próprios chips as cargas de trabalho onde você pode obter ganhos máximos em preço e eficiência. Ao mesmo tempo, a empresa tenta não construir um ecossistema fechado. MTIA é inicialmente projetado com confiança em ferramentas familiares da indústria — PyTorch, vLLM, Triton e padrões do Open Compute Project.

Isso simplifica a implantação em data centers existentes. Parte do desenvolvimento é conduzida junto com a Broadcom, e a fabricação é confiada à TSMC, então até o silício "próprio" tem uma longa cadeia externa de parceiros.

O que isso significa

Meta mostra que a corrida de hardware de IA está mudando de simplesmente comprar as GPUs mais poderosas para um modelo mais sofisticado: grandes plataformas estão montando uma frota mista de aceleradores de terceiros e proprietários. Para o mercado, este é um sinal de que a principal escassez nos próximos anos não será apenas chips em si, mas também a capacidade de adaptar rapidamente a infraestrutura para tipos específicos de cargas de trabalho de IA.

ZK
Hamidun News
Notícias de AI sem ruído. Seleção editorial diária de mais de 400 fontes. Produto de Zhemal Khamidun, Head of AI na Alpina Digital.

Quer parar de ler sobre IA e começar a usar?

AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.

O que você acha?
Carregando comentários…