Bloomberg Tech→ original

Meta prepara quatro gerações de chips MTIA para reduzir a dependência de Nvidia e AMD

A Meta já colocou o MTIA 300 em produção e prepara mais três gerações de seus próprios chips de AI até o fim de 2027. A empresa quer reduzir o custo da…

Processado por IA de Bloomberg Tech; editado por Hamidun News
Meta prepara quatro gerações de chips MTIA para reduzir a dependência de Nvidia e AMD
Fonte: Bloomberg Tech. Colagem: Hamidun News.
◐ Ouvir artigo

Meta está acelerando drasticamente seu próprio programa de chips: a empresa já lançou o MTIA 300 em produção e planeja lançar mais três gerações de aceleradores até o final de 2027. O objetivo é simples — reduzir a dependência apenas de Nvidia e AMD na corrida pelo poder computacional para recomendações, publicidade e IA generativa.

Por que Meta precisa de seus próprios chips

A carga de infraestrutura da Meta está crescendo em várias direções. A empresa precisa de capacidade tanto para os tradicionais sistemas de classificação de conteúdo no Facebook e Instagram quanto para IA generativa que responde a consultas, cria imagens e suporta outros produtos do seu ecossistema. Comprar tudo isso apenas de fornecedores externos é muito caro e arriscado: a demanda por aceleradores é alta, os prazos de entrega são longos e as margens dependem fortemente dos preços do hardware de terceiros.

Por isso, Meta está apostando em sua própria linha MTIA — Meta Training and Inference Accelerator. Ela não abandonou seus parceiros e já fechou acordos multibilionários com Nvidia e AMD, mas em paralelo está tentando resolver algumas tarefas com seu próprio silício. A lógica é que chips internos não precisam ser universais como GPUs comerciais.

Eles podem ser mais precisamente adaptados aos cenários específicos da Meta e assim reduzir os custos de inferência.

Roteiro do MTIA

Meta agora tem um plano bem claro para várias gerações à frente. A empresa diz que pode lançar um novo chip aproximadamente a cada seis meses — notavelmente mais rápido do que o ciclo usual da indústria, onde frequentemente passam um ou dois anos entre gerações. Uma arquitetura modular ajuda: novos aceleradores podem ser incorporados em racks já preparados e na infraestrutura de rede dos data centers.

  • MTIA 300 já está rodando em produção e é usado para treinar modelos de classificação e recomendações.
  • MTIA 400 passou por testes de laboratório e está se preparando para implantação em data centers.
  • MTIA 450 está sendo projetado principalmente para inferência de IA e deve ser lançado em volume no início de 2027.
  • MTIA 500 está planejado para a segunda metade de 2027 como o próximo passo na mesma linha.

De acordo com a Meta, a transição de MTIA 300 para MTIA 500 deve entregar aproximadamente 4,5x de crescimento na taxa de transferência de memória HBM e 25x de crescimento no desempenho computacional. A empresa está dando ênfase especial à inferência: este estágio, quando o modelo já está respondendo ao usuário, está se tornando o cenário mais caro e mais disseminado para serviços com uma audiência de bilhões de usuários.

"Nos últimos dois a três meses, o ritmo do desenvolvimento de IA

acelerou novamente, e os programas de silício devem acompanhar a evolução das cargas de trabalho."

Onde estão os gargalos

O problema é que desenvolver seus próprios chips não é apenas caro, mas muito lento e arriscado. Do design até a produção em fábrica normalmente leva cerca de dois anos, e o refinamento real do produto custa bilhões de dólares. Um projeto desses só se paga se a empresa conseguir carregar o hardware em escala massiva e entender claramente quais tarefas serão relevantes no momento do lançamento.

Anteriormente, foi relatado que a Meta abandonou seu chip de treinamento mais avançado, Olympus, após problemas de design e deslocou o foco para uma versão mais simples. Para acelerar o programa, Meta tentou comprar a startup sul-coreana FuriosaAI por 800 milhões de dólares, e após esse fracasso, adquiriu a Rivos junto com mais de 400 funcionários. Isso mostra que a escassez nesta corrida não é apenas em GPUs, mas também em engenheiros que sabem como construir silício de data center complexo.

O que isso significa

Meta não está construindo uma substituta da Nvidia como "um grande chip", mas sim um modelo híbrido: continuará comprando parte de sua infraestrutura externamente, enquanto gradualmente transfere parte do trabalho para seu próprio MTIA. Se a empresa manter o ritmo dos lançamentos e realmente conseguir reduzir os custos de inferência, ela ganhará uma vantagem importante na corrida de IA: maior controle sobre custos, cronogramas e lançamento de novos recursos para bilhões de usuários.

ZK
Hamidun News
Notícias de AI sem ruído. Seleção editorial diária de mais de 400 fontes. Produto de Zhemal Khamidun, Head of AI na Alpina Digital.

Quer parar de ler sobre IA e começar a usar?

AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.

O que você acha?
Carregando comentários…