Meta prepara quatro gerações de chips MTIA para reduzir a dependência de Nvidia e AMD
A Meta já colocou o MTIA 300 em produção e prepara mais três gerações de seus próprios chips de AI até o fim de 2027. A empresa quer reduzir o custo da…
Processado por IA de Bloomberg Tech; editado por Hamidun News
Meta está acelerando drasticamente seu próprio programa de chips: a empresa já lançou o MTIA 300 em produção e planeja lançar mais três gerações de aceleradores até o final de 2027. O objetivo é simples — reduzir a dependência apenas de Nvidia e AMD na corrida pelo poder computacional para recomendações, publicidade e IA generativa.
Por que Meta precisa de seus próprios chips
A carga de infraestrutura da Meta está crescendo em várias direções. A empresa precisa de capacidade tanto para os tradicionais sistemas de classificação de conteúdo no Facebook e Instagram quanto para IA generativa que responde a consultas, cria imagens e suporta outros produtos do seu ecossistema. Comprar tudo isso apenas de fornecedores externos é muito caro e arriscado: a demanda por aceleradores é alta, os prazos de entrega são longos e as margens dependem fortemente dos preços do hardware de terceiros.
Por isso, Meta está apostando em sua própria linha MTIA — Meta Training and Inference Accelerator. Ela não abandonou seus parceiros e já fechou acordos multibilionários com Nvidia e AMD, mas em paralelo está tentando resolver algumas tarefas com seu próprio silício. A lógica é que chips internos não precisam ser universais como GPUs comerciais.
Eles podem ser mais precisamente adaptados aos cenários específicos da Meta e assim reduzir os custos de inferência.
Roteiro do MTIA
Meta agora tem um plano bem claro para várias gerações à frente. A empresa diz que pode lançar um novo chip aproximadamente a cada seis meses — notavelmente mais rápido do que o ciclo usual da indústria, onde frequentemente passam um ou dois anos entre gerações. Uma arquitetura modular ajuda: novos aceleradores podem ser incorporados em racks já preparados e na infraestrutura de rede dos data centers.
- MTIA 300 já está rodando em produção e é usado para treinar modelos de classificação e recomendações.
- MTIA 400 passou por testes de laboratório e está se preparando para implantação em data centers.
- MTIA 450 está sendo projetado principalmente para inferência de IA e deve ser lançado em volume no início de 2027.
- MTIA 500 está planejado para a segunda metade de 2027 como o próximo passo na mesma linha.
De acordo com a Meta, a transição de MTIA 300 para MTIA 500 deve entregar aproximadamente 4,5x de crescimento na taxa de transferência de memória HBM e 25x de crescimento no desempenho computacional. A empresa está dando ênfase especial à inferência: este estágio, quando o modelo já está respondendo ao usuário, está se tornando o cenário mais caro e mais disseminado para serviços com uma audiência de bilhões de usuários.
"Nos últimos dois a três meses, o ritmo do desenvolvimento de IA
acelerou novamente, e os programas de silício devem acompanhar a evolução das cargas de trabalho."
Onde estão os gargalos
O problema é que desenvolver seus próprios chips não é apenas caro, mas muito lento e arriscado. Do design até a produção em fábrica normalmente leva cerca de dois anos, e o refinamento real do produto custa bilhões de dólares. Um projeto desses só se paga se a empresa conseguir carregar o hardware em escala massiva e entender claramente quais tarefas serão relevantes no momento do lançamento.
Anteriormente, foi relatado que a Meta abandonou seu chip de treinamento mais avançado, Olympus, após problemas de design e deslocou o foco para uma versão mais simples. Para acelerar o programa, Meta tentou comprar a startup sul-coreana FuriosaAI por 800 milhões de dólares, e após esse fracasso, adquiriu a Rivos junto com mais de 400 funcionários. Isso mostra que a escassez nesta corrida não é apenas em GPUs, mas também em engenheiros que sabem como construir silício de data center complexo.
O que isso significa
Meta não está construindo uma substituta da Nvidia como "um grande chip", mas sim um modelo híbrido: continuará comprando parte de sua infraestrutura externamente, enquanto gradualmente transfere parte do trabalho para seu próprio MTIA. Se a empresa manter o ritmo dos lançamentos e realmente conseguir reduzir os custos de inferência, ela ganhará uma vantagem importante na corrida de IA: maior controle sobre custos, cronogramas e lançamento de novos recursos para bilhões de usuários.
Quer parar de ler sobre IA e começar a usar?
AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.