The Verge→ original

Maia 200: Microsoft coloca seu próprio silício contra Amazon e Google

Parece que a Microsoft finalmente se cansou de esperar na fila da NVIDIA e pagar caro por cada FLOP. A empresa lançou Maia 200 — sua nova resposta para a…

Processado por IA de The Verge; editado por Hamidun News
Maia 200: Microsoft coloca seu próprio silício contra Amazon e Google
Fonte: The Verge. Colagem: Hamidun News.
◐ Ouvir artigo

Parece que a Microsoft finalmente se cansou de esperar na fila da NVIDIA e pagar caro por cada FLOP. A empresa lançou Maia 200 — sua nova resposta para a dominação dos concorrentes em IA de hardware. Se Redmond era associada exclusivamente a Windows e Office, agora é um player genuíno no mercado de semicondutores, pronto para competir com Amazon e Google em seu próprio terreno. A mudança para soluções internas não é apenas um capricho de Satya Nadella, mas uma necessidade rigorosa em um mundo onde os custos de treinamento de modelos crescem exponencialmente.

O contexto aqui é simples: gigantes da nuvem entenderam há muito tempo que comprar soluções prontas é um caminho para a pobreza. Google vem aperfeiçoando sua TPU há anos, Amazon implanta ativamente Trainium, e apenas Microsoft confiou em fornecedores externos por muito tempo. Depois que a primeira versão Maia foi lançada, ficou claro que a empresa precisava de algo mais ambicioso. Maia 200 é construída no processo de 3 nanômetros de última geração da TSMC e carrega mais de 100 bilhões de transistores. Esta é uma densidade de potência enorme destinada a resolver uma tarefa: executar redes neurais pesadas mais rápido e barato do que os concorrentes.

Os números que a Microsoft apresenta parecem um tapa direto na cara dos colegas. Scott Guthrie declara diretamente que Maia 200 é três vezes mais rápido que a terceira geração do Trainium da Amazon em operações FP4. Além disso, o chip supostamente supera a sétima geração do TPU do Google em computações FP8. Estas são afirmações sérias, considerando que Google trabalha em seus processadores há mais de dez anos. Microsoft está claramente apostando em especialização restrita: seu silício é feito sob medida para cargas de trabalho específicas do Azure e modelos OpenAI, dando-lhe uma vantagem de otimização indisponível para soluções universais.

Por que isso importa para nós? Simples: quanto mais eficiente o hardware nos data centers, mais rápidos e baratos se tornam os serviços de IA. Se a Microsoft conseguir reduzir os custos de inferência para modelos como GPT-4 ou o futuro GPT-5, isso dará espaço para manobra em uma guerra de preços com Anthropic e o próprio Google. Além disso, ter seu próprio chip permite projetar software e hardware simultaneamente, criando um stack unificado onde cada transistor conhece sua tarefa. Esta é exatamente a estratégia que certa vez fez da Apple uma líder em processadores móveis, e agora vemos essa abordagem migrando para racks de servidores.

No entanto, não pense que NVIDIA deveria começar a arrumar as malas. Jensen Huang ainda controla o ecossistema de software CUDA, que é extremamente difícil de abandonar. Microsoft está construindo Maia 200 principalmente para suas próprias necessidades e parceiros-chave. É uma tentativa de criar um "porto seguro" dentro do Azure, para que perturbações externas no mercado de chips não possam parar o desenvolvimento de seus produtos de IA. A margem de potência que os engenheiros mencionam sugere que em Redmond já sabem os parâmetros de modelos da próxima geração que exigirão ainda mais recursos computacionais.

No final, a luta pela IA é uma luta por energia e silício. Quem controla a camada física da computação dita termos para todos os outros. Microsoft esteve por muito tempo no papel de perseguidora, mas Maia 200 mostra que estão dispostos a gastar bilhões para se tornarem autossuficientes. Será extremamente interessante ver testes reais na nuvem quando os chips começarem a servir em massa as solicitações dos usuários. Porque no papel tudo sempre fica bonito, mas o mundo real das cargas de IA sabe como derrubar até mesmo os players mais ambiciosos.

A conclusão: Microsoft está finalmente se tornando uma empresa de "hardware", e isso é uma má notícia para NVIDIA, mas ótima para o desenvolvimento da infraestrutura do Azure. Será que isso é suficiente para ultrapassar o Google na corrida de longo prazo?

ZK
Hamidun News
Notícias de AI sem ruído. Seleção editorial diária de mais de 400 fontes. Produto de Zhemal Khamidun, Head of AI na Alpina Digital.

Quer parar de ler sobre IA e começar a usar?

AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.

O que você acha?
Carregando comentários…