Google apresenta novos chips de AI para inferência e desafia a Nvidia
Google está desenvolvendo uma nova geração de chips de AI com foco em inferência — um desafio direto à Nvidia. A Cerebras anunciou planos de IPO meses após…
Processado por IA de Bloomberg Tech; editado por Hamidun News
Google desafia a Nvidia: a empresa está desenvolvendo uma nova geração de seus próprios chips de IA focados em inferência — o estágio final da operação de redes neurais, quando um modelo treinado processa requisições de usuários em tempo real. Chips de inferência são fundamentalmente diferentes daqueles necessários para treinamento de modelos. Treinar grandes sistemas de linguagem é meses de computação em milhares de GPUs, um gasto de capital único.
Inferência é uma carga constante: toda vez que um usuário envia uma requisição ao Gemini, ChatGPT ou qualquer outro serviço de IA, o chip executa inferência. Conforme aplicações de IA atingem centenas de milhões de usuários, os custos de inferência se tornam o principal item de despesa para empresas de tecnologia. Por algumas estimativas, em 2027 eles superarão os custos de treinamento três a quatro vezes.
Google há muito tempo está construindo sua própria estratégia de silício. A empresa vem desenvolvendo TPU (Tensor Processing Units) desde 2015 — muito antes de chips de IA se tornarem notícia de primeira página. Até agora, esses processadores foram usados principalmente dentro do Google Cloud e para treinamento de modelos Gemini.
Agora a empresa pretende criar hardware especializado especificamente para inferência — com maior largura de banda e menor consumo de energia por requisição. Para a Nvidia, cujos chips H100 e H200 se tornaram o padrão para data centers em todo o mundo, este é um desafio direto. Google é um dos maiores clientes da Nvidia no mundo, e deslocar até parte da carga para hardware proprietário significa perdas significativas para a empresa de Santa Clara.
Em paralelo, outro evento está se desenvolvendo no setor de chips de IA: Cerebras Systems anunciou planos de abrir capital. A empresa é conhecida por seu produto flagship — o Wafer-Scale Engine, essencialmente uma wafer de silício inteira funcionando como um único processador. Essa arquitetura elimina latências na transferência de dados entre chips individuais e acelera o processamento de modelos grandes.
Cerebras já tentou um IPO antes mas retirou a solicitação. Retornar ao caminho do IPO é um sinal ao mercado: apesar do arrefecimento de alguns investidores de IA, arquiteturas alternativas de chips continuam sendo percebidas como ativos promissores. A empresa posiciona suas soluções como particularmente eficazes para trabalhar com modelos abertos em ambientes corporativos fechados — um segmento em rápido crescimento impulsionado por requisitos de segurança e soberania de dados.
A terceira história da semana vem do espaço. Blue Origin lançou com sucesso o foguete New Glenn e pousou seu impulsionador reutilizável — um marco técnico importante em direção à redução de custos de lançamento. Porém, a carga útil, satélite AST SpaceMobile, não atingiu sua órbita calculada.
AST SpaceMobile está construindo uma rede global de internet de banda larga que funciona diretamente de smartphones sem terminais especiais. A falha orbital afetou imediatamente o preço das ações: as ações da empresa caíram. O mercado mais uma vez lembrou que no espaço, sucesso técnico e sucesso comercial são coisas diferentes.
As três histórias juntas pintam um retrato da economia tecnológica de meados dos anos 2020. A corrida de chips de IA está se movendo além da duopolio: além de Nvidia e AMD, gigantes de tecnologia com seu próprio silício e startups especializadas como Cerebras estão entrando na batalha pela infraestrutura. A questão de quem controlará a infraestrutura física da era da IA permanece aberta.
Quer parar de ler sobre IA e começar a usar?
AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.