TNW→ original

Google negocia com Marvell sobre chips de IA para inferência e reduz dependência de Broadcom

Google pode envolver Marvell no desenvolvimento de dois novos chips de IA — uma unidade de processamento de memória e TPU para inferência. Isso fortalecerá a…

Processado por IA de TNW; editado por Hamidun News
Google negocia com Marvell sobre chips de IA para inferência e reduz dependência de Broadcom
Fonte: TNW. Colagem: Hamidun News.
◐ Ouvir artigo

Google está dando o próximo passo em sua estratégia de chips: a empresa está discutindo com a Marvell a criação de dois aceleradores de IA especializados para expandir sua cadeia de desenvolvimento além da Broadcom. Se as negociações resultarem em um acordo, o Google ganhará mais um parceiro de silício customizado—e reforçará sua aposta em inferência mais barata e em massa, não apenas no treinamento de grandes modelos. De acordo com informações disponíveis, o assunto das negociações envolve dois novos chips.

O primeiro é uma unidade de processamento de memória, um componente projetado especificamente para operações de memória e transferência de dados dentro de sistemas de IA. O segundo é uma TPU otimizada precisamente para inferência—quando um modelo já foi treinado e precisa responder rapidamente às solicitações dos usuários.

Para o Google, esta é uma área sensível: quanto mais solicitações passam pelo Gemini, busca, publicidade e serviços em nuvem, mais intensamente o custo de cada resposta e o consumo de energia dos data centers pressionam a empresa. Atualmente, o Google não está construindo seu ecossistema de silício customizado sozinho. A Broadcom tem sido um parceiro chave há muito tempo, e a MediaTek também figura na cadeia de desenvolvimento. O surgimento da Marvell como um possível terceiro parceiro significa mais do que simplesmente expandir a lista de contratados.

É uma forma de distribuir riscos, não depender de um único fornecedor de componentes críticos e, simultaneamente, testar diferentes abordagens de engenharia para diferentes classes de cargas de trabalho—desde treinamento até inferência em serviços de produção. É importante notar que ainda se trata apenas de negociações: não há contrato assinado ainda, com base nas informações disponíveis. Mas o próprio fato dessas discussões mostra para onde o mercado está se movimentando.

No contexto do boom de IA generativa, as empresas estão cada vez mais projetando seus próprios chips porque GPUs universais continuam caras, escassas e nem sempre otimizadas para uma tarefa específica. Inferência é um alvo particularmente atraente para customização: é onde os produtos voltados para usuários finalmente se dimensionam, onde latência, custo de solicitação e desempenho previsível importam.

Um interesse separado é despertado pela unidade de processamento de memória. Na infraestrutura de IA, o gargalo geralmente não é o poder computacional bruto, mas a velocidade com que os dados chegam ao acelerador. Quanto mais eficientemente um sistema trabalha com memória, menos os blocos de computação ficam ociosos e melhor se pode utilizar o hardware já instalado. Tais soluções podem ser tão importantes quanto as próprias TPUs: elas melhoram o equilíbrio geral do sistema e reduzem a sobrecarga de movimentação de dados.

Para o Google, este é um passo particularmente lógico. A empresa tem desenvolvido sua linha de TPU há muitos anos e sabe como integrar firmemente hardware com seu software, data centers e infraestrutura em nuvem. Novos componentes especializados podem ajudá-la a ajustar melhor a pilha para diferentes cenários: separadamente para treinamento, separadamente para atender um número enorme de solicitações, separadamente para gargalos relacionados à memória. Essa abordagem geralmente produz não apenas ganhos de desempenho, mas também um controle mais rigoroso sobre custo, prazos de entrega e dependência de ecossistemas externos.

Outra camada desta história é a posição negociadora do Google. Quando uma empresa tem múltiplos parceiros de design, é mais fácil para ela distribuir projetos por especialização e não amarrar seu roteiro inteiro ao ritmo de um único contratado. Em uma indústria onde o lançamento da próxima geração de hardware de IA impacta diretamente as margens da nuvem e a velocidade de lançamento de produtos, tal flexibilidade se torna um ativo estratégico.

Mesmo sem um contrato final, o próprio diálogo com a Marvell mostra que o Google está preparando alternativas antecipadamente e expandindo sua margem de manobra. Em termos práticos, essa notícia é importante não porque o Google encontrou mais um fabricante de chips, mas porque as maiores empresas de IA estão se movimentando em direção a uma arquitetura de hardware mais granular e especializada. O vencedor não será aquele que simplesmente tem mais aceleradores, mas aquele que melhor distribui funções entre eles.

Se o acordo com a Marvell se concretizar, será mais um sinal: a próxima fase da corrida de IA não é apenas sobre modelos, mas sobre a economia da inferência, onde cada watt e cada milissegundo de melhoria se torna uma vantagem competitiva.

ZK
Hamidun News
Notícias de AI sem ruído. Seleção editorial diária de mais de 400 fontes. Produto de Zhemal Khamidun, Head of AI na Alpina Digital.

Quer parar de ler sobre IA e começar a usar?

AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.

O que você acha?
Carregando comentários…