3DNews AI→ original

Alphabet discute com a Marvell dois novos chips de AI para acelerar a inferência nos serviços do Google

A Alphabet está em negociações com a Marvell para desenvolver dois chips de AI para inferência. O primeiro deve acelerar a transferência de dados por meio de…

Processado por IA de 3DNews AI; editado por Hamidun News
Alphabet discute com a Marvell dois novos chips de AI para acelerar a inferência nos serviços do Google
Fonte: 3DNews AI. Colagem: Hamidun News.
◐ Ouvir artigo

A Alphabet está discutindo com a Marvell o desenvolvimento de dois chips de IA especializados para inferência — o estágio em que um modelo já treinado processa requisições reais de usuários. Se o projeto se concretizar, o Google terá hardware criado não para recordes de laboratório, mas para respostas rápidas e em massa em serviços interativos.

Quais chips estão sendo discutidos

No centro da discussão estão dois componentes diferentes. O primeiro é um módulo de memória que deve acelerar a transferência de dados dentro do sistema de IA. Para inferência, isso é crítico: mesmo um acelerador poderoso perde o sentido se o modelo esbarra na largura de banda da memória, em atrasos na troca de dados e na entrega lenta de informações. Em modelos de linguagem grandes, esses gargalos frequentemente determinam a rapidez e o custo com que o sistema consegue atender o fluxo diário de requisições dos usuários.

O segundo componente é uma versão atualizada do TPU, os processadores tensores próprios do Google, voltada para aplicações interativas. Estamos falando de cenários onde o usuário espera uma resposta imediatamente: busca, assistentes de IA, geração de texto, sugestões na interface. Essa escolha demonstra uma mudança de prioridades: o valor cada vez mais é criado não no momento do treinamento do modelo, mas no momento de sua execução contínua em milhões de requisições breves, onde importam a latência estável, a previsibilidade e o custo de cada resposta.

Por que a Alphabet precisa da Marvell

Para a Alphabet, uma parceria com a Marvell parece pragmática. A Marvell é forte em infraestrutura de data center e microchips especializados, enquanto o Google já desenvolve sua própria linha de TPU há muitos anos. Em vez de fazer tudo completamente internamente, a Alphabet pode dividir a responsabilidade: manter o controle sobre a arquitetura do acelerador e trazer um parceiro para as partes do sistema onde a memória, interconexões, empacotamento e troca rápida de dados entre componentes são particularmente importantes.

O negócio também tem lógica econômica. A inferência está se tornando rapidamente uma das camadas mais caras da infraestrutura de IA, porque é justamente ela que funciona com tráfego constante de usuários. Quanto mais preciso for o hardware ajustado para um tipo específico de carga, mais fácil será escalar o serviço sem crescimento explosivo de custos. Para o Google, essa é uma chance de reduzir o custo por resposta e controlar melhor sua própria pilha tecnológica; para a Marvell, é uma forma de fortalecer sua posição no mercado superaquecido de aceleradores de IA.

  • Um módulo de memória separado pode reduzir gargalos ao trabalhar com modelos grandes
  • Um TPU atualizado é mais adequado para diálogos e outros cenários interativos
  • Chips especializados normalmente oferecem mais eficiência por watt e por dólar
  • Para o Google, é uma forma de fortalecer o controle sobre sua própria infraestrutura de IA
  • Para a Marvell, é entrada mais profunda no mercado de aceleração para IA

Onde o efeito será percebido

Se as negociações evoluírem para fornecimentos reais, o efeito será percebido primeiro não pelos usuários, mas pelas equipes responsáveis pela infraestrutura do Google. Inferência não é uma execução única do modelo, mas uma operação contínua sob carga, quando o sistema deve responder rapidamente a um enorme número de requisições em sequência. Nesse modo, o que importa não é apenas a computação em si, mas o tempo de resposta previsível, a eficiência energética e a ausência de gargalos ao transferir dados entre memória e acelerador.

Na prática, isso significa uma sintonia mais fina do hardware para produtos específicos. O mercado está gradualmente se afastando da ideia de um único chip universal que funciona igualmente bem para todas as tarefas de IA. Em vez disso, as empresas montam combinações separadas de componentes para treinamento, inferência e modos interativos. As negociações entre a Alphabet e a Marvell se encaixam bem nessa tendência: quem vencerá não será quem tiver mais GPUs, mas quem projetar com mais precisão toda a cadeia de execução do modelo para a carga real.

O que isso significa

As negociações entre a Alphabet e a Marvell mostram que a nova corrida em IA está se desenrolando não apenas em torno de modelos, mas também em torno de hardware especializado para serviços do dia a dia. Quem conseguir entregar uma resposta rápida de forma mais barata e confiável obterá a vantagem.

ZK
Hamidun News
Notícias de AI sem ruído. Seleção editorial diária de mais de 400 fontes. Produto de Zhemal Khamidun, Head of AI na Alpina Digital.

Quer parar de ler sobre IA e começar a usar?

AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.

O que você acha?
Carregando comentários…