TechCrunch→ original

Uber amplia contrato com a AWS e aposta em chips da Amazon, preterindo Google e Oracle

Uber amplia o contrato com a Amazon Web Services e migra cargas críticas de AI do seu serviço para os chips customizados da Amazon — Trainium e Inferentia. É…

Processado por IA de TechCrunch; editado por Hamidun News
Uber amplia contrato com a AWS e aposta em chips da Amazon, preterindo Google e Oracle
Fonte: TechCrunch. Colagem: Hamidun News.
◐ Ouvir artigo

Uber expande contrato com AWS e aposta em chips Amazon, contornando Google e Oracle

Uber está expandindo seu contrato com Amazon Web Services e transferindo mais funções de seu serviço para chips Amazon—uma grande vitória da AWS na competição com Google Cloud e Oracle, que também disputavam esse negócio. A decisão do maior agregador de táxi do mundo sinaliza para o mercado: os processadores de IA customizados da Amazon estão começando a rivalizar seriamente com as soluções GPU padrão da NVIDIA no segmento empresarial. A Amazon desenvolve seus próprios chips de IA há vários anos.

O Trainium é otimizado para treinamento de redes neurais, o Inferentia—para sua inferência em produção. É precisamente nesses processadores que a Uber está transferindo parte de suas cargas de IA. Anteriormente, essas tarefas exigiam clusters de GPU padrão ou recursos computacionais de outros provedores de nuvem.

A AWS posiciona seu silício como uma alternativa mais barata para tarefas de inferência: com throughput comparável, o custo da inferência no Inferentia é menor do que no NVIDIA H100, o que é crítico para serviços de produção de alta frequência. A expansão do contrato é direcionada para cargas de IA em tempo real: algoritmos de correspondência de motoristas, previsão de demanda por distrito, precificação dinâmica, sistemas de detecção de fraude e filtros anti-abuso. Todos esses componentes exigem inferência contínua de modelos de ML com latência mínima.

A Uber processa essas cargas 24 horas por dia em dezenas de cidades simultaneamente, e o custo da inferência é uma das principais linhas no orçamento de nuvem da empresa. Reduzir essa linha em 20-30% significa dezenas de milhões de dólares em economias anuais. Para Google e Oracle, a notícia soa como um rebaixo público.

Ambas as empresas estão expandindo agressivamente sua infraestrutura de IA, atraindo clientes corporativos. O Google Cloud aposta na TPU de quarta geração e clusters A3 baseados em NVIDIA H100, a Oracle—em supercomputadores com A100/H100, posicionando-os como a infraestrutura de IA mais performática na nuvem. A escolha da Uber a favor da AWS com seus chips customizados é um sinal de que a economia da infraestrutura de IA está começando a funcionar a favor da Amazon.

Amazon Web Services continua sendo o maior provedor de nuvem com aproximadamente 30% de participação de mercado por receita. Mas a IA se tornou um novo campo de competição: clientes corporativos estão reconstruindo sua infraestrutura e procurando maneiras de reduzir custos de inferência. Cada grande transição para silício customizado da AWS é um sinal de mercado e um case de marketing para negociações com outras empresas.

Uber, nesse sentido, é uma história de demonstração ideal para a equipe de vendas da Amazon. Uber está entre as plataformas mais tecnicamente exigentes do mundo. A empresa processa milhões de corridas diariamente em 70+ países, gerencia Uber Eats e Uber Freight, e realiza programas de P&D em larga escala em direção autônoma.

Essa escala significa que qualquer escolha de plataforma é feita após análise técnica e financeira detalhada. Quando a Uber escolhe um determinado tipo de chip de IA, não é uma parceria de marketing—é uma decisão de engenharia com consequências multientenais. A expansão da parceria com AWS é uma evidência adicional de que a corrida pela infraestrutura de IA há muito saiu além do confronto familiar de NVIDIA versus todos os outros.

Amazon, Google e Microsoft estão construindo seus próprios processadores, e grandes empresas de tecnologia são forçadas a fazer uma escolha específica: qual silício formará a base de sua próxima geração de IA. A Uber escolheu a Amazon.

ZK
Hamidun News
Notícias de AI sem ruído. Seleção editorial diária de mais de 400 fontes. Produto de Zhemal Khamidun, Head of AI na Alpina Digital.

Quer parar de ler sobre IA e começar a usar?

AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.

O que você acha?
Carregando comentários…