Uber amplia contrato com a AWS e aposta em chips da Amazon, preterindo Google e Oracle
Uber amplia o contrato com a Amazon Web Services e migra cargas críticas de AI do seu serviço para os chips customizados da Amazon — Trainium e Inferentia. É…
Processado por IA de TechCrunch; editado por Hamidun News
Uber expande contrato com AWS e aposta em chips Amazon, contornando Google e Oracle
Uber está expandindo seu contrato com Amazon Web Services e transferindo mais funções de seu serviço para chips Amazon—uma grande vitória da AWS na competição com Google Cloud e Oracle, que também disputavam esse negócio. A decisão do maior agregador de táxi do mundo sinaliza para o mercado: os processadores de IA customizados da Amazon estão começando a rivalizar seriamente com as soluções GPU padrão da NVIDIA no segmento empresarial. A Amazon desenvolve seus próprios chips de IA há vários anos.
O Trainium é otimizado para treinamento de redes neurais, o Inferentia—para sua inferência em produção. É precisamente nesses processadores que a Uber está transferindo parte de suas cargas de IA. Anteriormente, essas tarefas exigiam clusters de GPU padrão ou recursos computacionais de outros provedores de nuvem.
A AWS posiciona seu silício como uma alternativa mais barata para tarefas de inferência: com throughput comparável, o custo da inferência no Inferentia é menor do que no NVIDIA H100, o que é crítico para serviços de produção de alta frequência. A expansão do contrato é direcionada para cargas de IA em tempo real: algoritmos de correspondência de motoristas, previsão de demanda por distrito, precificação dinâmica, sistemas de detecção de fraude e filtros anti-abuso. Todos esses componentes exigem inferência contínua de modelos de ML com latência mínima.
A Uber processa essas cargas 24 horas por dia em dezenas de cidades simultaneamente, e o custo da inferência é uma das principais linhas no orçamento de nuvem da empresa. Reduzir essa linha em 20-30% significa dezenas de milhões de dólares em economias anuais. Para Google e Oracle, a notícia soa como um rebaixo público.
Ambas as empresas estão expandindo agressivamente sua infraestrutura de IA, atraindo clientes corporativos. O Google Cloud aposta na TPU de quarta geração e clusters A3 baseados em NVIDIA H100, a Oracle—em supercomputadores com A100/H100, posicionando-os como a infraestrutura de IA mais performática na nuvem. A escolha da Uber a favor da AWS com seus chips customizados é um sinal de que a economia da infraestrutura de IA está começando a funcionar a favor da Amazon.
Amazon Web Services continua sendo o maior provedor de nuvem com aproximadamente 30% de participação de mercado por receita. Mas a IA se tornou um novo campo de competição: clientes corporativos estão reconstruindo sua infraestrutura e procurando maneiras de reduzir custos de inferência. Cada grande transição para silício customizado da AWS é um sinal de mercado e um case de marketing para negociações com outras empresas.
Uber, nesse sentido, é uma história de demonstração ideal para a equipe de vendas da Amazon. Uber está entre as plataformas mais tecnicamente exigentes do mundo. A empresa processa milhões de corridas diariamente em 70+ países, gerencia Uber Eats e Uber Freight, e realiza programas de P&D em larga escala em direção autônoma.
Essa escala significa que qualquer escolha de plataforma é feita após análise técnica e financeira detalhada. Quando a Uber escolhe um determinado tipo de chip de IA, não é uma parceria de marketing—é uma decisão de engenharia com consequências multientenais. A expansão da parceria com AWS é uma evidência adicional de que a corrida pela infraestrutura de IA há muito saiu além do confronto familiar de NVIDIA versus todos os outros.
Amazon, Google e Microsoft estão construindo seus próprios processadores, e grandes empresas de tecnologia são forçadas a fazer uma escolha específica: qual silício formará a base de sua próxima geração de IA. A Uber escolheu a Amazon.
Quer parar de ler sobre IA e começar a usar?
AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.