Uber étend son contrat avec AWS et mise sur les puces d’Amazon face à Google et Oracle
Uber étend son contrat avec Amazon Web Services et transfère les charges AI clés de son service vers les puces personnalisées d’Amazon — Trainium et…
Traité par IA depuis TechCrunch ; édité par Hamidun News
Uber élargit son contrat avec AWS et parie sur les puces Amazon, contournant Google et Oracle
Uber élargit son contrat avec Amazon Web Services et transfère davantage de fonctions de son service vers des puces Amazon—une grande victoire pour AWS dans la concurrence avec Google Cloud et Oracle, qui convoitaient également ce marché. La décision du plus grand agrégateur de taxis au monde envoie un signal au marché : les processeurs d'IA personnalisés d'Amazon commencent à rivaliser sérieusement avec les solutions GPU standard de NVIDIA dans le segment entreprise. Amazon développe ses propres puces d'IA depuis plusieurs années.
Trainium est optimisé pour l'entraînement de réseaux de neurones, Inferentia—pour leur inférence en production. C'est précisément sur ces processeurs qu'Uber bascule une partie de ses charges d'IA. Auparavant, ces tâches nécessitaient des clusters GPU standard ou des ressources informatiques d'autres fournisseurs de cloud.
AWS positionne son silicium comme une alternative moins chère pour les tâches d'inférence : avec un débit comparable, le coût de l'inférence sur Inferentia est inférieur à celui du NVIDIA H100, ce qui est critique pour les services de production haute fréquence. L'élargissement du contrat vise les charges d'IA en temps réel : les algorithmes d'appairage des conducteurs, la prévision de la demande par district, la tarification dynamique, les systèmes de détection des fraudes et les filtres anti-abus. Tous ces composants nécessitent une inférence continue de modèles ML avec une latence minimale.
Uber traite ces charges 24 heures sur 24 dans des dizaines de villes simultanément, et le coût de l'inférence est l'un des principaux postes du budget cloud de l'entreprise. Réduire ce poste de 20-30 % signifie des dizaines de millions de dollars d'économies annuelles. Pour Google et Oracle, la nouvelle sonne comme un affront public.
Les deux entreprises élargissent agressivement leur infrastructure d'IA, attirant les clients d'entreprise. Google Cloud parie sur les TPU de quatrième génération et les clusters A3 basés sur NVIDIA H100, Oracle—sur les superordinateurs avec A100/H100, les positionnant comme l'infrastructure d'IA la plus performante du cloud. Le choix d'Uber en faveur d'AWS avec ses puces personnalisées est un signal que l'économie de l'infrastructure d'IA commence à fonctionner en faveur d'Amazon.
Amazon Web Services reste le plus grand fournisseur de cloud avec environ 30 % de part de marché par chiffre d'affaires. Mais l'IA est devenue un nouveau domaine de concurrence : les clients d'entreprise reconstruisent leur infrastructure et cherchent des moyens de réduire les coûts d'inférence. Chaque transition majeure vers le silicium personnalisé d'AWS est un signal de marché et un cas marketing pour les négociations avec d'autres entreprises.
Uber, en ce sens, est une histoire de démonstration idéale pour l'équipe commerciale d'Amazon. Uber fait partie des plates-formes les plus techniquement exigeantes au monde. L'entreprise traite des millions de trajets quotidiennement dans 70+ pays, gère Uber Eats et Uber Freight, et mène des programmes de R&D à grande échelle dans le domaine de la conduite autonome.
Cette échelle signifie que tout choix de plateforme est effectué après une analyse technique et financière détaillée. Lorsqu'Uber choisit un certain type de puce d'IA, ce n'est pas un partenariat marketing—c'est une décision d'ingénierie avec des conséquences pluriannuelles. L'élargissement du partenariat avec AWS est une nouvelle preuve que la course à l'infrastructure d'IA a depuis longtemps dépassé l'affrontement familier entre NVIDIA et tous les autres.
Amazon, Google et Microsoft construisent leurs propres processeurs, et les grandes entreprises technologiques sont obligées de faire un choix spécifique : quel silicium formera la base de leur prochaine génération d'IA. Uber a choisi Amazon.
Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?
AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.