TechCrunch→ original

Uber amplía su contrato con AWS y apuesta por chips de Amazon frente a Google y Oracle

Uber amplía su contrato con Amazon Web Services y traslada cargas clave de AI de su servicio a los chips personalizados de Amazon — Trainium e Inferentia. Es…

Procesado por IA desde TechCrunch; editado por Hamidun News
Uber amplía su contrato con AWS y apuesta por chips de Amazon frente a Google y Oracle
Fuente: TechCrunch. Collage: Hamidun News.
◐ Escuchar artículo

Uber amplía contrato con AWS y apuesta por chips Amazon, bordeando Google y Oracle

Uber está ampliando su contrato con Amazon Web Services y trasladando más funciones de su servicio a chips Amazon—una gran victoria de AWS en la competencia con Google Cloud y Oracle, que también competían por este negocio. La decisión del mayor agregador de taxis del mundo señala al mercado: los procesadores de IA personalizados de Amazon están empezando a rivalizar seriamente con las soluciones estándar de GPU de NVIDIA en el segmento empresarial. Amazon lleva varios años desarrollando sus propios chips de IA.

Trainium está optimizado para el entrenamiento de redes neuronales, Inferentia—para su inferencia en producción. Es precisamente en estos procesadores donde Uber está trasladando parte de sus cargas de IA. Anteriormente, estas tareas requerían clusters de GPU estándar o recursos computacionales de otros proveedores de nube.

AWS posiciona su silicio como una alternativa más económica para tareas de inferencia: con rendimiento comparable, el costo de la inferencia en Inferentia es menor que en NVIDIA H100, lo cual es crítico para servicios de producción de alta frecuencia. La ampliación del contrato se orienta a cargas de IA en tiempo real: algoritmos de emparejamiento de conductores, previsión de demanda por distrito, precios dinámicos, sistemas de detección de fraude y filtros contra abusos. Todos estos componentes requieren inferencia continua de modelos de ML con latencia mínima.

Uber procesa estas cargas las 24 horas del día en docenas de ciudades simultáneamente, y el costo de la inferencia es una de las líneas clave en el presupuesto de nube de la empresa. Reducir esta línea en un 20-30% significa decenas de millones de dólares en ahorros anuales. Para Google y Oracle, la noticia suena como un reproche público.

Ambas empresas están ampliando agresivamente su infraestructura de IA, atrayendo clientes empresariales. Google Cloud apuesta por TPU de cuarta generación y clusters A3 basados en NVIDIA H100, Oracle—por supercomputadores con A100/H100, posicionándolos como la infraestructura de IA más potente en la nube. La elección de Uber a favor de AWS con sus chips personalizados es una señal de que la economía de la infraestructura de IA está comenzando a funcionar a favor de Amazon.

Amazon Web Services sigue siendo el mayor proveedor de nube con aproximadamente el 30% de participación de mercado por ingresos. Pero la IA se ha convertido en un nuevo campo de competencia: los clientes empresariales están reconstruyendo su infraestructura y buscando formas de reducir los costos de inferencia. Cada transición importante al silicio personalizado de AWS es una señal de mercado y un caso de marketing para negociaciones con otras empresas.

Uber, en este sentido, es una historia de demostración ideal para el equipo de ventas de Amazon. Uber se encuentra entre las plataformas más técnicamente exigentes del mundo. La empresa procesa millones de viajes diariamente en 70+ países, gestiona Uber Eats y Uber Freight, y realiza programas de I+D a gran escala en conducción autónoma.

Esta escala significa que cualquier elección de plataforma se toma después de un análisis técnico y financiero detallado. Cuando Uber elige un cierto tipo de chip de IA, no es una asociación de marketing—es una decisión de ingeniería con consecuencias multientenales. La expansión de la asociación con AWS es una evidencia adicional de que la carrera por la infraestructura de IA ha trascendido hace mucho el enfrentamiento familiar de NVIDIA contra todos los demás.

Amazon, Google y Microsoft están construyendo sus propios procesadores, y las grandes empresas tecnológicas se ven obligadas a tomar una elección específica: qué silicio formará la base de su próxima generación de IA. Uber eligió Amazon.

ZK
Hamidun News
Noticias de AI sin ruido. Selección editorial diaria de más de 400 fuentes. Producto de Zhemal Khamidun, Head of AI en Alpina Digital.

¿Quieres dejar de leer sobre IA y empezar a usarla?

AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.

¿Qué te parece?
Cargando comentarios…