Uber y OpenAI implementan asistentes AI y solicitud de viajes por voz para conductores y pasajeros
Uber amplía el uso de OpenAI en su app: para los conductores, la empresa lanzó un asistente AI con sugerencias sobre ingresos y navegación dentro de la platafor

Uber expande su colaboración con OpenAI: la empresa ha integrado herramientas de IA para dos públicos clave simultáneamente — conductores y pasajeros. Para unos, son sugerencias sobre dónde y cuándo es más rentable trabajar; para otros, reserva de viajes más rápida por voz directamente en la aplicación.
Asistente para Conductores
Uber opera un mercado masivo y en constante cambio: según la empresa, el servicio procesa aproximadamente 40 millones de viajes al día, reúne 10 millones de conductores y repartidores y opera en 15 mil ciudades en más de 70 países. En ese sistema, un conductor necesita tomar docenas de pequeñas decisiones sobre la marcha. Uber utiliza modelos de OpenAI para transformar este flujo de señales en recomendaciones cortas y claras, en lugar de dejar a la persona sola con gráficos y mapas de calor.
El producto principal aquí es Uber Assistant, un asistente de IA para conductores y repartidores. Acompaña al usuario en todo su recorrido dentro de la plataforma: desde la incorporación y primeros viajes hasta la optimización diaria de ganancias. Un conductor puede hacer una pregunta en lenguaje natural y obtener una respuesta sin necesidad de entender la lógica interna compleja del marketplace.
Esencialmente, Uber está intentando reducir la carga cognitiva: menos tiempo interpretando datos, más tiempo en pedidos reales. Según OpenAI, el acceso a la versión beta ya ha sido proporcionado a cientos de miles de conductores en EE.UU.
- Sugerencias sobre dónde estar en este momento
- Comparación de escenarios: viajes, entrega, aeropuerto
- Explicación de por qué las ganancias de hoy difieren de las de ayer
- Ayuda para nuevos conductores al principio
Arquitectura de Confianza y Velocidad
Para Uber no es suficiente simplemente proporcionar una respuesta plausible. Si la sugerencia de ganancias es inexacta y la interfaz es lenta, un usuario rápidamente dejará de confiar en el sistema. Por eso la empresa construyó una arquitectura multiagente: diferentes tipos de solicitudes se dirigen a diferentes circuitos especializados.
Las preguntas sobre incorporación, ganancias, recomendaciones de posicionamiento y acciones transaccionales se procesan de manera diferente, teniendo en cuenta el contexto y los requisitos de precisión. Esto es particularmente crítico en una aplicación donde se necesita una decisión en segundos. Una capa separada dentro de este esquema es AI Guard, un nivel interno de gestión que verifica sugerencias y respuestas para cumplimiento de políticas de seguridad, privacidad y calidad.
Para tareas simples y rápidas, Uber usa modelos más ligeros, mientras que para tareas complejas usa modelos de razonamiento con análisis más profundo. Este enfoque es necesario no por elegancia arquitectónica, sino por razones prácticas: la latencia mínima en una aplicación móvil y las respuestas predecibles importan más que demostrar la "magia" de IA.
"Si los usuarios no confían en el sistema, los pierdes muy rápidamente."
Reserva de Viajes por Voz
La segunda parte notable del proyecto son escenarios de voz para pasajeros. En lugar de hacer clic paso a paso en los menús, un usuario puede tocar el icono del micrófono en la barra de búsqueda y describir la situación en lenguaje natural. Por ejemplo, decir que necesita un traslado al aeropuerto, con equipaje y varios compañeros de viaje.
El sistema interpreta la intención, considera direcciones guardadas y contexto del cliente, y luego ofrece una opción de viaje adecuada y sincroniza la respuesta de voz y visual. Para Uber esto no es solo conveniencia, sino una forma de hacer el servicio más accesible. La voz es especialmente importante para las personas que encuentran incómodo trabajar con la pantalla durante mucho tiempo: usuarios mayores, personas con discapacidades visuales o aquellos que simplemente quieren resolver la tarea más rápido.
Del lado de los conductores, estas interfaces también son útiles: menos acciones manuales en la aplicación, más oportunidad de interactuar con el servicio sin distraerse escribiendo. La empresa aclara que la Reserva por Voz se implementará gradualmente en las próximas semanas.
Lo Que Esto Significa
La asociación entre Uber y OpenAI muestra cómo la IA generativa está pasando del modo de demostración a productos operacionales con requisitos estrictos de velocidad, seguridad y beneficio. Aquí la IA no "escribe textos", sino que ayuda a tomar decisiones en tiempo real dentro de un enorme marketplace. Si el despliegue resulta exitoso, lógica similar aparecerá rápidamente en otros servicios donde necesites trabajar simultáneamente con logística, demanda, comportamiento del usuario e interfaces de voz.