Wired→ original

Gemini ahora pide un taxi y ordena comida en tu smartphone

Google dio un paso importante para convertir Gemini en un agente móvil completo. Empezando por el Samsung Galaxy S26, el asistente puede realizar tareas por…

Procesado por IA desde Wired; editado por Hamidun News
Gemini ahora pide un taxi y ordena comida en tu smartphone
Fuente: Wired. Collage: Hamidun News.
◐ Escuchar artículo

Gemini Ahora Llamará a un Taxi y Pedirá Comida en tu Smartphone

Durante años, los asistentes de voz nos han prometido un futuro en el que una simple orden hablada haría que tu teléfono lo hiciera todo. En la práctica, este futuro se reducía a establecer un temporizador y consultar el pronóstico del tiempo. Google parece haber decidido finalmente cerrar la brecha entre promesas y realidad. La empresa anunció que Gemini —su asistente de IA insignia— ahora es capaz de ejecutar de forma independiente acciones en aplicaciones móviles de terceros. Llamar a un Uber, pedir comida a través de DoorDash, realizar una compra —todo sin un solo toque del usuario. El primer dispositivo que admitirá la nueva función es el Samsung Galaxy S26.

Para entender el alcance de este anuncio, debemos recordar el contexto. Durante el último año y medio, la industria ha estado obsesionada con el concepto de "agentes de IA" — sistemas que no solo generan texto o responden preguntas, sino que realizan acciones en el mundo real en nombre del usuario. OpenAI está experimentando con Operator, Anthropic está probando Computer Use para Claude, Apple está ampliando las capacidades de Siri a través de Apple Intelligence. Pero Google se encontró en una posición única: la empresa controla Android —un sistema operativo instalado en miles de millones de dispositivos— e integrar capacidades de agentes a nivel de plataforma, en lugar de encima de ella.

Técnicamente, Gemini utiliza una combinación de varios enfoques. El asistente "ve" interfaces de aplicaciones a través de puentes API especiales y el sistema de accesibilidad de Android, comprende la estructura de la pantalla y puede navegarla como lo haría un humano —haciendo clic en botones, rellenando campos, confirmando pedidos. En una demostración en vivo mostrada a periodistas de Wired, el proceso se veía sorprendentemente suave: un usuario decía algo como "llámame un Uber al aeropuerto" y Gemini abría la aplicación, seleccionaba una ruta, elegía el tipo de viaje y llevaba el pedido hasta la etapa de confirmación.

La confirmación final —hacer clic en el botón de pago— sigue siendo responsabilidad del humano por ahora, lo que parece una medida de seguridad razonable en esta etapa inicial.

La elección del Samsung Galaxy S26 como plataforma de lanzamiento no es accidental. Google y Samsung han estado profundizando su asociación durante varios años: Galaxy AI, desarrollos conjuntos en capacidades generativas, acceso privilegiado a las últimas funciones de Android. Para Samsung, esto es una ventaja competitiva sobre otros fabricantes de Android. Para Google, es una oportunidad para probar la funcionalidad de agentes con una audiencia premium que muy probablemente esté usando exactamente las aplicaciones con las que Gemini está integrado. Es probable que en los próximos meses, la función se extienda a otros buques insignia y luego a una gama más amplia de dispositivos.

Pero la pregunta principal no es técnica, sino relacionada con el ecosistema. Para que un agente sea verdaderamente útil, necesita acceso a decenas y cientos de aplicaciones, y los desarrolladores de esas aplicaciones deben estar preparados para tal interacción. Uber y DoorDash son socios escaparatistas, casos de demostración.

El valor real llegará cuando Gemini pueda trabajar con aplicaciones bancarias, mensajeros, servicios de reserva y mercados. Aquí hay un equilibrio delicado de intereses: los desarrolladores de aplicaciones han pasado años construyendo sus interfaces para maximizar el tiempo del usuario, mostrar anuncios e impulsar compras impulsivas. Un agente de IA que salta todas estas capas en segundos amenaza sus modelos comerciales.

Google tendrá que negociar con cada servicio importante o crear una plataforma tan atractiva para los desarrolladores que ellos mismos quieran integrarse.

Y existe la cuestión de la confianza. Darle a la IA la capacidad de gastar tu dinero es un nivel fundamentalmente diferente de interacción en comparación con pedirle que escriba una carta o encuentre información. Un error en la generación de texto cuesta unos segundos. Un error al pedir un taxi o pagar la cena cuesta dinero real. Google, según la demostración, entiende esto — de ahí el requisito de confirmación manual de transacciones. Pero a medida que los usuarios se acostumbren a los agentes, la presión hacia la automatización total aumentará.

Este anuncio marca un cambio importante en la industria de la tecnología móvil. El smartphone deja de ser un dispositivo que controlas y comienza a convertirse en un dispositivo que gestiona tareas por ti. Google ha dado el primer paso público en esta dirección en el mercado masivo. Ahora todos los ojos están puestos en Apple y su WWDC: ¿podrá Siri responder con algo comparable, o se hará aún más notable la brecha entre los dos ecosistemas? Una cosa está clara ya — la era de los asistentes de IA que solo hablan está llegando a su fin. La era de los asistentes que actúan está comenzando.

ZK
Hamidun News
Noticias de AI sin ruido. Selección editorial diaria de más de 400 fuentes. Producto de Zhemal Khamidun, Head of AI en Alpina Digital.

¿Quieres dejar de leer sobre IA y empezar a usarla?

AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.

¿Qué te parece?
Cargando comentarios…