The Verge→ original

Gemini aprendió a pedir comida y un taxi por ti

Google lanzó las funciones agénticas de Gemini en la actualización de marzo de Pixel 10. Ahora el asistente de AI puede realizar tareas por su cuenta en…

Procesado por IA desde The Verge; editado por Hamidun News
Gemini aprendió a pedir comida y un taxi por ti
Fuente: The Verge. Collage: Hamidun News.
◐ Escuchar artículo

Google hizo lo que la industria ha estado hablando durante el último año y medio: convirtió un modelo de lenguaje de un compañero conversacional en un ejecutor de acciones. La actualización de marzo para la línea Pixel 10 otorga a Gemini la capacidad de actuar independientemente dentro de aplicaciones — pidiendo productos, pidiendo taxis y realizando otras tareas rutinarias sin participación constante del usuario.

La idea misma de IA agentiva — un sistema que no solo responde preguntas sino que realiza acciones en el mundo real — se ha convertido en la tendencia principal de 2025. OpenAI se movió en esta dirección con Operator, Anthropic experimentó con Computer Use, y Apple expandió silenciosamente las capacidades de Siri. Pero Google resultó ser el primero en integrar funciones de agente completas directamente en el sistema operativo de un smartphone de mercado masivo. Esto no es un prototipo de investigación ni una versión beta para desarrolladores — es una actualización que se está implementando ahora en Pixel 10, Pixel 10 Pro y Pixel 10 Pro XL.

Técnicamente, todo funciona de la siguiente manera. El usuario le pide a Gemini que realice una tarea — por ejemplo, pedir alimentos para la cena o llamar un automóvil al aeropuerto. El asistente abre la aplicación necesaria, ya sea Grubhub o Uber, e interactúa con su interfaz: haciendo clic en botones, completando campos, seleccionando opciones. Todo esto sucede en segundo plano mientras el propietario del teléfono va sobre sus asuntos — desplazándose por las redes, respondiendo mensajes o simplemente guardando el teléfono en el bolsillo. Al mismo tiempo, Google enfatiza que el usuario mantiene control total: puede ver en cualquier momento qué está haciendo el asistente, ajustar sus acciones o detener el proceso completamente.

Un detalle importante — por ahora la lista de aplicaciones compatibles es limitada. Google usa la frase "aplicaciones seleccionadas", lo que sugiere integración personalizada en lugar de una solución universal. Esto tiene sentido desde una perspectiva de seguridad: antes de permitir que la IA gaste dinero real del usuario, debe asegurarse de que funcione correctamente con una interfaz específica. Grubhub y Uber se convirtieron en los primeros socios, pero es evidente que esta lista se expandirá. Curiosamente, Google demostró esta función por primera vez no en su propio evento, sino en Samsung Unpacked, lo que demuestra el deseo de la empresa de posicionar Gemini como una solución de plataforma para todo el ecosistema Android.

Para la industria, este es un momento crucial. Hasta ahora, los asistentes de voz en smartphones siguieron siendo esencialmente motores de búsqueda avanzados con un conjunto de comandos preestablecidos. Configura un temporizador, reproduce música, llama a mamá — ese es el alcance completo. Las capacidades agentivas de Gemini cambian fundamentalmente este paradigma. El asistente ya no espera instrucciones claras — interpreta la intención y encuentra la manera de cumplirla. La diferencia entre "encuentra el restaurante más cercano" y "pídeme comida" es la diferencia entre una guía de referencia y un asistente personal.

Sin embargo, quedan preguntas serias. ¿Cómo manejará el sistema los errores? ¿Qué sucederá si Gemini pide el producto incorrecto o selecciona la dirección de entrega incorrecta? ¿Quién es responsable de las transacciones financieras realizadas por IA en nombre del usuario? Google aún no ha proporcionado respuestas exhaustivas, limitándose a garantías sobre el control total del usuario. Es probable que inicialmente el asistente solicite confirmación antes de realizar pagos, pero a medida que crece la confianza, estas barreras pueden reducirse.

También hay un aspecto competitivo. La exclusividad de la función para Pixel 10 es tanto un movimiento de marketing como una limitación técnica. Las capacidades agentivas requieren recursos computacionales serios, y el nuevo chip Tensor G5 aparentemente juega un papel clave. Pero estratégicamente, Google no puede permitirse mantener esta función solo en Pixel. Samsung, Xiaomi, OnePlus — todos los principales fabricantes de smartphones Android están esperando cuándo estas capacidades estarán disponibles a través de Google Play Services. Y probablemente sea cuestión de meses, no de años.

La actualización de marzo de Pixel no es solo un conjunto de nuevas funciones. Es el primer paso hacia un modelo de interacción con smartphones donde las aplicaciones dejan de ser lo que abre el usuario y se convierten en lo que gestiona la IA. Si Google logra escalar esta tecnología y mantener la confianza del usuario, podemos ser testigos del cambio más significativo en UX móvil desde la aparición de las tiendas de aplicaciones.

ZK
Hamidun News
Noticias de AI sin ruido. Selección editorial diaria de más de 400 fuentes. Producto de Zhemal Khamidun, Head of AI en Alpina Digital.

¿Quieres dejar de leer sobre IA y empezar a usarla?

AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.

¿Qué te parece?
Cargando comentarios…