Gemini entra en modo agente: anuncios de Google en I/O 2026
En la conferencia I/O 2026, Google presentó una nueva visión de Gemini como un agente completo, capaz de ejecutar por sí solo tareas complejas en Workspace, el

En la conferencia anual Google I/O 2026, Sundar Pichai anunció la transición hacia la era de los agentes Gemini — asistentes de IA que ejecutarán independientemente tareas complejas en navegadores, aplicaciones y servicios de Google.
Qué son los agentes Gemini
La nueva generación de Gemini ya no es simplemente un chatbot que responde preguntas. Es un agente completo, capaz de ver la pantalla, tomar decisiones y ejecutar operaciones multietapa. Cuando le das una tarea como "réservame un vuelo para el próximo martes", el agente navega por el navegador por su cuenta, verifica horarios, compara precios y completa la compra.
Esta funcionalidad se extiende más allá de la web. Las versiones agentivas de Gemini están integradas en Android, Google Workspace (Gmail, Docs, Sheets, Slides) e incluso en la búsqueda. En Gmail, el agente puede ordenar correos electrónicos, compilar resúmenes breves de conversaciones y responder a solicitudes estándar. En Sheets — crear gráficos basados en datos, rellenar automáticamente celdas, encontrar patrones. En Docs — refactorizar texto, buscar contradicciones, mejorar la legibilidad.
Bajo el capó, esto funciona gracias a mejoras significativas en la capacidad de Gemini para interpretar píxeles en pantalla y generar acciones significativas. El modelo se ha vuelto más preciso en su lógica y menos propenso a errores aleatorios.
Ejemplos de uso
Para las empresas, las posibilidades dentro de Workspace son particularmente interesantes. Supongamos que necesitas preparar un informe trimestral: el agente toma datos de analítica, los inserta en una hoja de cálculo, dibuja gráficos, escribe conclusiones. Una tarea que tomaría dos horas se completará en minutos.
Consideremos varios escenarios específicos:
- Poblamiento automático de CRM basado en correos electrónicos entrantes
- Construcción de presentaciones por plantilla con tus datos
- Análisis de grandes conjuntos de datos e identificación de tendencias
- Formato de documentos con la estructura y plantillas requeridas
- Transformación de contenido entre formatos
Por ejemplo, el departamento de marketing puede usar el agente para recopilar métricas de diferentes sistemas, analizarlas y crear estadísticas. RRHH podrá automatizar el procesamiento de solicitudes de tiempo libre, actualizar rápidamente registros de empleados. Los ingenieros podrán asignar al agente la escritura de pruebas unitarias basadas en código fuente.
Dónde puede haber obstáculos
Por supuesto, Google no oculta que estas son las primeras versiones. El agente puede cometer un error si encuentra una interfaz no estándar o una página que requiere CAPTCHA. A veces, el resultado difiere ligeramente de lo que el usuario imaginaba. Por lo tanto, en operaciones críticas — por ejemplo, al procesar grandes transacciones monetarias — todavía se necesita supervisión humana.
Además, está la cuestión de la confidencialidad. El agente ve toda la pantalla, incluyendo datos privados. Google asegura que todo se cifra y se procesa de acuerdo con la política de privacidad, pero los departamentos de TI corporativos aún necesitan verificar esto. También existe la cuestión de compatibilidad: no todos los sitios web y aplicaciones están dispuestos a informar al agente del navegador sobre su estructura. Algunos pueden interpretar la actividad del agente como insegura y bloquearla.
Lo que esto significa
Este es un momento decisivo para la IA. Anteriormente, las redes neuronales ayudaban a los humanos (sugerencias, edición, búsqueda), pero ahora pueden actuar de forma relativamente independiente. Esto abre un enorme potencial para automatizar trabajo rutinario. Pero también requerirá que las empresas reconsideren sus procesos y fortalezcan el control de datos.