DeepMind creó un mouse con AI basado en Gemini para que los usuarios no cambien a chats
Google DeepMind creó un prototipo experimental de un mouse inteligente que funciona con Gemini. Analiza el contexto visual y semántico alrededor del cursor, lo

Google DeepMind presentó un prototipo experimental de un ratón AI basado en Gemini que captura el contexto visual y semántico alrededor del cursor. Esto permite a los usuarios completar tareas a través del lenguaje natural y clics dirigidos, sin distraerse con ventanas separadas de AI.
Cómo ve el ratón AI
El ratón utiliza visión por computadora de Gemini para analizar lo que hay bajo el cursor: texto, imágenes, botones, elementos de la interfaz. Pero no es solo reconocimiento de imágenes. El sistema entiende no solo el contenido visual (lo que ves), sino también el contexto semántico (qué significa en el contexto de lo que está sucediendo). DeepMind publicó demostraciones experimentales de este enfoque y describió cuatro principios clave de interacción que forman la base del diseño de tal herramienta. Estos principios permiten que el ratón AI sea realmente útil, no solo un juguete experimental.
Por qué esta solución es mejor
El flujo de trabajo típico con AI requiere cambio de contexto. Necesitas ayuda — abres una ventana de chatbot separada, describes la tarea, copias el resultado, lo pegas de vuelta. Esto interrumpe tu trabajo y requiere explicación adicional. El ratón AI resuelve este problema radicalmente: el usuario simplemente habla, señala el ratón al lugar correcto, o realiza un clic dirigido, y el sistema entiende el contexto y ayuda directamente dentro de la aplicación actual. Es como si un asistente AI experimentado estuviera sentado a tu lado, viera toda la pantalla y pudiera actuar sin llamar la atención.
Otra ventaja es la curva de aprendizaje mínima. No necesitas aprender una nueva interfaz ni memorizar comandos. El comportamiento del ratón es intuitivo: señala y habla — obtén el resultado.
Lo que el ratón puede hacer
Los investigadores demostraron la aplicación del ratón AI a diversas tareas:
- Rellenar formularios web mediante comandos de voz
- Encontrar y extraer información del contenido visible en pantalla
- Automatizar la navegación por sitios web y aplicaciones
- Trabajar con tablas, estructurando y analizando datos
- Parafrasear texto, copiar con reformatación
- Verificar información y lógica en documentos
Cada uno de estos escenarios fue probado en vídeos de demostración. El ratón no requiere cambio de ventanas, lo que significa que el usuario se mantiene enfocado en la tarea.
Lo que significa
La frontera entre agentes AI de navegador (que completan tareas de forma totalmente autónoma) y asistentes AI (que ayudan a los humanos) se está difuminando. Google DeepMind muestra que en el futuro, el AI podría estar integrado aún más profundamente — no en una aplicación separada, sino directamente en las herramientas que las personas usan diariamente. Esta es investigación en etapa inicial y el prototipo tiene limitaciones. Pero si la tecnología madura e se integra en sistemas operativos o navegadores, podría cambiar significativamente cómo las personas interactúan con computadoras e IA simultáneamente.
"Sin cambio de contexto, el AI se vuelve no solo más útil, sino más natural."
Este enfoque puede ser el siguiente paso en la evolución de las interfaces de usuario, donde el AI no compite por atención sino que ayuda permaneciendo invisible.