DeepMind создала AI-мышь на Gemini, чтобы пользователи не переключались на чаты

Google DeepMind создала экспериментальный прототип умной мышки, которая работает на Gemini. Она анализирует визуальный и семантический контекст вокруг…

ЖХ

Редакция Hamidun News

AI‑мониторинг · MarkTechPost

17 мая 2026 г.· 3 мин

AI-обработка оригинала MarkTechPost; редакция Hamidun News

DeepMind создала AI-мышь на Gemini, чтобы пользователи не переключались на чаты — Источник: MarkTechPost. Коллаж: Hamidun News.

◐ Слушать статью

Google DeepMind представила экспериментальный прототип AI-мышки на основе Gemini, которая захватывает визуальный и семантический контекст вокруг курсора. Это позволяет пользователям выполнять задачи через естественную речь и целевые клики, не отвлекаясь на отдельные AI-окна.

Как видит AI-мышь

Мышь использует компьютерное зрение Gemini для анализа того, что находится под курсором: текст, изображения, кнопки, элементы интерфейса. Но это не просто распознавание изображения. Система понимает не только визуальное содержание (что видно), но и семантический контекст (что это означает в контексте происходящего). DeepMind опубликовала экспериментальные демонстрации этого подхода и описала четыре ключевых принципа взаимодействия, которые лежат в основе дизайна такого инструмента. Эти принципы позволяют AI-мышке быть действительно полезной, а не просто экспериментальной игрушкой.

Почему это решение лучше Обычный поток работы с AI требует переключения контекста.

Вам нужна помощь — открываете отдельное окно чатбота, описываете задачу, копируете результат, вставляете его обратно. Это прерывает работу и требует дополнительных объяснений. AI-мышь решает эту проблему радикально: пользователь просто говорит, указывает мышью на нужное место, или делает целевой клик, а система понимает контекст и помогает прямо внутри текущего приложения. Это как если бы опытный AI-помощник сидел рядом с вами, видел весь экран и мог действовать, не привлекая внимание. Ещё одно преимущество — минимум изучения. Не нужно учить новый интерфейс или запоминать команды. Поведение мышки интуитивно: указываешь и говоришь — получаешь результат.

Что может делать мышь

Исследователи показали применение AI-мышки к различным задачам: Заполнение веб-форм по голосовым командам Поиск и извлечение информации с видимого на экране содержимого Автоматизация навигации по сайтам и приложениям Работа с таблицами, структурированием и анализом данных Перефразирование текста, копирование с переформатированием Проверка информации и логики в документах Каждый из этих сценариев был протестирован на демо-видео. Мышь не требует переключения окон, а значит, пользователь остаётся сосредоточен на задаче.

Что это значит

Граница между браузерными AI-агентами (которые выполняют задачи полностью самостоятельно) и AI-ассистентами (которые помогают человеку) размывается. Google DeepMind показывает, что в будущем AI может быть встроена ещё глубже — не в отдельное приложение, а прямо в инструменты, которыми люди пользуются ежедневно. Это раннее исследование, и прототип имеет ограничения. Но если технология будет доведена до зрелости и интегрирована в операционные системы или браузеры, это может существенно изменить, как люди взаимодействуют с компьютерами и AI одновременно.

«Без переключения контекста AI становится не просто полезнее, а естественнее».

Такой подход может быть следующим шагом эволюции пользовательских интерфейсов, где AI не конкурирует за внимание, а помогает, оставаясь невидимым.

ЖХ

Hamidun News

AI‑новости без шума. Ежедневный редакторский отбор из 400+ источников. Продукт Жемала Хамидуна, Head of AI в Alpina Digital.

Telegram-канал RSS hamidun.com

Хотите не читать про ИИ, а внедрить его?

«AI News» — это полезные новости из мира ИИ. Системно научиться работать с нейросетями и применять их в работе — в Hamidun Academy.

🎓 Academy — 7 дней бесплатно Бесплатная консультация

Главное из мира ИИ — раз в неделю

7 ключевых событий недели, отобранных вручную. Без шума, репостов и пресс-релизов.

Готово! Проверьте почту — мы отправили подтверждение.