3DNews AI→ оригинал

Google Gemini 3.5 Flash научился управлять компьютером вместо пользователя

Google добавила в Gemini 3.5 Flash функцию Computer Use — теперь модель управляет компьютером вместо пользователя: кликает по экрану, заполняет формы…

AI-обработка оригинала 3DNews AI; редакция Hamidun News
Google Gemini 3.5 Flash научился управлять компьютером вместо пользователя
Источник: 3DNews AI. Коллаж: Hamidun News.
◐ Слушать статью

Google Gemini 3.5 Flash получила функцию Computer Use — возможность автономно управлять компьютером: нажимать кнопки, заполнять формы, переключаться между приложениями и выполнять многошаговые задачи без участия человека. Google позиционирует её как корпоративный инструмент для автоматизации операционных процессов, доступный через облачную платформу Vertex AI.

Как работает управление компьютером

Принцип похож на работу оператора за экраном: модель получает снимок экрана, анализирует интерфейс, определяет следующее действие — клик, ввод текста, прокрутка страницы — и повторяет цикл до выполнения задачи. Gemini 3.5 Flash видит экран так же, как человек, но действует быстрее и без усталости.

Выбор именно Flash-версии не случаен: это самая быстрая модель в линейке Gemini 3.5. Для агентных задач с длинными цепочками последовательных действий скорость реакции критична — медленный агент накапливает задержки с каждым шагом, и сценарии вроде автоматизации десятков форм превращаются в многочасовые процессы.

Flash решает эту проблему за счёт низкой латентности. Среди заявленных возможностей: Навигация в браузере и работа с веб-формами Управление приложениями рабочего стола через GUI Многошаговое выполнение задач без вмешательства пользователя Работа через Vertex AI с корпоративным контролем доступа * Логирование действий для аудита и соответствия требованиям безопасности ## Для кого это и как получить доступ Google разделяет два направления развития Gemini. Первое — глубокая интеграция с Workspace: умный ассистент в Gmail, Docs, Sheets и Slides, который помогает широкой аудитории без специальных технических знаний.

Второе — агентные возможности для корпоративного сектора, к которым Computer Use и относится. Функция доступна через Vertex AI — корпоративную облачную платформу Google. Компании смогут встроить агента в собственные процессы: автоматизировать работу с legacy-системами без API, делегировать рутинные браузерные операции финансовым или HR-командам, строить внутренние инструменты на базе Gemini с централизованным управлением и логированием.

Важно понимать, что Computer Use — это не просто «автоматический кликер». Речь идёт о полноценном агентном сценарии, где модель самостоятельно планирует цепочку шагов и адаптируется к результатам: если страница загрузилась с задержкой или появился неожиданный pop-up — агент это видит и реагирует.

Конкуренция за управление экраном

Рынок AI-агентов, работающих с компьютерными интерфейсами, за последний год стал значительно конкурентнее. Anthropic выпустила Claude Computer Use в октябре 2024 года, OpenAI запустила Operator в начале 2025-го, Microsoft интегрировала агентные сценарии в Copilot Studio для Azure. Теперь к ним присоединяется Google со своей реализацией на базе одной из быстрейших моделей. Конкуренция разворачивается по нескольким осям: точность распознавания интерфейса, скорость выполнения цепочек действий, безопасность и возможность корпоративного аудита. У Google есть структурное преимущество, которого нет у конкурентов: Gemini работает в экосистеме, где уже развёрнуты Gmail, Drive и Calendar. Агент, который одновременно видит экран и имеет нативный доступ к корпоративным данным через API, получает принципиально другой уровень контекста — без дополнительной загрузки в промпт.

«Мы строим AI, который не просто отвечает на вопросы, а выполняет работу», — такова общая позиция

Google относительно стратегии Gemini как агентной платформы.

Что это значит

Управление компьютером переходит из разряда экспериментальных возможностей в стандартную продуктовую функцию у всех крупных AI-провайдеров. Для бизнеса это реальная автоматизация операционных задач уже сейчас — без переписывания legacy-систем, без разработки API-интеграций под каждый сценарий и без привлечения разработчиков для базовой автоматизации. Вопрос уже не «будет ли это работать», а «кто внедрит быстрее».

ЖХ
Hamidun News
AI‑новости без шума. Ежедневный редакторский отбор из 400+ источников. Продукт Жемала Хамидуна, Head of AI в Alpina Digital.

Хотите не читать про ИИ, а внедрить его?

«AI News» — это полезные новости из мира ИИ. Системно научиться работать с нейросетями и применять их в работе — в Hamidun Academy.

Что вы думаете?
Загружаем комментарии…