3DNews AI→ оригинал

Google Gemini: ваш смартфон теперь официально принадлежит нейросети

Google готовит Gemini к роли полноценного агента, способного управлять интерфейсом вашего смартфона. В коде приложения обнаружили функции Project Astra — той са

Google Gemini: ваш смартфон теперь официально принадлежит нейросети
Источник: 3DNews AI. Коллаж: Hamidun News.

Помните то чувство, когда вы просили Google Assistant поставить таймер, а он вместо этого открывал поиск по фразе «поставь таймер»? Кажется, эпоха этой очаровательной беспомощности подходит к концу. Пока мы обсуждали, умеет ли ChatGPT рассуждать о смысле жизни, в недрах Google кипела работа над чем-то куда более приземленным и одновременно пугающим. Речь о Project Astra, чьи следы недавно обнаружили в коде свежих обновлений Google. Если коротко: ваш смартфон перестает быть просто набором иконок и превращается в исполнительный орган для Gemini.

Давайте вспомним контекст. На последней конференции I/O нам показали демо, где ИИ через камеру очков видел мир, узнавал код на доске и вспоминал, где пользователь оставил очки. Это выглядело как магия, но за кадром остался главный вопрос: а сможет ли эта штука сама нажать кнопку «купить» или «забронировать»? Последние находки в коде подтверждают, что Google планирует дать Gemini права администратора над вашим пользовательским интерфейсом. Это логичный шаг в эволюции от LLM (больших языковых моделей) к LAM (моделям действий). Мы годами учили нейросети говорить, теперь пришло время научить их работать.

Почему это происходит именно сейчас? Google находится в ситуации догоняющего в плане «чистого» интеллекта моделей, но у компании есть козырь, которого нет ни у OpenAI, ни у Anthropic. Это Android. Имея глубокий доступ к системным API, Google может позволить Gemini видеть то, что происходит на экране в любом приложении, и имитировать нажатия клавиш. Пока Apple только обещает нечто подобное в рамках своего Intelligence, Google уже закладывает фундамент для того, чтобы ваш телефон мог самостоятельно спланировать вечер: от брони столика в ресторане до заказа такси к нужному времени, минуя стадию вашего личного участия в перелистывании меню.

Технически это реализуется через анализ визуального потока. Gemini не просто читает текст, она понимает иерархию элементов интерфейса. Она знает, что эта маленькая корзинка в углу — это переход к оплате, а этот крестик — закрытие рекламы. Это снимает огромную нагрузку с пользователя, но одновременно открывает ящик Пандоры в плане безопасности. Представьте себе ИИ-агента, который по ошибке или из-за галлюцинации подтвердил перевод денег или удалил важный рабочий чат. Именно поэтому Google внедряет эти функции осторожно, пряча их за слоями кода, пока система не станет достаточно надежной.

Индустрия сейчас стоит на пороге «агентской революции». Мы уже видели попытки сделать отдельные устройства для этого, вроде Rabbit R1 или Humane Pin, но они провалились именно потому, что пытались заменить смартфон. Google же делает умнее: компания превращает уже существующий в вашем кармане кирпич в автономного помощника. Это меняет саму парадигму использования гаджета. Смартфон перестает быть устройством, в которое вы смотрите часами, и становится фоновым процессором, выполняющим ваши поручения. Если это сработает, само понятие «приложение» может уйти в прошлое — зачем вам открывать интерфейс Uber, если Gemini сделает все через API или графический захват?

В конечном итоге, это битва за наше время. Google понимает, что если они не сделают Gemini полноценным оператором Android, это сделает кто-то другой через костыли и надстройки. Сейчас мы видим первые робкие шаги системы, которая скоро будет знать структуру ваших приложений лучше вас самих. Остается только надеяться, что Gemini не решит, что ваше присутствие в процессе выбора пиццы — это тоже лишний шум, который стоит оптимизировать.

Главное: Станет ли Gemini полноценным «автопилотом» для Android уже в этом году или нас ждет очередная серия бесконечных бета-тестов?

ЖХ
Hamidun News
AI‑новости без шума. Ежедневный редакторский отбор из 400+ источников. Продукт Жемала Хамидуна, Head of AI в Alpina Digital.
Загружаем комментарии…