Wired→ оригинал

Gemini ahora pide un taxi y ordena comida en tu smartphone

Google dio un paso importante para convertir Gemini en un agente móvil completo. Empezando por el Samsung Galaxy S26, el asistente puede realizar tareas por su

Gemini ahora pide un taxi y ordena comida en tu smartphone
Источник: Wired. Коллаж: Hamidun News.
◐ Слушать статью

Годами голосовые ассистенты обещали нам будущее, в котором достаточно произнести команду — и телефон всё сделает сам. На практике это будущее сводилось к установке таймера и прогнозу погоды. Google, похоже, решила наконец закрыть этот разрыв между обещаниями и реальностью. Компания объявила, что Gemini — её флагманский ИИ-ассистент — теперь способен самостоятельно выполнять действия в сторонних мобильных приложениях. Вызвать Uber, заказать еду через DoorDash, оформить покупку — и всё это без единого касания экрана со стороны пользователя. Первым устройством с поддержкой новой функции стал Samsung Galaxy S26.

Чтобы понять масштаб этого анонса, нужно вспомнить контекст. Последние полтора года индустрия одержима концепцией «ИИ-агентов» — систем, которые не просто генерируют текст или отвечают на вопросы, а совершают действия в реальном мире от имени пользователя. OpenAI экспериментирует с Operator, Anthropic тестирует Computer Use для Claude, Apple наращивает возможности Siri через Apple Intelligence. Но именно Google оказалась в уникальном положении: компания контролирует Android — операционную систему, установленную на миллиардах устройств, — и может интегрировать агентные возможности на уровне платформы, а не поверх неё.

Технически Gemini использует комбинацию нескольких подходов. Ассистент «видит» интерфейс приложений через специальные API-мосты и систему доступности Android, понимает структуру экранов и умеет навигировать по ним так, как это делал бы человек — нажимая кнопки, заполняя поля, подтверждая заказы. На живой демонстрации, которую показали журналистам Wired, процесс выглядел впечатляюще гладко: пользователь произносил запрос вроде «закажи мне Uber до аэропорта», а Gemini открывал приложение, выбирал маршрут, тип поездки и доводил заказ до стадии подтверждения. Финальное подтверждение — нажатие кнопки оплаты — пока остаётся за человеком, что выглядит как разумная мера безопасности на первом этапе.

Выбор Samsung Galaxy S26 в качестве стартовой площадки не случаен. Google и Samsung уже несколько лет углубляют партнёрство: Galaxy AI, совместные разработки в области генеративных функций, привилегированный доступ к новейшим возможностям Android. Для Samsung это конкурентное преимущество перед другими Android-производителями. Для Google — возможность обкатать агентную функциональность на премиальной аудитории, которая с высокой вероятностью пользуется именно теми приложениями, с которыми интегрирован Gemini. Вероятно, в течение нескольких месяцев функция распространится на другие флагманы, а затем и на более широкий спектр устройств.

Но главный вопрос — не технический, а экосистемный. Чтобы агент был по-настоящему полезен, ему нужен доступ к десяткам и сотням приложений, а разработчики этих приложений должны быть готовы к такому взаимодействию. Uber и DoorDash — это витринные партнёры, демонстрационные кейсы. Реальная ценность появится тогда, когда Gemini сможет работать с банковскими приложениями, мессенджерами, сервисами бронирования и маркетплейсами. Здесь возникает тонкий баланс интересов: разработчики приложений годами строили свои интерфейсы так, чтобы пользователь проводил в них максимум времени, видел рекламу, совершал импульсные покупки. ИИ-агент, который проскакивает все эти слои за секунды, угрожает их бизнес-моделям. Google придётся либо договариваться с каждым крупным сервисом, либо создать настолько привлекательную платформу для разработчиков, что те сами захотят интегрироваться.

Есть и вопрос доверия. Передать ИИ возможность тратить ваши деньги — это принципиально иной уровень взаимодействия по сравнению с просьбой написать письмо или найти информацию. Ошибка при генерации текста стоит пару секунд. Ошибка при заказе такси или оплате ужина стоит реальных денег. Google, судя по демонстрации, это понимает — отсюда и требование ручного подтверждения транзакций. Но по мере того как пользователи привыкнут к агентам, давление в сторону полной автоматизации будет нарастать.

Этот анонс знаменует важный сдвиг в индустрии мобильных технологий. Смартфон перестаёт быть устройством, которым вы управляете, и начинает становиться устройством, которое управляет задачами за вас. Google сделала первый публичный шаг в этом направлении на массовом рынке. Теперь все взгляды обращены на Apple и её WWDC: сможет ли Siri ответить чем-то сопоставимым, или разрыв между двумя экосистемами станет ещё заметнее? Одно ясно уже сейчас — эра ИИ-ассистентов, которые только разговаривают, подходит к концу. Наступает эра ассистентов, которые действуют.

ЖХ
Hamidun News
AI‑новости без шума. Ежедневный редакторский отбор из 400+ источников. Продукт Жемала Хамидуна, Head of AI в Alpina Digital.
Загружаем комментарии…