Google AI Blog→ оригинал

Google научил Circle to Search распознавать несколько объектов на одном изображении

Google обновил свою функцию визуального поиска Circle to Search, добавив возможность распознавать и исследовать сразу несколько объектов на одном изображении. Р

Google научил Circle to Search распознавать несколько объектов на одном изображении
Источник: Google AI Blog. Коллаж: Hamidun News.

Когда Google впервые представил Circle to Search в начале 2024 года, идея казалась обманчиво простой: обведи что угодно на экране смартфона и мгновенно получи результаты поиска. Два года спустя компания продолжает развивать эту концепцию, и свежее обновление делает функцию значительно умнее — теперь она способна анализировать сразу несколько объектов на одном изображении, избавляя пользователя от необходимости обводить каждый предмет по отдельности.

Чтобы понять значимость этого шага, стоит вспомнить, как визуальный поиск работал до сих пор. Классическая модель предполагала последовательное взаимодействие: увидел интересную вещь — обвёл — получил результат. Если на фотографии из Instagram вас заинтересовали и куртка модели, и её кроссовки, и сумка на заднем плане, приходилось повторять процедуру трижды. Это создавало ощутимое трение, особенно в сценариях, где пользователь просматривает вдохновляющий контент и хочет быстро идентифицировать всё, что привлекло внимание. Обновлённый Circle to Search решает эту проблему фундаментально: система сама распознаёт все значимые объекты в кадре и предлагает информацию о каждом из них.

Технически за этим стоит эволюция мультимодальных моделей Google. Компания не раскрывает деталей архитектуры, но логика понятна: вместо того чтобы обрабатывать один выделенный фрагмент изображения, система теперь выполняет полную сегментацию сцены, идентифицирует отдельные объекты, классифицирует их и для каждого запускает поисковый запрос. Это требует существенно больших вычислительных ресурсов, но Google, очевидно, оптимизировал процесс настолько, чтобы он оставался быстрым на пользовательских устройствах. Вероятно, часть обработки происходит на стороне сервера, а часть — локально, с использованием нейронных процессоров современных чипов.

Наиболее очевидный сценарий применения — шопинг. Google фактически превращает любую фотографию в витрину магазина. Увидели стильно обставленную комнату в Pinterest — Circle to Search покажет, где купить каждый предмет мебели. Наткнулись на фото уличного образа — получите ссылки на похожую одежду, обувь и аксессуары. Это не просто удобство, это прямая монетизация визуального контента через рекламную экосистему Google Shopping. Компания создаёт кратчайший путь от вдохновения к покупке, и каждый такой переход потенциально генерирует рекламный доход.

Для индустрии электронной коммерции последствия серьёзные. Платформы вроде Pinterest и Instagram годами строили собственные инструменты визуального шопинга, интегрируя теги товаров и партнёрские ссылки. Google же предлагает универсальное решение, работающее поверх любого приложения на уровне операционной системы. Это подрывает монополию социальных платформ на визуальную коммерцию и перенаправляет поток покупательского внимания обратно в поисковую экосистему Google. Для брендов это означает, что качественный визуальный контент становится ещё важнее — если ваш товар хорошо выглядит на фотографиях, Google сам найдёт его и предложит покупателям.

Есть и более широкий контекст. Circle to Search — это часть стратегии Google по переосмыслению поиска в эпоху генеративного AI. Компания понимает, что текстовая строка поиска перестаёт быть единственным интерфейсом. Люди всё чаще хотят взаимодействовать с информацией естественным образом — указывая на предметы, задавая вопросы голосом, комбинируя модальности. Каждое обновление Circle to Search приближает нас к миру, где поиск становится невидимым, встроенным в само взаимодействие с экраном.

Впрочем, остаётся вопрос приватности. Когда система анализирует всё содержимое экрана и отправляет данные на серверы для обработки, объём собираемой информации о пользовательских предпочтениях растёт экспоненциально. Google знает не просто что вы искали, а что привлекло ваше внимание на каждом изображении, которое вы просматриваете. Это золотая жила для таргетированной рекламы и одновременно повод для беспокойства регуляторов.

Обновление Circle to Search выглядит как небольшой инкрементальный шаг, но в действительности оно отражает фундаментальный сдвиг в том, как мы взаимодействуем с визуальной информацией. Google методично строит мост между зрением и действием, между тем, что мы видим, и тем, что мы можем с этим сделать. И с каждым таким обновлением этот мост становится всё короче.

ЖХ
Hamidun News
AI‑новости без шума. Ежедневный редакторский отбор из 400+ источников. Продукт Жемала Хамидуна, Head of AI в Alpina Digital.
Загружаем комментарии…