Google met à jour Circle to Search pour reconnaître plusieurs objets sur une même image
Google a mis à jour sa fonction de recherche visuelle, Circle to Search, en ajoutant la possibilité de reconnaître et d'explorer plusieurs objets sur une…
Traité par IA depuis Google AI Blog ; édité par Hamidun News
Lorsque Google a présenté Circle to Search au début de 2024, l'idée semblait trompeusement simple : encerclez n'importe quoi sur l'écran de votre smartphone et obtenez instantanément les résultats de recherche. Deux ans plus tard, l'entreprise continue de développer ce concept, et une mise à jour récente rend la fonction nettement plus intelligente — elle peut désormais analyser plusieurs objets dans une seule image, libérant les utilisateurs de la nécessité d'encercler chaque article individuellement.
Pour comprendre l'importance de cette étape, il est bon de se rappeler comment la recherche visuelle fonctionnait jusqu'à présent. Le modèle classique impliquait une interaction séquentielle : vous avez vu quelque chose d'intéressant — vous l'avez encerclé — vous avez obtenu le résultat. Si sur une photo d'Instagram vous étiez intéressé par la veste du mannequin, ses baskets et un sac en arrière-plan, vous deviez répéter la procédure trois fois.
Cela créait une friction perceptible, en particulier dans les scénarios où l'utilisateur parcourt un contenu inspirant et souhaite identifier rapidement tout ce qui a attiré son attention. Le Circle to Search mis à jour résout ce problème fondamentalement : le système reconnaît maintenant tous les objets significatifs du cadre et propose des informations sur chacun d'eux.
Techniquement, cela découle de l'évolution des modèles multimodaux de Google. L'entreprise ne divulgue pas les détails architecturaux, mais la logique est claire : au lieu de traiter un seul fragment d'image en surbrillance, le système effectue maintenant une segmentation complète de la scène, identifie les objets individuels, les classe et lance une requête de recherche pour chacun. Cela nécessite considérablement plus de ressources informatiques, mais Google a apparemment optimisé le processus suffisamment pour le garder rapide sur les appareils des utilisateurs. Probablement, une partie du traitement se fait côté serveur et une partie localement, en utilisant les processeurs neuraux des puces modernes.
Le cas d'utilisation le plus évident est les achats. Google transforme essentiellement n'importe quelle photo en vitrine. Vous voyez une chambre élégamment meublée sur Pinterest — Circle to Search vous montrera où acheter chaque meuble. Vous tombez sur une photo de style de rue — vous obtiendrez des liens vers des vêtements, des chaussures et des accessoires similaires. Ce n'est pas seulement une question de commodité ; c'est la monétisation directe du contenu visuel via l'écosystème publicitaire de Google. L'entreprise crée le chemin le plus court de l'inspiration à l'achat, et chaque transition génère potentiellement des revenus publicitaires.
Pour l'industrie du commerce électronique, les conséquences sont graves. Des plateformes comme Pinterest et Instagram ont passé des années à construire leurs propres outils de shopping visuel, en intégrant les étiquettes de produits et les liens d'affiliation. Google, lui, offre une solution universelle qui fonctionne au-dessus de n'importe quelle application au niveau du système d'exploitation. Cela mine le monopole des plateformes sociales sur le commerce visuel et redirige le flux d'attention des acheteurs vers l'écosystème de recherche de Google. Pour les marques, cela signifie que le contenu visuel de haute qualité devient encore plus important — si votre produit est beau en photos, Google le trouvera et l'offrira aux clients.
Il y a aussi un contexte plus large. Circle to Search fait partie de la stratégie de Google pour repenser la recherche à l'ère de l'IA générative. L'entreprise comprend que la barre de recherche textuelle n'est plus la seule interface. Les gens veulent de plus en plus interagir avec l'information de manière naturelle — en pointant du doigt sur des objets, en posant des questions par la voix, en combinant les modalités. Chaque mise à jour de Circle to Search nous rapproche d'un monde où la recherche devient invisible, intégrée dans l'acte même d'interagir avec l'écran.
Cependant, la question de la vie privée reste un problème. Lorsque le système analyse tout le contenu de l'écran et envoie les données aux serveurs pour traitement, le volume d'informations collectées sur les préférences des utilisateurs croît exponentiellement. Google sait non seulement ce que vous avez recherché, mais aussi ce qui a attiré votre attention dans chaque image que vous visualisez. C'est une mine d'or pour la publicité ciblée et simultanément un motif de préoccupation pour les régulateurs.
La mise à jour de Circle to Search semble un petit pas supplémentaire, mais elle reflète en réalité un changement fondamental dans la façon dont nous interagissons avec l'information visuelle. Google construit méthodiquement un pont entre la vision et l'action, entre ce que nous voyons et ce que nous pouvons en faire. Et à chaque mise à jour, ce pont se raccourcit.
Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?
AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.