Google AI Blog→ original

Google atualiza o Circle to Search para reconhecer vários objetos em uma mesma imagem

O Google atualizou seu recurso de busca visual, o Circle to Search, adicionando a capacidade de reconhecer e pesquisar vários objetos em uma mesma imagem ao…

Processado por IA de Google AI Blog; editado por Hamidun News
Google atualiza o Circle to Search para reconhecer vários objetos em uma mesma imagem
Fonte: Google AI Blog. Colagem: Hamidun News.
◐ Ouvir artigo

Quando o Google apresentou o Circle to Search no início de 2024, a ideia parecia enganosamente simples: circule qualquer coisa na tela do seu smartphone e obtenha resultados de pesquisa instantaneamente. Dois anos depois, a empresa continua desenvolvendo esse conceito, e uma atualização recente torna o recurso significativamente mais inteligente — agora ele consegue analisar vários objetos em uma única imagem, liberando os usuários da necessidade de circular cada item individualmente.

Para entender a importância deste passo, vale a pena lembrar como a pesquisa visual funcionava até agora. O modelo clássico envolvia interação sequencial: viu algo interessante — circulou — obteve o resultado. Se em uma foto do Instagram você se interessasse pela jaqueta da modelo, seus tênis e uma bolsa no fundo, tinha que repetir o procedimento três vezes. Isso criava um atrito perceptível, especialmente em cenários onde o usuário está navegando por conteúdo inspirador e quer identificar rapidamente tudo o que chamou sua atenção. O Circle to Search atualizado resolve esse problema fundamentalmente: o sistema agora reconhece todos os objetos significativos no quadro e oferece informações sobre cada um deles.

Tecnicamente, isso decorre da evolução dos modelos multimodais do Google. A empresa não divulga detalhes arquitetônicos, mas a lógica é clara: em vez de processar um único fragmento de imagem destacado, o sistema agora realiza segmentação completa da cena, identifica objetos individuais, os classifica e inicia uma consulta de pesquisa para cada um. Isso requer substancialmente mais recursos computacionais, mas o Google aparentemente otimizou o processo o suficiente para mantê-lo rápido em dispositivos de usuários. Provavelmente, parte do processamento ocorre no lado do servidor e parte localmente, usando processadores neurais em chips modernos.

O caso de uso mais óbvio é o shopping. O Google está essencialmente transformando qualquer foto em uma vitrine. Veja um quarto elegantemente decorado no Pinterest — o Circle to Search mostrará onde comprar cada móvel. Encontre uma foto de estilo de rua — você receberá links para roupas, sapatos e acessórios semelhantes. Não é apenas conveniência; é monetização direta de conteúdo visual através do ecossistema de publicidade do Google. A empresa está criando o caminho mais curto da inspiração para a compra, e cada transição potencialmente gera receita publicitária.

Para a indústria de comércio eletrônico, as consequências são sérias. Plataformas como Pinterest e Instagram passaram anos construindo suas próprias ferramentas de compras visuais, integrando tags de produtos e links de afiliados. O Google, por sua vez, oferece uma solução universal que funciona sobre qualquer aplicativo no nível do sistema operacional. Isso mina o monopólio das plataformas sociais no comércio visual e redireciona o fluxo de atenção do comprador para o ecossistema de pesquisa do Google. Para as marcas, isso significa que o conteúdo visual de alta qualidade se torna ainda mais importante — se seu produto parecer bom nas fotos, o Google o encontrará e o oferecerá aos clientes.

Há também um contexto mais amplo. O Circle to Search faz parte da estratégia do Google para reimaginar a busca na era da IA generativa. A empresa entende que a barra de pesquisa de texto não é mais a única interface. As pessoas cada vez mais querem interagir com informações de forma natural — apontando para objetos, fazendo perguntas por voz, combinando modalidades. Cada atualização do Circle to Search nos aproxima de um mundo onde a busca se torna invisível, incorporada no próprio ato de interagir com a tela.

No entanto, a questão da privacidade permanece. Quando o sistema analisa todo o conteúdo da tela e envia dados para servidores para processamento, o volume de informações coletadas sobre preferências dos usuários cresce exponencialmente. O Google sabe não apenas o que você pesquisou, mas o que chamou sua atenção em cada imagem que você visualiza. Isso é uma mina de ouro para publicidade direcionada e simultaneamente motivo de preocupação para os reguladores.

A atualização do Circle to Search parece um pequeno passo incremental, mas na verdade reflete uma mudança fundamental em como interagimos com informações visuais. O Google está metodicamente construindo uma ponte entre visão e ação, entre o que vemos e o que podemos fazer com isso. E a cada atualização, essa ponte fica mais curta.

ZK
Hamidun News
Notícias de AI sem ruído. Seleção editorial diária de mais de 400 fontes. Produto de Zhemal Khamidun, Head of AI na Alpina Digital.

Quer parar de ler sobre IA e começar a usar?

AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.

O que você acha?
Carregando comentários…