The Verge→ original

Gemini aprendeu a pedir comida e um táxi para você

O Google lançou as funções agênticas do Gemini na atualização de março do Pixel 10. Agora o assistente de AI consegue executar tarefas sozinho em apps de…

Processado por IA de The Verge; editado por Hamidun News
Gemini aprendeu a pedir comida e um táxi para você
Fonte: The Verge. Colagem: Hamidun News.
◐ Ouvir artigo

Google fez o que a indústria vinha falando nos últimos ano e meio: transformou um modelo de linguagem de parceiro conversacional em executor de ações. A atualização de março para a linha Pixel 10 confere ao Gemini a capacidade de agir independentemente dentro de aplicativos — pedindo produtos, chamando táxis e realizando outras tarefas rotineiras sem envolvimento constante do usuário.

A própria ideia de IA agentiva — um sistema que não apenas responde perguntas, mas também realiza ações no mundo real — tornou-se a principal tendência de 2025. OpenAI se moveu nessa direção com o Operator, Anthropic experimentou com Computer Use, e Apple expandiu silenciosamente as capacidades do Siri. Mas Google foi o primeiro a incorporar funções de agente em plena regra diretamente no sistema operacional de um smartphone de mercado em massa. Isso não é um protótipo de pesquisa nem uma versão beta para desenvolvedores — é uma atualização que está chegando agora ao Pixel 10, Pixel 10 Pro e Pixel 10 Pro XL.

Tecnicamente, tudo funciona da seguinte forma. O usuário pede ao Gemini para executar uma tarefa — por exemplo, pedir mantimentos para o jantar ou chamar um carro até o aeroporto. O assistente abre o aplicativo necessário, seja Grubhub ou Uber, e começa a interagir com sua interface: clicando em botões, preenchendo campos, selecionando opções. Tudo isso acontece em segundo plano enquanto o proprietário do telefone cuida de seus afazeres — rolando feeds, respondendo mensagens ou simplesmente colocando o smartphone no bolso. Ao mesmo tempo, Google enfatiza que o usuário mantém controle total: você pode ver a qualquer momento o que o assistente está fazendo, ajustar suas ações ou parar o processo completamente.

Um detalhe importante — por enquanto a lista de aplicativos suportados é limitada. Google usa a formulação "aplicativos selecionados", o que sugere integração personalizada em vez de uma solução universal. Isso faz sentido do ponto de vista de segurança: antes de dar à IA a capacidade de gastar dinheiro real do usuário, é preciso garantir que ela funcione corretamente com uma interface específica. Grubhub e Uber se tornaram os primeiros parceiros, mas é óbvio que essa lista será expandida. Curiosamente, Google demonstrou esse recurso pela primeira vez não em seu próprio evento, mas no Samsung Unpacked, o que revela o desejo da empresa de posicionar o Gemini como uma solução de plataforma para todo o ecossistema Android.

Para a indústria, este é um ponto de virada. Até agora, os assistentes de voz em smartphones permaneceram essencialmente como mecanismos de pesquisa avançados com um conjunto de comandos pré-definidos. Defina um temporizador, toque música, ligue para a mãe — esse é o alcance total. As capacidades agentivas do Gemini mudam fundamentalmente esse paradigma. O assistente não espera mais por instruções claras — interpreta a intenção e encontra uma forma de realizá-la. A diferença entre "encontre um restaurante próximo" e "peça comida para mim" é a diferença entre um guia de referência e um assistente pessoal.

No entanto, permanecem questões sérias. Como o sistema tratará erros? O que acontecerá se o Gemini pedir o produto errado ou escolher o endereço de entrega errado? Quem é responsável pelas transações financeiras realizadas por IA em nome do usuário? Google ainda não forneceu respostas abrangentes, limitando-se a garantias sobre controle total do usuário. É provável que inicialmente o assistente solicite confirmação antes de efetuar pagamentos, mas à medida que a confiança cresce, essas barreiras podem diminuir.

Há também um aspecto competitivo. A exclusividade da funcionalidade para o Pixel 10 é simultaneamente uma jogada de marketing e uma limitação técnica. As capacidades agentivas exigem recursos computacionais sérios, e o novo chip Tensor G5 aparentemente desempenha um papel fundamental. Mas estrategicamente, Google não pode se permitir manter esse recurso apenas no Pixel. Samsung, Xiaomi, OnePlus — todos os grandes fabricantes de smartphones Android estão aguardando quando essas capacidades se tornarão disponíveis através do Google Play Services. E provavelmente é uma questão de meses, não de anos.

A atualização de março do Pixel não é apenas um conjunto de novos recursos. É o primeiro passo em direção a um modelo de interação com smartphones onde os aplicativos deixam de ser aquilo que o usuário abre e se tornam aquilo que a IA gerencia. Se Google conseguir dimensionar essa tecnologia e manter a confiança dos usuários, podemos ser testemunhas da mudança mais significativa na UX móvel desde o surgimento das lojas de aplicativos.

ZK
Hamidun News
Notícias de AI sem ruído. Seleção editorial diária de mais de 400 fontes. Produto de Zhemal Khamidun, Head of AI na Alpina Digital.

Quer parar de ler sobre IA e começar a usar?

AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.

O que você acha?
Carregando comentários…