Gemini agora chama um carro e pede comida no seu smartphone
O Google deu um passo importante para transformar o Gemini em um agente móvel completo. Começando pelo Samsung Galaxy S26, o assistente consegue executar…
Processado por IA de Wired; editado por Hamidun News
Gemini Agora Vai Chamar um Táxi e Pedir Comida no Seu Smartphone
Durante anos, os assistentes de voz prometeram um futuro no qual uma simples ordem falada faria seu telefone fazer tudo. Na prática, esse futuro se resumia a ativar um temporizador e conferir a previsão do tempo. Google aparentemente decidiu finalmente fechar a lacuna entre promessas e realidade. A empresa anunciou que Gemini — seu assistente de IA insignia — agora é capaz de executar independentemente ações em aplicativos móveis de terceiros. Chamar um Uber, pedir comida pelo DoorDash, fazer uma compra — tudo isso sem um único toque do usuário. O primeiro dispositivo a suportar a nova funcionalidade é o Samsung Galaxy S26.
Para entender a escala desse anúncio, precisamos lembrar o contexto. Nos últimos ano e meio, a indústria tem estado obcecada com o conceito de "agentes de IA" — sistemas que não apenas geram texto ou respondem perguntas, mas realizam ações no mundo real em nome do usuário. OpenAI está experimentando com o Operator, Anthropic está testando Computer Use para Claude, Apple está expandindo as capacidades do Siri através do Apple Intelligence. Mas Google se viu em uma posição única: a empresa controla o Android — um sistema operacional instalado em bilhões de dispositivos — e pode integrar capacidades de agentes no nível da plataforma, em vez de acima dela.
Tecnicamente, Gemini usa uma combinação de várias abordagens. O assistente "vê" interfaces de aplicativos através de pontes de API especiais e do sistema de acessibilidade do Android, compreende a estrutura da tela e consegue navegar por ela como um ser humano faria — clicando em botões, preenchendo campos, confirmando pedidos. Em uma demonstração ao vivo exibida aos jornalistas da Wired, o processo parecia impressionantemente suave: um usuário dizia algo como "chame um Uber para o aeroporto" e Gemini abria o app, selecionava a rota, escolhia o tipo de corrida e levava o pedido até o estágio de confirmação.
A confirmação final — clicar no botão de pagamento — permanece com o humano por enquanto, o que parece ser uma medida de segurança razoável nesta fase inicial.
A escolha do Samsung Galaxy S26 como plataforma de lançamento não é acidental. Google e Samsung vêm aprofundando sua parceria há vários anos: Galaxy AI, desenvolvimentos conjuntos em recursos generativos, acesso privilegiado aos recursos mais recentes do Android. Para Samsung, isso é uma vantagem competitiva sobre outros fabricantes de Android. Para Google, é uma oportunidade de testar funcionalidade de agentes com um público premium que muito provavelmente está usando exatamente os aplicativos com os quais Gemini está integrado. É provável que nos próximos meses, o recurso se espalhe para outros smartphones de topo, e depois para uma gama mais ampla de dispositivos.
Mas a pergunta principal não é técnica, mas relacionada ao ecossistema. Para que um agente seja verdadeiramente útil, ele precisa de acesso a dezenas e centenas de aplicativos, e os desenvolvedores desses aplicativos precisam estar prontos para essa interação. Uber e DoorDash são parceiros de vitrine, casos de demonstração.
O verdadeiro valor virá quando Gemini puder trabalhar com aplicativos bancários, mensageiros, serviços de reserva e marketplaces. Aqui há um delicado equilíbrio de interesses: desenvolvedores de aplicativos passaram anos construindo suas interfaces para maximizar o tempo do usuário, mostrar anúncios e incentivar compras impulsivas. Um agente de IA que pula todas essas camadas em segundos ameaça seus modelos de negócios.
Google terá que negociar com cada serviço importante, ou criar uma plataforma tão atraente para desenvolvedores que eles mesmos queiram se integrar.
E há a questão da confiança. Dar à IA a capacidade de gastar seu dinheiro é um nível fundamentalmente diferente de interação em comparação com pedir que ela escreva uma carta ou encontre informações. Um erro na geração de texto custa alguns segundos. Um erro ao chamar um táxi ou pagar pela comida custa dinheiro real. Google, baseado na demonstração, entende isso — daí o requisito de confirmação manual de transações. Mas conforme os usuários se tornam mais confortáveis com agentes, a pressão pela automação total aumentará.
Este anúncio marca uma mudança importante na indústria de tecnologia móvel. O smartphone deixa de ser um dispositivo que você controla e começa a se tornar um dispositivo que gerencia tarefas para você. Google deu o primeiro passo público nessa direção no mercado em massa. Agora todos os olhos estão em Apple e sua WWDC: o Siri será capaz de responder com algo comparável, ou a lacuna entre os dois ecossistemas se tornará ainda mais notável? Uma coisa é clara agora — a era dos assistentes de IA que apenas falam está chegando ao fim. A era dos assistentes que agem está começando.
Quer parar de ler sobre IA e começar a usar?
AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.