Gemini peut désormais réserver une course et commander un repas sur votre smartphone
Google a franchi une étape importante pour faire de Gemini un véritable agent mobile. À commencer par le Samsung Galaxy S26, l’assistant peut exécuter seul…
Traité par IA depuis Wired ; édité par Hamidun News
Gemini Appellera Maintenant un Taxi et Commandera de la Nourriture sur Votre Smartphone
Pendant des années, les assistants vocaux nous ont promis un avenir où une simple commande parlée ferait faire à votre téléphone tout ce que vous souhaitez. En pratique, cet avenir se résumait à régler un minuteur et consulter la météo. Google semble avoir finalement décidé de combler le fossé entre les promesses et la réalité. L'entreprise a annoncé que Gemini —son assistant IA phare— est désormais capable d'exécuter indépendamment des actions dans les applications mobiles tierces. Appeler un Uber, commander de la nourriture via DoorDash, effectuer un achat —tout cela sans un seul geste de l'utilisateur. Le premier appareil à supporter la nouvelle fonctionnalité est le Samsung Galaxy S26.
Pour comprendre l'ampleur de cette annonce, il faut se rappeler le contexte. Au cours des dix-huit derniers mois, l'industrie a été obsédée par le concept « d'agents IA » — des systèmes qui ne se contentent pas de générer du texte ou de répondre à des questions, mais qui effectuent des actions dans le monde réel au nom de l'utilisateur. OpenAI expérimente Operator, Anthropic teste Computer Use pour Claude, Apple renforce les capacités de Siri via Apple Intelligence. Mais Google s'est trouvé dans une position unique : l'entreprise contrôle Android — un système d'exploitation installé sur des milliards d'appareils — et peut intégrer les capacités d'agent au niveau de la plateforme, plutôt que par-dessus.
Techniquement, Gemini utilise une combinaison de plusieurs approches. L'assistant « voit » les interfaces des applications via des ponts API spéciaux et le système d'accessibilité d'Android, comprend la structure des écrans et peut les naviguer comme le ferait un humain — en cliquant sur les boutons, en remplissant les champs, en confirmant les commandes. Dans une démonstration en direct présentée aux journalistes de Wired, le processus semblait impressionnamment fluide : un utilisateur disait quelque chose comme « appelle-moi un Uber pour l'aéroport » et Gemini ouvrait l'application, sélectionnait un itinéraire, choisissait le type de course et menait la commande jusqu'à l'étape de confirmation.
La confirmation finale — cliquer sur le bouton de paiement — reste pour l'instant du ressort de l'humain, ce qui semble être une mesure de sécurité raisonnable à ce stade initial.
Le choix du Samsung Galaxy S26 comme plateforme de lancement n'est pas un hasard. Google et Samsung approfondissent leur partenariat depuis plusieurs années : Galaxy AI, développements conjoints dans les capacités génératives, accès privilégié aux dernières fonctionnalités d'Android. Pour Samsung, c'est un avantage concurrentiel par rapport aux autres fabricants Android. Pour Google, c'est l'occasion de tester la fonctionnalité d'agent auprès d'un public haut de gamme qui utilise très probablement exactement les applications avec lesquelles Gemini est intégré. Il est probable qu'au cours des prochains mois, la fonctionnalité s'étendra à d'autres appareils phares, puis à une gamme plus large d'appareils.
Mais la question principale n'est pas technique, mais écosystémique. Pour qu'un agent soit vraiment utile, il doit avoir accès à des dizaines et des centaines d'applications, et les développeurs de ces applications doivent être prêts à une telle interaction. Uber et DoorDash sont des partenaires vitrine, des cas de démonstration.
La vraie valeur viendra quand Gemini pourra travailler avec les applications bancaires, les messageries, les services de réservation et les places de marché. Il y a ici un équilibre délicat d'intérêts : les développeurs d'applications ont passé des années à construire leurs interfaces pour maximiser le temps d'utilisation, afficher des publicités et encourager les achats impulsifs. Un agent IA qui contourne tous ces obstacles en quelques secondes menace leurs modèles commerciaux.
Google devra soit négocier avec chaque grand service, soit créer une plateforme si attrayante pour les développeurs qu'ils voudront d'eux-mêmes s'intégrer.
Et il y a la question de la confiance. Donner à une IA la capacité de dépenser votre argent est un niveau fondamentalement différent d'interaction par rapport à lui demander d'écrire une lettre ou de trouver des informations. Une erreur dans la génération de texte coûte quelques secondes. Une erreur dans la commande d'un taxi ou le paiement du dîner coûte de l'argent réel. Google, selon la démonstration, le comprend — d'où l'exigence de confirmation manuelle des transactions. Mais à mesure que les utilisateurs s'habitueront aux agents, la pression vers une automatisation complète augmentera.
Cette annonce marque un tournant important dans l'industrie de la technologie mobile. Le smartphone cesse d'être un appareil que vous contrôlez et devient un appareil qui gère les tâches pour vous. Google a franchi la première étape publique dans cette direction sur le marché de masse. Tous les regards sont maintenant tournés vers Apple et sa WWDC : Siri pourra-t-il répondre par quelque chose de comparable, ou le fossé entre les deux écosystèmes deviendra-t-il encore plus marqué ? Une chose est claire dès à présent — l'ère des assistants IA qui se contentent de parler touche à sa fin. L'ère des assistants qui agissent commence.
Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?
AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.