Google permet à Gemini API de combiner Search, Maps et des fonctions personnalisées dans une seule requête
Google a étendu Gemini API et permet désormais de combiner, dans une seule requête, des outils intégrés comme Search et Maps avec des fonctions…
Traité par IA depuis MarkTechPost ; édité par Hamidun News
Google a étendu l'API Gemini : les outils intégrés comme Google Search et Google Maps peuvent maintenant être combinés avec des fonctions personnalisées dans une seule requête. Cela supprime une partie de l'orchestration manuelle autour des scénarios d'agent et rapproche l'API d'un format où le modèle coordonne lui-même la recherche, les appels de code et les transitions entre les étapes.
Ce qui a changé
La mise à jour annoncée par Google en mars 2026 ajoute une gestion plus cohésive des outils à l'API Gemini. Auparavant, les développeurs devaient souvent organiser la recherche séparément, tracer une route vers les cartes ou les données externes séparément, puis coller manuellement les réponses dans l'application. Maintenant, une grande partie de cette logique peut être assemblée en un seul appel : le modèle accède aux services intégrés de Google et peut simultanément invoquer des fonctions personnalisées si le scénario nécessite des actions au-delà de l'ensemble standard.
Une présentation pratique montre cinq démonstrations qui augmentent progressivement la complexité de la tâche. La logique commence par une combinaison basique d'outils, puis passe à des chaînes d'agent multi-étapes, où le transfert de contexte entre les étapes, l'identification des appels parallèles et la continuation correcte du dialogue après la réponse d'une fonction externe sont critiques. Pour les développeurs, c'est un changement significatif : l'orchestration se disperse moins sur le backend et se déplace davantage dans la session du modèle lui-même. Cela rend le comportement de la chaîne notablement plus transparent pour le débogage et les tests.
Comment l'appel fonctionne
L'idée clé est que Gemini peut maintenant décider en une seule étape quand il a besoin d'une recherche web, quand il a besoin de données géospatiales de Maps et quand il a besoin d'une fonction d'application personnalisée. Si une question nécessite plusieurs actions, le modèle peut maintenir le contexte global, aligner les résultats de différents outils et continuer la chaîne sans redémarrage complet du scénario. L'accent est mis sur les ID d'outils parallèles et la circulation du contexte : cela aide à éviter de confondre les réponses des outils et à transférer les données nécessaires à l'étape suivante.
- Google Search récupère les informations actualisées sur le sujet de la requête
- Google Maps ajoute les adresses, le contexte géographique et les données des lieux
- Les fonctions personnalisées intègrent la logique commerciale interne de l'application
- Les chaînes multi-étapes permettent de construire des scénarios à partir de plusieurs actions séquentielles
Cette approche est pratique pour les scénarios où la réponse ne peut pas être obtenue à partir d'une seule source. Par exemple, un assistant peut d'abord trouver des informations à jour via Search, puis vérifier un lieu sur la carte via Maps, puis appeler une fonction interne de réservation, de calcul ou de vérification de disponibilité. Auparavant, une telle séquence devait souvent être divisée en plusieurs requêtes et l'état entre elles maintenu manuellement. Pour les services aux actions concrètes, cela simplifie considérablement l'architecture.
Pourquoi c'est important pour les développeurs
L'avantage principal est moins de collage entre le modèle et la logique du produit. Au lieu d'écrire un orchestrateur séparé pour chaque combinaison d'outils, une équipe peut décrire les fonctions, donner au modèle accès aux services nécessaires et construire des scénarios d'agent plus naturels. Ceci est particulièrement utile pour les assistants qui ne doivent pas seulement répondre par du texte, mais réellement exécuter des tâches : rechercher des données, sélectionner un lieu sur une carte, vérifier les paramètres, transmettre le résultat à un service interne et seulement ensuite formuler la réponse finale pour l'utilisateur.
Un autre avantage est la mise à l'échelle plus prévisible des chaînes complexes. Quand les outils intégrés de Google et les propres fonctions d'une entreprise sont connectés dans un seul processus, le nombre de couches intermédiaires où le contexte est généralement perdu ou la logique des appels est cassée diminue. Pour les équipes, cela signifie des prototypes plus rapides et moins de code passe-partout autour d'eux. Et pour les produits, une chance de passer plus rapidement d'un chatbot avec suggestions à un agent qui sait vraiment comment mener une tâche à bien.
Ce que cela signifie
Google oriente l'API Gemini vers des interfaces d'agent complètes, où le modèle ne génère pas seulement du texte mais gère un ensemble d'outils dans une seule session. Si cette approche s'avère stable dans les scénarios de production réels, les développeurs pourront assembler des assistants d'IA utiles avec moins d'orchestration manuelle et les commercialiser plus rapidement.
Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?
AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.
L'essentiel de l'IA — une fois par semaine
Sept actus qui ont vraiment compté, choisies à la main. Sans bruit ni communiqués.
C'est fait ! Vérifiez votre boîte mail pour la confirmation.