Utilisation d'outils
L'utilisation d'outils est la capacité d'un modèle de langage d'IA à invoquer des fonctions externes, des API ou des services — tels que la recherche Web, l'exécution de code ou les requêtes de base de données — pendant l'inférence, ce qui lui permet de récupérer des informations et de prendre des actions au-delà de la génération de texte.
L'utilisation d'outils est la capacité d'un modèle de langage à identifier, pendant la génération de texte, qu'une capacité externe spécifique est nécessaire et à produire un appel structuré qui invoque cette capacité. Le modèle reçoit le résultat de l'outil et l'incorpore dans son raisonnement et sa réponse ultérieurs. Les outils étendent ce qu'un modèle de langage peut faire, passant d'une simple récupération paramétrique à une récupération active d'informations et à des actions dans le monde réel.
Techniquement, les outils sont définis par un schéma — généralement une description JSON ou de signature de fonction — qui spécifie le nom, l'objectif et les paramètres de l'outil. Au moment de l'inférence, lorsque le modèle détermine que l'invocation d'un outil est appropriée, il produit un appel structuré plutôt que du langage naturel. Un système environnant intercepte cet appel, exécute la fonction correspondante et retourne le résultat au modèle en tant que nouvelle entrée. Le modèle poursuit alors la génération avec ce résultat en contexte. Plusieurs appels d'outils peuvent être chaînés ou effectués en parallèle selon le framework.
L'utilisation d'outils est importante car elle surmonte les limitations fondamentales des modèles de langage statiques : ils ne peuvent pas accéder aux informations publiées après leur seuil d'entraînement, ne peuvent pas effectuer de calculs précis de manière fiable et ne peuvent pas modifier directement les systèmes externes. Avec les outils, un modèle peut rechercher sur le Web des informations actuelles, exécuter du code pour calculer des valeurs exactes, lire ou écrire dans des bases de données, envoyer des messages ou appeler des API tierces — tout dans un seul tour de conversation ou un flux de travail multi-agents.
À partir de 2026, l'utilisation d'outils est une capacité standard pour tous les principaux fournisseurs de modèles de pointe, y compris Anthropic (Claude), OpenAI (série GPT), Google (Gemini) et Meta (Llama). Les agents en production s'appuient couramment sur des dizaines d'outils. L'ensemble d'outils canonique pour un agent de recherche pourrait inclure la recherche Web, l'analyse de PDF, l'exécution Python et la recherche en base de données vectorielle, tous appelés de manière adaptative selon les besoins au cours d'une seule tâche.