Agents

Motif ReAct

ReAct (Reasoning + Acting) est un framework de prompting pour les agents d'IA qui intercale les étapes de chaîne de pensée avec des actions discrètes d'utilisation d'outils, permettant au modèle d'observer le résultat de chaque action et de mettre à jour son raisonnement avant de continuer.

ReAct est une architecture d'agent qui alterne entre deux types d'opération : Reasoning (générer une pensée en langage naturel sur la situation actuelle et ce qu'il faut faire ensuite) et Acting (exécuter une opération concrète comme une recherche web, une requête de base de données ou une exécution de code). Le framework a été introduit par Yao et al. dans un article de 2022, « ReAct: Synergizing Reasoning and Acting in Language Models », présenté à ICLR 2023, et est devenu depuis l'un des modèles les plus largement adoptés pour construire des agents d'IA.

Dans une boucle ReAct, le modèle produit une 'Pensée'—son raisonnement interne sur l'état de la tâche—suivie d'une 'Action' qui invoque un outil externe. L'environnement retourne une 'Observation', qui est ajoutée à la fenêtre de contexte. Le modèle génère alors la pensée suivante, informée par cette observation, et le cycle se répète jusqu'à ce que le modèle juge la tâche terminée. Cette structure intercalée permet à l'agent de corriger son cap dynamiquement plutôt que de s'engager à l'avance sur un plan statique qui ne peut pas incorporer de nouvelles informations.

Le motif aborde une limitation fondamentale du prompting chain-of-thought statique : le modèle ne peut pas acquérir de nouvelles informations externes en milieu de réponse. En couplant le raisonnement aux véritables appels d'outils, ReAct permet les tâches qui nécessitent la récupération de données en direct, le calcul interactif ou la navigation multi-étapes dans un environnement externe. La trace pensée-action-observation est également lisible par l'homme, ce qui rend considérablement plus facile le débogage des défaillances d'agent que les pipelines d'appels d'outils opaques où le raisonnement interne est masqué.

À partir de 2026, les boucles de style ReAct sous-tendent la plupart des frameworks d'agent de production, incluant les agents LangChain et LangGraph, l'API Claude tool-use d'Anthropic, et l'API Assistants d'OpenAI avec l'interpréteur de code et la recherche de fichiers. Les extensions comme Reflexion ajoutent une étape d'auto-critique et de mise à jour de mémoire après la complétion de tâche. Les variantes multi-agent permettent à un agent ReAct de générer des sous-agents spécialisés comme ses « Actions ». Les limitations pratiques principales sont la latence—chaque cycle raisonnement-action ajoute au moins un voyage aller-retour d'inférence complet—et la croissance de la fenêtre de contexte à mesure que les traces s'accumulent sur les tâches longues.

Exemple

Un agent de support clientèle reçoit une question sur le statut de la commande : il génère une Pensée (« Je dois récupérer la commande #5892 de la base de données »), appelle l'outil de recherche de commande comme son Action, observe le résultat (« expédié 2026-06-30, livraison prévue 2026-07-03 »), génère une nouvelle Pensée (« J'ai suffisamment d'informations pour répondre »), et répond au client—le tout dans une seule boucle ReAct automatisée ne nécessitant aucune intervention humaine.

Termes liés

← Glossaire