Architecture d’un agent AI en production : le système complet en 13 blocs d’Anthropic
Anthropic a dévoilé l’architecture des agents en production : pas un prompt magique, mais un système clairement structuré en 13 blocs indépendants. Nous décompo

Un agent IA de production n'est pas simplement un ensemble d'instructions dans un long prompt. C'est un système complet où chaque composant gère un aspect séparé de l'opération : gestion des ressources, OODA loop, distribution des responsabilités entre agents, traitement des erreurs, surveillance. Sans une architecture claire, votre agent fonctionnera de manière imprévisible.
Ce qu'Anthropic a
Révélé L'entreprise a publié deux vrais prompts de production utilisés dans des systèmes en direct : research_lead_agent.md et research_subagent.md. Ce ne sont pas des exemples pédagogiques, des démonstrations ou des versions simplifiées. Ce sont des vrais prompts qui gèrent du vrai travail. Quand vous les analysez, vous voyez une architecture qui ne s'enseigne pas dans les cours de prompt engineering. La découverte clé : au lieu d'un long prompt magique, Anthropic utilise un système de 13 blocs clairement définis et indépendants. Chaque bloc gère une tâche et peut être réutilisé dans d'autres agents. Cela signifie que l'architecture s'échelonne non pas par réécriture, mais par composition.
13
Blocs que Tout Agent de Production Doit Avoir Voici la liste complète des composants qui doivent être présents dans tout agent de production : Rôle et persona — définir comment l'agent pense et se comporte Objectif et contexte — spécification claire de ce qui doit être fait et pourquoi Budget d'appels et plafond des ressources — le seuil pour quand arrêter OODA loop — le cycle Observe→Orient→Decide→Act qui se répète Traitement des erreurs et stratégies de fallback — actions en cas d'échec Distribution des responsabilités entre agents — répartition du travail Outils et leurs limitations — ce que l'agent peut et ne peut pas utiliser Format de sortie et validation des résultats — comment vérifier la correction Surveillance et logging — un moyen de voir ce qui se passe à l'intérieur Timeouts et logique de retry — prévention des blocages et des échecs répétés Auto-vérification et vérification — l'agent se vérifie lui-même avant la sortie Normalisation d'état — formater le résultat en forme lisible * Guardrails et couche de sécurité — prévention des violations de limites Ce n'est pas optionnel et ce n'est pas "nice to have". Si ne serait-ce qu'un composant manque, l'agent fonctionnera de manière instable et imprévisible. Je l'ai vu des dizaines de fois — les agents perdent le contexte, dépassent le budget, se bloquent sur des cas extrêmes.
Lead et
Sub : Division du Travail La différence entre un agent lead et un agent sub est fondamentale. Lead est un stratège et un coordinateur. Il voit le contexte global complet, planifie la stratégie, prend les décisions clés, gère le travail de toute une équipe d'agents sub.
Agent sub est un spécialiste étroit. Rapide, bon marché à appeler, prend une tâche spécifique et bien définie et rapporte le résultat. Sub écoute le lead et ne montre aucune initiative.
Anthropic utilise ce schéma parce qu'il s'échelonne. Un lead peut coordonner cinq agents sub. Ensuite, vous en ajoutez cinq de plus — le lead les gère.
Cinq de plus — tout fonctionne. Vous ne réécrivez pas le lead, ne changez pas l'architecture. Vous agrandissez simplement l'équipe.
Template
Prêt à l'Emploi Après avoir analysé les prompts d'Anthropic, j'ai extrait des modèles et créé un template SKILL.md. En utilisant ce template, vous pouvez passer en revue votre agent et vous assurer que vous n'avez rien oublié. C'est comme la liste de vérification d'un pilote avant le décollage, mais pour les agents IA. La règle clé : utilisez-le AVANT d'aller en production. Parce qu'ajouter des composants "à la volée" et réécrire les prompts en conditions de production est un cauchemar. Passez un jour sur l'architecture — ensuite vous en serez reconnaissant pendant des mois.
Ce
Que Cela Signifie Si vous construisez un agent en ce moment, cette architecture peut vous faire gagner des semaines de débogage. Parce que généralement tous les composants apparaissent dans le code aléatoirement quand le désastre a déjà frappé — l'agent s'est bloqué, a dépassé le budget, s'est coincé sur un cas extrême. Maintenant vous avez un template éprouvé. Utilisez-le.