Habr AI→ original

Anthropic et MCP : pourquoi les agents AI perdent leur concentration quand on leur donne trop d'outils

MCP n'est pas mort, mais l'idée qu'il suffit de donner à un agent tout le stack d'outils d'un coup s'est vite heurtée aux limites de contexte. Quand le…

Traité par IA depuis Habr AI ; édité par Hamidun News
Anthropic et MCP : pourquoi les agents AI perdent leur concentration quand on leur donne trop d'outils
Source : Habr AI. Collage: Hamidun News.
◐ Écouter l'article

MCP n'a pas disparu et n'a pas échoué en tant que norme. Mais l'idée de connecter d'un seul coup tous les outils, bases de données et API à un agent IA s'est avérée être une impasse : au lieu d'étendre les capacités, le modèle perd sa concentration et gaspille du contexte en bruit.

Quand Plus C'Est Moins

Il y a un an, MCP semblait être une réponse universelle au chaos des intégrations. Un seul protocole promettait de connecter les agents IA à GitHub, Slack, Jira, les bases de données internes et tout autre système externe sans un zoo de plugins personnalisés. L'industrie a rapidement adopté cette logique : à la fin de 2025, MCP était déjà supporté par ChatGPT, Cursor, Gemini et VS Code, et le nombre de serveurs a dépassé les 10 000, selon l'auteur. Sur le papier, cela ressemblait à un écosystème mature prêt à devenir la couche de base pour une nouvelle génération de produits avec agents.

Le problème a émergé quand les équipes ont commencé à faire l'étape la plus évidente : connecter tous les outils disponibles à l'agent d'un seul coup. Au lieu de bénéfice, cela a créé une surcharge. Avant la première demande de l'utilisateur, les schémas d'API, les descriptions de fonctions, les paramètres d'appels et les instructions de service pour le code, la documentation, le suivi des bugs et les analyses ont inondé la fenêtre du modèle. Dans certains cas, seule l'initialisation des outils consommait jusqu'à 55 000 tokens. Pour un programme normal, ce n'est pas un problème, mais un LLM doit lire tout ce volume, choisir le bon outil et mémoriser le résultat sans perdre le fil de la tâche.

"Le contexte est limité et ne devient pas plus utile simplement du volume."

Trois Modèles Fonctionnels

Une nouvelle approche a rapidement émergé de cela : la standardisation de l'accès seule ne garantit rien si le modèle voit trop d'informations non pertinentes. Alors l'attention s'est déplacée de la question « ce qui peut être connecté » à « ce que l'agent devrait voir précisément en ce moment ».

En pratique, en 2026, trois modèles se sont consolidés qui réduisent la charge cognitive sans abandonner MCP en tant que couche d'intégration.

  • Recherche d'outils. L'agent recherche d'abord l'outil approprié dans le catalogue, ne chargeant le schéma que pour l'étape actuelle.
  • Agent Skills. Au lieu d'un accès brut à l'API, le modèle reçoit une compétence prête avec une tâche étroite, comme créer un rapport de bug à partir de journaux.
  • Enveloppes CLI. Au lieu d'analyser des schémas JSON volumineux, l'agent appelle une simple commande dans le terminal avec des paramètres compréhensibles.
  • Déchargement après une étape. Les outils et les instructions sont conservés dans le contexte uniquement tant qu'ils sont réellement nécessaires, puis supprimés.

Chaque option a un compromis. Rechercher des outils ajoute un appel supplémentaire et de la latence, les compétences limitent la liberté du modèle, tandis que l'approche CLI sacrifie la flexibilité pour la fiabilité. Mais les trois schémas battent la stratégie « donner tout à l'agent à la fois » car ils économisent la ressource la plus rare — l'attention du modèle. Moins il y a de bruit, plus il y a de chances que l'agent choisisse la bonne action et ne se égare pas à mi-chemin.

Le Prix de l'Intégration Pratique

La conclusion principale de l'article est que MCP résout le problème de compatibilité mais ne résout pas le problème de la pensée. Quand un agent dispose de dizaines d'outils similaires, il ne doit pas seulement connaître leur existence, mais comparer les options, comprendre le but de chacun, sélectionner des paramètres, faire correspondre la réponse à la tâche et ne pas oublier les résultats intermédiaires. Plus le catalogue de possibilités est large, plus le risque de faux positifs, d'appels échoués et de raisonnements dénués de sens sur un contexte non pertinent est élevé.

Par conséquent, la dégradation de la qualité ici n'est pas due au protocole lui-même, mais à l'architecture construite au-dessus. D'où l'intérêt pour Agent Skills, que promeut Anthropic. Ils élèvent le niveau d'abstraction : au lieu d'opérations d'API de bas niveau, l'agent reçoit un flux de travail emballé avec une logique prédéfinie.

Dans ce mode, le modèle ne doit pas résoudre à nouveau comment communiquer avec Jira ou un autre système, mais utilise un itinéraire prêt pour une tâche métier spécifique. Cela réduit la consommation de tokens, diminue la probabilité d'erreur et rend le comportement de l'agent plus prévisible. Pour les équipes de produit, c'est un changement important : l'universalité n'est plus considérée comme un avantage inconditionnel si elle casse la stabilité.

Ce Que Cela Signifie

Pour les équipes construisant des systèmes autonomes en 2026, la question ne porte plus sur le nombre d'outils connectés. L'enjeu se déplace vers le routage, l'hygiène du contexte et les flux de travail étroits et fiables. MCP reste une norme d'intégration utile, mais l'avantage va à ceux qui montrent au modèle le strict minimum de données et de fonctions au bon moment, plutôt que tout le catalogue de possibilités à la fois.

ZK
Hamidun News
Actualités IA sans bruit. Sélection éditoriale quotidienne de plus de 400 sources. Produit de Zhemal Khamidun, Head of AI chez Alpina Digital.

Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?

AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.

Qu'en pensez-vous ?
Chargement des commentaires…