DeepMind : plus d’agents, de moins bons résultats ?
DeepMind a publié une étude qui remet en cause l’idée répandue selon laquelle l’augmentation du nombre d’agents d’AI dans un système améliore le résultat…
Traité par IA depuis Jiqizhixin (机器之心) ; édité par Hamidun News
L'industrie de l'intelligence artificielle a longtemps vécu selon une logique simple : plus c'est mieux. Plus de paramètres, plus de données, plus de puissance de calcul. Maintenant, DeepMind remet en question cette idée—la conviction que l'augmentation du nombre d'agents d'IA au sein d'un système conduit automatiquement à une augmentation de ses capacités. La nouvelle recherche de l'entreprise suggère que les architectures multi-agents ont un plafond structurel, et s'en rapprocher pourrait être coûteux pour ceux qui ont misé sur l'augmentation d'échelle des agents comme principal chemin à suivre.
L'idée de systèmes multi-agents n'est pas nouvelle en soi. Au cours des deux dernières années, les principaux laboratoires—OpenAI, Anthropic, Google—ont activement promu un concept dans lequel plusieurs agents d'IA spécialisés travaillent ensemble, répartissant les tâches et vérifiant mutuellement les résultats. On supposait qu'une telle architecture imitait l'intelligence collective : un agent écrit du code, un autre le teste, un troisième cherche des erreurs, et un coordinateur général supervise le processus. La logique semblait impeccable—jusqu'à ce que DeepMind commence à mesurer ce qui se passe réellement en pratique.
La recherche a trouvé un effet contre-intuitif : à partir d'un certain seuil, l'ajout de nouveaux agents n'améliore pas le résultat mais l'aggrave. La raison réside dans les coûts de coordination. Chaque nouvel agent du système n'est pas simplement de la puissance de calcul supplémentaire, mais aussi une nouvelle source de contradictions potentielles. Les agents doivent coordonner les résultats intermédiaires, transmettre le contexte et résoudre les conflits d'interprétation. Avec un petit nombre de participants, ces frais généraux sont négligeables. Au fur et à mesure que leur nombre augmente, ils commencent à consommer les mêmes gains pour lesquels le système a été créé. À un certain moment, le système cesse d'être un orchestre et devient une foule.
Techniquement, le problème est aggravé par le fait que les modèles de langage modernes manquent d'un mécanisme fiable pour résoudre les contradictions entre agents. Lorsque deux agents parviennent à des conclusions différentes—et cela se produit d'autant plus souvent que la tâche est complexe—le système nécessite soit un arbitre, soit un protocole de vote, soit un retour à l'une des variantes. Chacune de ces approches introduit ses propres distorsions.
Un arbitre peut se tromper. Le vote à la majorité tue les solutions non standard mais correctes. Un retour signifie qu'une partie du travail a été faite en vain.
Tout cela—non pas des bugs dans des implémentations spécifiques, mais des propriétés fondamentales des systèmes distribués avec lesquels les ingénieurs se battent depuis des décennies, même dans les logiciels classiques.
Pour l'industrie, cette découverte a des conséquences pratiques sérieuses. Les startups et les grandes entreprises ont investi des ressources importantes dans la construction des soi-disant frameworks d'agents—AutoGen de Microsoft, CrewAI, LangGraph et de nombreux autres outils orientés spécifiquement vers l'orchestration d'un grand nombre d'agents. La thèse selon laquelle l'augmentation d'échelle des agents compense les limitations des modèles individuels est devenue presque un dogme dans les pitchs technologiques. Si DeepMind a raison, certaines de ces solutions architecturales devront être reconsidérées non pas dans des années, mais dès maintenant.
En même temps, il est important de ne pas surestimer le pessimisme de la recherche. Le « plafond des agents » n'est pas une condamnation à mort pour l'approche multi-agents en tant que telle, mais plutôt une indication que l'augmentation d'échelle doit être intelligente, non mécanique. Les systèmes avec un petit nombre d'agents bien spécialisés, des zones de responsabilité clairement définies et un chevauchement minimal des tâches continuent à démontrer des gains de productivité réels. Le problème surgit lorsque les développeurs ajoutent des agents selon le principe du « plus c'est mieux » sans réfléchir à la façon dont la coordination entre eux est organisée.
La découverte de DeepMind s'inscrit dans une discussion plus large sur les limitations de l'augmentation d'échelle en IA, qui s'est intensifiée ces derniers mois. Après plusieurs années au cours desquelles l'augmentation de la puissance de calcul a presque automatiquement fourni des améliorations de qualité, l'industrie connaît de plus en plus des rendements décroissants—qu'il s'agisse de l'entraînement préalable de grands modèles ou, maintenant, des architectures d'agents. Cela ne signifie pas que le progrès s'est arrêté.
Cela signifie que les recettes simples ne fonctionnent plus et doivent être remplacées par des solutions architecturales qualitatives. Pour les laboratoires qui concourent pour le leadership à l'ère de l'IA basée sur les agents, les résultats de DeepMind ne sont pas une cause de panique, mais une raison de reconsidérer sérieusement comment ils envisagent exactement de construire les systèmes de prochaine génération.
Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?
AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.