Comment fonctionnent les agents AI pour écrire du code et ce qu’il est important d’en savoir
Ars Technica a publié une analyse détaillée du fonctionnement des agents AI pour le coding, de Cursor et GitHub Copilot à Devin et Claude Code. Parmi les…
Traité par IA depuis Ars Technica ; édité par Hamidun News
Le programmeur de 2025 écrit de moins en moins du code à partir de zéro. Il formule une tâche, lance un agent IA et observe comment celui-ci génère des dizaines de fichiers, refactorise l'architecture et exécute même des tests. Des outils comme Cursor, GitHub Copilot Workspace, Devin et Claude Code se sont transformés d'expériences exotiques en réalité quotidienne pour des centaines de milliers de développeurs au cours de l'année dernière.
Mais rares sont les utilisateurs qui comprennent vraiment ce qui se passe sous le capot. Ars Technica a publié une analyse détaillée de la mécanique interne des agents IA pour l'écriture de code, et les conclusions méritent l'attention de quiconque confie à la machine au moins une partie de son travail.
Le fondement de tout agent de codage est un grand modèle de langage, qu'il s'agisse de GPT-4o, Claude 3.5 Sonnet ou Gemini. Mais le modèle lui-même n'est qu'un moteur.
Un agent est toute une structure d'ingénierie autour de lui. Le premier problème, et peut-être le plus critique, que les développeurs d'agents résolvent est la limitation de la fenêtre de contexte. Même les modèles les plus avancés ont une fenêtre finie : 128 ou 200 mille jetons semble impressionnant, mais un vrai projet logiciel peut contenir des millions de lignes de code.
Les agents y font face par un ensemble d'astuces : ils indexent la base de code, construisent des cartes sémantiques du référentiel, extraient uniquement les fragments pertinents et compressent le contexte, en jetant ce que le modèle a déjà "traité". Essentiellement, l'agent agit comme un bibliothécaire intelligent qui apporte au modèle exactement les livres dont il a besoin pour répondre à une question spécifique, plutôt que de déverser toute la bibliothèque sur la table.
Le deuxième mécanisme clé est les chaînes de raisonnement, ou chain-of-thought. Au lieu de générer une réponse d'un coup, l'agent divise une tâche complexe en étapes séquentielles. D'abord il analyse la structure du projet, puis formule un plan de modifications, puis met en œuvre chaque étape, vérifie le résultat et ajuste le cap si nécessaire.
Ce n'est pas qu'un simple procédé stylistique — la recherche montre que le raisonnement étape par étape réduit radicalement le nombre d'erreurs lors de la résolution de problèmes complexes. Certains agents vont plus loin et utilisent ce qu'on appelle une architecture multi-agent : un modèle agit comme "architecte" et décompose la tâche, un autre écrit du code, un troisième s'occupe de l'examen, un quatrième des tests. Ils communiquent entre eux via des prompts structurés, imitant le travail d'une vraie équipe de développement.
C'est ainsi que fonctionne Devin de Cognition et plusieurs autres systèmes avancés.
Mais derrière des démonstrations impressionnantes se cachent des limitations sérieuses dont il vaut la peine de se souvenir. La principale est les hallucinations. Un agent peut utiliser en toute confiance une API inexistante, appeler des fonctions avec des arguments incorrects ou créer du code qui semble impeccable mais contient des erreurs logiques subtiles.
Le problème est aggravé par le fait que les agents fonctionnent de manière autonome : si un autocomplétion classique comme le Copilot précoce suggérait une ligne que le développeur évaluait immédiatement, alors un agent moderne peut générer des centaines de lignes dans une douzaine de fichiers. Vérifier manuellement un tel volume est une tâche non triviale, et la tentation de simplement cliquer sur "accepter tout" est grande.
Un autre souci est la sécurité. La recherche a déjà documenté des cas où des agents IA ont introduit des vulnérabilités dans le code : des injections SQL au traitement dangereux de l'entrée utilisateur. Le modèle optimise le code pour "ça marche", pas pour "c'est sécurisé", et sans exigences explicites de sécurité, il peut choisir le chemin le plus simple, mais non sécurisé. Pour les équipes travaillant avec des données sensibles ou des systèmes financiers, ce n'est pas un risque abstrait, mais une menace concrète.
Il y a aussi un effet plus subtil que l'industrie commence à peine à réaliser. Quand un développeur s'appuie sur un agent pour écrire une part significative du code, il perd graduellement une compréhension profonde de sa propre base de code. Le code écrit par une machine est souvent stylistiquement étranger à l'équipe, utilise des modèles inhabituels et est plus difficile à déboguer. Un paradoxe émerge : un outil conçu pour accélérer le développement peut ralentir la maintenance du produit à long terme.
Tout cela ne signifie pas qu'il faut abandonner les agents IA. Ils accélèrent vraiment les tâches routinières, aident à apprendre des frameworks méconnus et abaissent la barrière d'entrée à la programmation. Mais il faut les traiter comme un stagiaire très capable, mais inexpérimenté : il peut faire beaucoup, mais chacun de ses résultats exige l'examen d'un collègue senior.
Comprendre exactement comment l'agent prend les décisions — comment il compresse le contexte, comment il divise les tâches, où se trouvent ses angles morts — transforme la curiosité académique en compétence pratique. Dans un monde où les agents IA écrivent de plus en plus de code, la maîtrise de leur mécanique devient une compétence aussi fondamentale pour les développeurs que connaître Git ou pouvoir lire les journaux.
Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?
AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.