Ars Technica→ original

OpenAI a levé le capot : comment leurs agents écrivent du code (et pourquoi ce n'est pas de la magie)

OpenAI a brisé son silence. Après des mois durant lesquels l'entreprise gardait ses secrets aussi jalousement que la formule du Coca-Cola, les développeurs…

Traité par IA depuis Ars Technica ; édité par Hamidun News
OpenAI a levé le capot : comment leurs agents écrivent du code (et pourquoi ce n'est pas de la magie)
Source : Ars Technica. Collage: Hamidun News.
◐ Écouter l'article

OpenAI a brisé son silence. Après des mois durant lesquels l'entreprise gardait ses secrets aussi jalousement que la formule du Coca-Cola, les développeurs ont soudainement divulgué des détails sur la façon dont leurs modèles se transforment d'outils avancés d'autocomplétion de texte en véritables ingénieurs. Il s'agit de l'architecture technique des agents de codage, et cette analyse nous offre une opportunité rare de jeter un coup d'œil sur un avenir où la programmation cesse d'être un travail manuel. Il faut dire que le nom OpenAI paraissait plutôt ironique ces dernières années, mais cet article technique nous ramène aux temps où l'entreprise partageait réellement son expertise.

Au centre de l'attention se trouve la boucle d'agent dite « agent loop ». Auparavant, nous avions l'habitude que les réseaux de neurones produisent simplement un morceau de code en réponse à une demande. S'il ne fonctionnait pas, c'était votre problème.

Maintenant, l'approche a radicalement changé. OpenAI décrit un système qui fonctionne de manière itérative : le modèle écrit du code, l'exécute immédiatement dans un « bac à sable » fermé, reçoit un rapport d'erreurs du compilateur et revient au début pour corriger ses propres erreurs. Ce processus se répète jusqu'à ce que les tests réussissent.

En essence, l'entreprise a automatisé le processus par lequel passe tout développeur junior au cours de sa première année de travail, sauf qu'elle le fait des milliers de fois plus vite.

Pourquoi cela est-il important maintenant ? Soyons honnêtes : dernièrement, Claude 3.5 Sonnet d'Anthropic a considérablement découragé l'équipe de Sam Altman, prenant la tête en programmation. La publication de détails techniques n'est pas simplement un geste de bonne foi, mais une tentative de montrer qu'OpenAI contrôle toujours la pensée architecturale. Ils ne misent pas sur la taille du modèle, mais sur la complexité du système qui l'entoure. Il s'avère que même un modèle moins puissant avec les bons outils de débogage peut afficher de meilleurs résultats qu'un « superordinateur brut ». C'est un changement fondamental dans l'industrie : nous passons d'une course aux paramètres à une course aux architectures d'agents.

C'est intéressant de voir comment OpenAI décrit le travail avec le contexte. Les agents ne se contentent plus de lire un seul fichier—ils peuvent « regarder autour » du référentiel, en comprenant les connexions entre différentes parties du projet. Cela résout le principal problème du codage par IA : lorsqu'on corrige une ligne, le modèle casse toute l'architecture de l'application.

Maintenant, l'agent construit d'abord une carte des dépendances et ce n'est qu'ensuite qu'il se met au travail avec le clavier virtuel. Cette approche permet de résoudre des tâches au niveau du SWE-bench—le test le plus difficile pour l'IA, où il faut corriger de vrais bugs dans des projets open source sur GitHub. Et à en juger par les chiffres que l'entreprise fournit, nous sommes à la veille d'un moment où l'IA pourra fermer jusqu'à la moitié des tickets Jira routiniers sans intervention humaine.

Bien sûr, l'ironie ne peut pas manquer. Tandis qu'OpenAI enseigne aux agents à écrire du code parfait, les développeurs du monde entier commencent à se demander : ne sont-ils pas en train d'écrire un outil pour leur propre chômage maintenant ? Cependant, le remplacement complet des humains est encore loin.

Le principal problème est les « hallucinations logiques », lorsque le code est syntaxiquement correct et passe même les tests, mais fait quelque chose de complètement différent de ce que l'entreprise a demandé. Les agents d'OpenAI n'ont pas encore appris à contester les spécifications mal rédigées, et c'est notre salut temporaire. Cependant, la direction est claire : le développement logiciel se transforme en un processus de supervision d'une armée d'agents autonomes, plutôt qu'en une écriture manuelle de lignes.

L'essentiel : l'époque des simples prompts de code prend fin, et l'ère des systèmes complexes d'agents commence. OpenAI pourra-t-elle maintenir sa longueur d'avance dans ce segment, ou des startups plus flexibles la dépasseront-elles ?

ZK
Hamidun News
Actualités IA sans bruit. Sélection éditoriale quotidienne de plus de 400 sources. Produit de Zhemal Khamidun, Head of AI chez Alpina Digital.

Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?

AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.

Qu'en pensez-vous ?
Chargement des commentaires…