OpenAI consacre l’essentiel de ses ressources à la création d’un chercheur AI entièrement autonome
OpenAI change ses priorités et mise sur un chercheur AI entièrement autonome. La première étape est un « stagiaire AI » d’ici septembre 2026 : un système…
Traité par IA depuis MIT Technology Review ; édité par Hamidun News
OpenAI change l'orientation de ses recherches et mise non pas sur un autre chatbot, mais sur un chercheur IA autonome. L'entreprise souhaite développer un système capable de traiter des problèmes complexes pendant des semaines avec une intervention humaine minimale et qui finira par devenir un véritable 'laboratoire dans un centre de données.'
Nouveau Priorité
Selon Jacob Pachocki, Directeur Scientifique en Chef d'OpenAI, le projet devient un objectif partagé à l'échelle de l'entreprise autour duquel doivent converger les modèles de raisonnement, les systèmes d'agents et les outils d'interprétabilité. La prochaine étape est de démontrer un 'stagiaire IA autonome' d'ici septembre 2026 : un système auquel on peut assigner un ensemble limité de tâches de recherche pour plusieurs jours de travail. La phase suivante est prévue pour 2028 : un système multi-agents entièrement automatisé capable de résoudre des problèmes trop grands ou complexes pour une seule équipe de personnes.
Pour OpenAI, ce n'est pas simplement une direction de recherche élégante. L'entreprise n'est plus la seule à donner le rythme du marché comme à l'époque des premiers GPT, et elle concurrence désormais Anthropic et Google DeepMind non seulement sur la qualité des modèles, mais aussi sur ce que devient la pile de produits qui les entoure.
Le pari sur un chercheur IA semble être une tentative d'aller au-delà d'un assistant de discussion et de codage et de créer la couche suivante d'automatisation : un système qui ne fait pas que répondre aux requêtes, mais mène un travail prolongé de la formulation du problème aux résultats intermédiaires.
"Essentiellement, vous aurez un laboratoire de recherche entier à l'intérieur d'un centre de données", dit
Pachocki.
Ce Qui Est Déjà Prêt
OpenAI croit qu'un prototype précoce de cette approche est déjà visible dans Codex. Cet outil d'agent peut écrire et exécuter du code, analyser des documents, créer des visualisations, compiler des résumés et gérer de longues chaînes techniques que les humains devaient auparavant traiter manuellement.
Pachocki affirme explicitement que l'entreprise souhaite prendre ce qui a déjà réussi en programmation et transférer ce mode opératoire à une classe de problèmes plus large. La logique est simple : si un agent peut gérer indépendamment des portions substantielles de travail d'ingénierie, la même approche peut s'étendre à la science et à la recherche appliquée.
OpenAI s'attend à ce que le système futur ne dispose pas d'une seule fonction 'magique', mais d'un ensemble de compétences de recherche qui peuvent être enchaînées :
- Analyser de grands volumes de texte, de code et de notes
- Proposer des hypothèses et des approches de vérification
- Diviser les grands problèmes en sous-tâches et les gérer en parallèle
- Trouver des solutions en mathématiques, physique, biologie, chimie et scénarios de politique gouvernementale
Selon OpenAI, la base technique comprend deux directions. Premièrement, les modèles à usage général sont devenus meilleurs pour maintenir l'attention et le contexte sur des périodes plus longues : la transition de GPT-3 à GPT-4 a déjà démontré une croissance notable de l'« endurance » sur une seule tâche.
Deuxièmement, les modèles de raisonnement qui progressent à travers les problèmes étape par étape et peuvent revenir en arrière après une erreur sont mieux adaptés aux longs cycles autonomes. De plus, les modèles sont spécialement entraînés sur des tâches mathématiques et de codage complexes pour apprendre à maintenir un contexte prolongé et gérer plusieurs sous-tâches simultanément.
Où Sont les Points Faibles
La question la plus évidente n'est pas l'ambition, mais la fiabilité. Les chercheurs indépendants reconnaissent que l'idée d'un scientifique IA autonome est une continuation logique du succès des agents de programmation, mais ils avertissent : dès qu'un système doit exécuter non pas une seule étape mais une longue chaîne d'actions, la probabilité d'erreur à chaque étape commence à s'accumuler.
Dans les tests de l'Allen Institute for AI, les modèles forts ont déjà démontré une bonne performance sur les tâches scientifiques, mais commettaient quand même des erreurs régulières. Même si les versions plus récentes se sont améliorées, le problème ne disparaît pas : proposer une idée forte est une chose ; amener de manière cohérente une enquête de plusieurs jours à une conclusion correcte en est une autre.
Il y a aussi une couche de risques plus difficile. Pachocki dit que OpenAI mise sur la surveillance de la chaîne de pensée : le modèle laisse une sorte de notes de travail au fur et à mesure qu'il résout, tandis que d'autres modèles ou chercheurs surveillent pour s'assurer qu'il ne dérive pas vers un comportement dangereux ou simplement incorrect.
Mais il admet lui-même que le contrôle complet n'est pas encore en place. Un système autonome peut mal interpréter les instructions, dépasser les limites des tâches, devenir une cible d'attaque ou avoir accès à des outils trop puissants.
Par conséquent, les versions vraiment puissantes de tels agents, selon lui, devront être maintenues dans des environnements sandbox isolés et restreints jusqu'à ce que les mécanismes de surveillance deviennent nettement plus fiables.
Ce Que Cela Signifie
Si OpenAI exécute au moins partiellement ce plan, le prochain saut de l'IA sera lié non pas à des chatbots plus conversationnels, mais à des systèmes auxquels on peut confier des portions de travail intellectuel réel pendant des jours ou des semaines.
Mais c'est précisément là que réside le vrai test : le marché croit facilement aux progrès rapides des agents, tandis que la science et la sécurité exigeront non pas des effets de démonstration, mais des résultats reproductibles sous supervision humaine.
Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?
AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.