xAI запустила /goal в Grok Build: автономный агент планирует и верифицирует многошаговые задачи
xAI добавила в Grok Build режим /goal — автономное выполнение длинных многошаговых задач без ручного контроля каждого шага. Вы передаёте одну цель, агент сам…
Traité par IA depuis MarkTechPost ; édité par Hamidun News
xAI a lancé /goal dans Grok Build : l'agent autonome planifie et vérifie les tâches multi-étapes
xAI a lancé le mode /goal dans Grok Build — un outil pour l'exécution autonome de tâches longues et multi-étapes qui construit un plan de lui-même, progresse via une checklist et vérifie le résultat jusqu'à achèvement complet.
Comment fonctionne /goal
Le principe de fonctionnement diffère du dialogue habituel avec un LLM. Vous formulez un objectif unique — par exemple, "implémente l'authentification OAuth", "écris et teste un analyseur JSON" ou "migre un composant de class à hooks" — et le passez à l'agent. Ensuite /goal prend le contrôle.
L'agent analyse la tâche, construit un plan étape par étape et le divise en actions spécifiques. Chaque action est exécutée indépendamment : l'agent écrit du code, exécute des commandes, vérifie les résultats intermédiaires. Si quelque chose se passe mal — il corrige l'approche sans votre participation. Le cycle planification → exécution → vérification se répète jusqu'à ce que l'objectif original soit entièrement atteint.
En mode habituel, un développeur dialogue avec un LLM : fournit un prompt, reçoit une réponse, corrige, clarifie, demande à nouveau. Dans /goal, vous déléguez non seulement l'exécution de la tâche, mais aussi la gestion de tout le processus. C'est un niveau fondamentalement différent d'autonomie.
Vérification intégrée des résultats
La caractéristique clé du mode est la vérification intégrée à chaque étape. /goal n'exécute pas les étapes de manière mécanique en séquence : après chaque étape, l'agent évalue si le résultat intermédiaire correspond aux attentes, puis seulement avance.
Pour les tâches de coding multi-étapes, c'est critique :
- Écrire du code — étape 1, pas le résultat final
- Exécuter les tests et vérifier qu'ils passent — étape 2
- Vérifier que le nouveau code n'a pas cassé le comportement existant — étape 3
- Confirmer que l'objectif est entièrement atteint — vérification finale
Le manque de vérification est l'une des plaintes les plus courantes concernant les agents de coding existants. L'outil a techniquement "complété" la tâche, mais le résultat ne correspond pas à ce qui est nécessaire. Les erreurs "silencieuses" — quand un agent avance avec confiance sur le mauvais chemin — sont l'un des scénarios les plus difficiles dans les systèmes autonomes. /goal tente de le résoudre.
/goal dans le contexte du marché
xAI positionne Grok Build comme un environnement de développement à part entière où Grok participe au cycle de création de code, plutôt que de simplement répondre à des questions. /goal est la prochaine étape de cette stratégie.
"Vous passez un objectif unique, l'agent planifie l'approche, parcourt
la checklist et vérifie le résultat jusqu'à achèvement", — c'est ainsi que l'équipe xAI décrit le mode.
Le marché des agents pour développeurs se sature. GitHub Copilot Workspace propose des sessions de planification multi-étapes directement dans le référentiel. Devin de Cognition se positionne comme un agent développeur entièrement autonome. JetBrains, Cursor et autres IDEs intègrent les capacités des agents. Google et Anthropic développent des modes agents dans leurs plateformes. Dans ce contexte, /goal est une réponse logique de xAI : un mode autonome où les utilisateurs travaillent déjà avec du code.
Il est notable que les agents autonomes deviennent une fonction standard à une vitesse remarquable, plutôt qu'un développement expérimental. Il y a un an, de telles capacités étaient limitées aux outils B2B de niche. Aujourd'hui, elles sont déployées directement dans les produits grand public pour les développeurs.
Que cela signifie
Quand un outil planifie, exécute et vérifie de lui-même, le développeur passe en mode définition de tâches au lieu de micromanager chaque étape. Pour les longs projets de coding, cela change tout le scénario de travail. La question n'est plus si les agents autonomes sont nécessaires — ils sont là. La question est avec quelle fiabilité ils gèrent la vérification quand la tâche est vraiment complexe.
Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?
AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.
L'essentiel de l'IA — une fois par semaine
Sept actus qui ont vraiment compté, choisies à la main. Sans bruit ni communiqués.
C'est fait ! Vérifiez votre boîte mail pour la confirmation.