xAI запустила /goal в Grok Build: автономный агент планирует и верифицирует многошаговые задачи
xAI добавила в Grok Build режим /goal — автономное выполнение длинных многошаговых задач без ручного контроля каждого шага. Вы передаёте одну цель, агент сам…
AI-обработка оригинала MarkTechPost; редакция Hamidun News
xAI запустила в Grok Build режим /goal — инструмент для автономного выполнения длинных многошаговых задач, который сам строит план, движется по чеклисту и верифицирует результат до полного завершения.
Как работает /goal Принцип работы отличается от привычного диалога с LLM.
Вы формулируете одну цель — например, «реализуй авторизацию через OAuth», «напиши и протестируй парсер JSON» или «перенеси компонент с class на hooks» — и отдаёте её агенту. Дальше /goal берёт управление на себя. Агент анализирует задачу, строит пошаговый план и разбивает его на конкретные действия. Каждое действие выполняется самостоятельно: агент пишет код, запускает команды, проверяет промежуточный результат. Если что-то идёт не так — корректирует подход без вашего участия. Цикл планирование → выполнение → проверка повторяется до тех пор, пока исходная цель не будет полностью достигнута. В привычном режиме разработчик ведёт диалог с LLM: даёт промпт, получает ответ, исправляет, уточняет, снова запрашивает. В /goal вы делегируете не только выполнение задачи, но и управление всем процессом. Это принципиально другой уровень автономии.
Встроенная верификация результата
Ключевая особенность режима — встроенная проверка на каждом шаге. /goal не выполняет шаги механически по очереди: после каждого этапа агент оценивает, соответствует ли промежуточный итог ожиданиям, и только потом движется дальше. Для многошаговых coding-задач это критически важно: Написать код — шаг 1, не финал Запустить тесты и убедиться, что они проходят — шаг 2 Проверить, что новый код не сломал существующее поведение — шаг 3 Убедиться, что цель достигнута в полном объёме — финальная верификация Именно отсутствие верификации — одна из самых частых претензий к существующим coding-агентам.
Инструмент технически «выполнил» задачу, но результат не соответствует тому, что нужно. «Тихие» ошибки — когда агент уверенно движется по неправильному пути — один из сложнейших сценариев в автономных системах. /goal пытается его закрыть.
/goal в контексте рынка xAI позиционирует
Grok Build как полноценную среду разработки, где Grok участвует в цикле создания кода, а не просто отвечает на вопросы. /goal — следующий шаг в этой стратегии.
«Вы передаёте одну цель, агент планирует подход, проходит по чеклисту и верифицирует результат до завершения», — так описывает режим команда xAI.
Рынок агентов для разработчиков становится насыщенным. GitHub Copilot Workspace предлагает многошаговые planning-сессии прямо в репозитории. Devin от Cognition позиционируется как полностью автономный агент-разработчик. JetBrains, Cursor и другие IDE интегрируют агентные возможности. Google и Anthropic развивают агентные режимы в своих платформах. На этом фоне /goal — логичный ответ xAI: автономный режим там, где пользователи уже работают с кодом. Примечательно, с какой скоростью автономные агенты превращаются в стандартную функцию, а не в экспериментальную разработку. Ещё год назад такие возможности были уделом узких B2B-инструментов. Сегодня их выводят напрямую в массовые продукты для разработчиков.
Что это значит
Когда инструмент сам планирует, выполняет и проверяет, разработчик переходит в режим постановки задач вместо микроменеджмента каждого шага. Для длинных coding-проектов это меняет весь рабочий сценарий. Вопрос уже не в том, нужны ли автономные агенты — они здесь. Вопрос в том, насколько надёжно они справляются с верификацией, когда задача действительно сложная.
Хотите не читать про ИИ, а внедрить его?
«AI News» — это полезные новости из мира ИИ. Системно научиться работать с нейросетями и применять их в работе — в Hamidun Academy.
Главное из мира ИИ — раз в неделю
7 ключевых событий недели, отобранных вручную. Без шума, репостов и пресс-релизов.
Готово! Проверьте почту — мы отправили подтверждение.