Habr AI→ оригинал

OpenAI запустила /goal в Codex CLI: автономный агент или дорогой способ писать код?

OpenAI выпустила /goal в Codex CLI 0.128.0 — команду для полностью автономной разработки, где агент сам пишет код, тестирует и рефлексирует часами. На практике:

OpenAI запустила /goal в Codex CLI: автономный агент или дорогой способ писать код?
Источник: Habr AI. Коллаж: Hamidun News.
◐ Слушать статью

OpenAI выпустила Codex CLI 0.128.0 с командой /goal — режимом, в котором AI-агент работает полностью автономно: пишет код, тестирует, рефлексирует и продолжает работу часами. Звучит как революция в разработке, но месяц реальной работы в команде показал совсем другую картину.

Как устроена /goal

Команда /goal работает поверх GPT-5.5 и строится на пятиуровневой архитектуре, где каждый слой отвечает за определённую фазу работы. Агент видит свой код, может запускать тесты, читать логи ошибок и анализирует результаты в полном цикле. Система специально инжектирует системный промпт так, чтобы избежать proxy signals — ложных сигналов о завершении задачи, которые обычно ломают автономные цепочки. Первой /goal подхватили не разработчики, а исследователи. Они быстро выяснили, что для специфических задач — вроде оптимизации под конкретные API или поиска узких мест в коде — агент может работать часами и давать действительно полезный результат. Как обычно бывает: кто использует, тот и находит нишу.

Реальная цена автономии

Главное открытие первых недель работы: счётчик токенов скачет в 3-5 раз непредсказуемо. Не вдвое, как можно было бы предположить. В пять раз и выше. Вдвое можно планировать и подстраивать бюджет. В пять раз — это уже рулетка, и предсказать расход становится невозможно. На одной из публичных задач OpenAI удалось достичь +25% fps за час на xhigh-версии GPT-5.5 — это реальный результат. Но полный ценовой счёт оставался скрыт, что создаёт неправильное представление о рентабельности.

  • Токены растят в 3-5 раз непредсказуемо MCP-вызовы молча отваливаются при quota wall Нет прозрачного счётчика расходов в реальном времени * /side команда неожиданно стала использоваться как костыль для расшифровки ошибок GPT-5.5 ## Когда это ломается При упирании в quota wall происходит молчаливый отказ MCP-вызовов. Это критично, потому что агент не понимает причину отказа и может в цикле повторять неработающий код, впустую тратя токены. Система не предупреждает о лимитах заранее — только молча падает, оставляя разработчика в неведении.
Разработчики начали использовать /side для расшифровки того, что GPT-5.5 не понял с первого раза, когда /goal застревает в цикле.

Это как-то странно для агента, который должен быть «автономным».

Что это значит /goal — это не панацея и не революция, а

специализированный инструмент для конкретных задач, где цена агента с высокой переменной стоимостью не критична. Для production-разработки требуется понимание реальной цены и более прозрачное логирование лимитов. Никакого евангелизма: есть инструмент с ясными граблями и открытыми подводными камнями.

ЖХ
Hamidun News
AI‑новости без шума. Ежедневный редакторский отбор из 400+ источников. Продукт Жемала Хамидуна, Head of AI в Alpina Digital.
Что вы думаете?
Загружаем комментарии…