OpenAI вскрыла капот: как их агенты пишут код (и почему это не магия)
Пока индустрия ждет новых моделей, OpenAI решила поиграть в прозрачность. Компания опубликовала детальный разбор работы своих автономных агентов для написания к

OpenAI нарушила свой привычный обет молчания. После месяцев, когда компания хранила секреты тщательнее, чем рецепт кока-колы, разработчики внезапно выложили подробности того, как их модели превращаются из продвинутых автодополнителей текста в полноценных инженеров. Речь идет о техническом устройстве кодинг-агентов, и этот разбор дает нам редкую возможность заглянуть в будущее, где программирование перестает быть ручным трудом. Согласитесь, название OpenAI в последние годы выглядело скорее иронично, но этот технический пост возвращает нас во времена, когда компания действительно делилась экспертизой.
В центре внимания — так называемый «цикл агента» или agent loop. Раньше мы привыкли, что нейросеть просто выдает кусок кода в ответ на запрос. Если он не работал, это была ваша проблема. Теперь подход изменился коренным образом. OpenAI описывает систему, которая работает итерациями: модель пишет код, тут же запускает его в закрытой «песочнице», получает отчет об ошибках от компилятора и возвращается к началу, чтобы исправить свои же огрехи. Этот процесс повторяется до тех пор, пока тесты не пройдут успешно. По сути, компания автоматизировала тот самый процесс, которым занимается любой джун в первый год работы, только делает это в тысячи раз быстрее.
Почему это важно именно сейчас? Давайте будем честными: в последнее время Claude 3.5 Sonnet от Anthropic изрядно подпортил настроение команде Сэма Альтмана, захватив лидерство в программировании. Публикация технических деталей — это не просто жест доброй воли, а попытка показать, что OpenAI все еще контролирует архитектурную мысль. Они делают ставку не на размер модели, а на сложность системы вокруг нее. Выяснилось, что даже не самая мощная модель в правильной обвязке из инструментов отладки может показывать результаты лучше, чем «голый» суперкомпьютер. Это фундаментальный сдвиг в индустрии: мы переходим от гонки параметров к гонке агентских архитектур.
Интересно, как OpenAI описывает работу с контекстом. Агенты теперь не просто читают один файл, они умеют «осматриваться» в репозитории, понимая связи между разными частями проекта. Это решает главную проблему ИИ-кодинга — когда исправляя одну строчку, модель ломает всю архитектуру приложения. Теперь агент сначала строит карту зависимостей и только потом берется за виртуальную клавиатуру. Такой подход позволяет решать задачи на уровне SWE-bench — сложнейшего теста для ИИ, где нужно исправлять реальные баги в открытых проектах на GitHub. И судя по цифрам, которые приводит компания, мы находимся на пороге момента, когда ИИ сможет закрывать до половины рутинных тикетов в Jira без участия человека.
Конечно, тут не обходится без иронии. Пока OpenAI учит агентов писать идеальный код, разработчики по всему миру начинают задаваться вопросом: а не пишут ли они сейчас инструмент для собственного увольнения? Впрочем, до полной замены человека еще далеко. Главная проблема — это «галлюцинации в логике», когда код синтаксически верен и даже проходит тесты, но делает совсем не то, что просил бизнес. Агенты OpenAI пока не научились спорить с плохими ТЗ, и в этом наше временное спасение. Однако вектор задан четко: разработка софта превращается в процесс надзора за армией автономных агентов, а не в написание строк вручную.
Главное: эпоха простых промптов для кода заканчивается, наступает эра сложных агентских систем. Сможет ли OpenAI удержать лидерство в этом сегменте, или их обгонят более гибкие стартапы?