OpenAI обновил Codex: управление десктопом, генерация изображений и память о прошлых задачах
OpenAI выпустил крупный пакет обновлений для своей агентской системы разработки Codex. Теперь она умеет управлять приложениями на рабочем столе Mac, работает в

OpenAI обновил Codex — агентскую систему для автоматизации разработки — добавив возможность управлять десктопными приложениями, генерировать изображения и сохранять память о прошлых задачах. Пакет обновлений вышел на фоне усиления конкуренции с Anthropic и прямо позиционируется как ответ на растущее доминирование Claude Code. До этого обновления Codex работал преимущественно в браузерной среде и выполнял задачи в изолированных контейнерах — без прямого доступа к тому, что происходит на экране пользователя.
Теперь система получила полноценный доступ к рабочему столу macOS: агент может открывать, управлять и взаимодействовать с любыми установленными приложениями — от Xcode до Figma, от Slack до нативного терминала. Ключевой момент: Codex работает в фоновом режиме и не перехватывает управление интерфейсом, пока пользователь занят другой задачей. Несколько агентов могут действовать параллельно и независимо, каждый решая свою подзадачу.
Контекст обновления важен. По данным The Verge, OpenAI перераспределила значительную часть ресурсов именно для конкуренции с Claude Code от Anthropic. Последний завоевал исключительную популярность среди профессиональных разработчиков — благодаря точному выполнению сложных инструкций в терминале, глубокому пониманию архитектуры больших кодовых баз и способности вести работу с реальными проектами без постоянного ручного надзора.
Новый пакет Codex — прямая попытка OpenAI закрыть этот функциональный разрыв. Компания явно обозначила приоритет: сделать Codex инструментом, который разработчики выбирают по умолчанию, а не по привычке. Расширение агента на рабочий стол — логичный шаг для любого инструмента, претендующего на роль полноценного помощника разработчика.
Разработчик редко работает только в редакторе кода: нужно запустить тест в браузере, проверить визуальный результат в дизайн-инструменте, переключиться в терминал, сверить логи, открыть документацию. Если агент видит весь этот контекст — не только содержимое файлов в репозитории, — он может принимать более осознанные решения и выполнять задачи с меньшим количеством прерываний со стороны пользователя. К обновлениям также относится встроенная генерация изображений прямо в интерфейсе Codex и долгосрочная память: агент запоминает результаты прошлых сессий, контекст проекта и предпочтения команды.
Это снимает одну из главных болей при работе с агентами — необходимость каждый раз заново объяснять архитектуру проекта, стиль кода и принятые соглашения. Память — это не просто удобство: агенты без контекста склонны повторять одни и те же ошибки и терять суть задачи при переключении между сессиями. Codex как продукт имеет долгую историю.
Первая версия появилась в 2021 году и стала технической основой GitHub Copilot — инструмента, который фактически создал рынок AI-ассистентов для разработчиков. Затем OpenAI перезапустила его как самостоятельный агентский инструмент. Текущее обновление добавляет слой компьютерного управления, ранее реализованного в Operator, — компания консолидирует разрозненные технологии в единый продукт.
Для разработчиков это означает одного агента, способного работать и с кодом, и с GUI, и с памятью о проекте. Пока неизвестно, насколько стабильно управление рабочим столом работает в реальных, нетривиальных условиях. OpenAI признаёт, что часть возможностей находится на ранней стадии.
Демонстрации выглядят убедительно, но настоящий тест — это сложные сценарии: одновременная отладка в нескольких окнах, тестирование с визуальной верификацией, работа с legacy-приложениями без открытого API. Гонка агентских инструментов для разработки вышла на новый уровень. Claude Code, Cursor, Devin, Windsurf — все крупные игроки формируют свой ответ на один вопрос: кто способен выполнить задачу разработки от начала до конца с минимальным вмешательством человека, не ломая то, что уже работает?
Ответ будет виден не из анонсов, а из практики в ближайшие недели.