The Verge→ оригинал

قام OpenAI بتحديث Codex: إدارة سطح المكتب وإنشاء الصور والذاكرة للمهام السابقة

أطلقت OpenAI حزمة تحديثات كبيرة لنظام تطوير الوكلاء Codex الخاص بها. يمكنه الآن إدارة التطبيقات على سطح مكتب Mac والعمل في الخلفية دون التأثير على المهام الأخرى

قام OpenAI بتحديث Codex: إدارة سطح المكتب وإنشاء الصور والذاكرة للمهام السابقة
Источник: The Verge. Коллаж: Hamidun News.

OpenAI обновил Codex — агентскую систему для автоматизации разработки — добавив возможность управлять десктопными приложениями, генерировать изображения и сохранять память о прошлых задачах. Пакет обновлений вышел на фоне усиления конкуренции с Anthropic и прямо позиционируется как ответ на растущее доминирование Claude Code. До этого обновления Codex работал преимущественно в браузерной среде и выполнял задачи в изолированных контейнерах — без прямого доступа к тому, что происходит на экране пользователя.

Теперь система получила полноценный доступ к рабочему столу macOS: агент может открывать, управлять и взаимодействовать с любыми установленными приложениями — от Xcode до Figma, от Slack до нативного терминала. Ключевой момент: Codex работает в фоновом режиме и не перехватывает управление интерфейсом, пока пользователь занят другой задачей. Несколько агентов могут действовать параллельно и независимо, каждый решая свою подзадачу.

Контекст обновления важен. По данным The Verge, OpenAI перераспределила значительную часть ресурсов именно для конкуренции с Claude Code от Anthropic. Последний завоевал исключительную популярность среди профессиональных разработчиков — благодаря точному выполнению сложных инструкций в терминале, глубокому пониманию архитектуры больших кодовых баз и способности вести работу с реальными проектами без постоянного ручного надзора.

Новый пакет Codex — прямая попытка OpenAI закрыть этот функциональный разрыв. Компания явно обозначила приоритет: сделать Codex инструментом, который разработчики выбирают по умолчанию, а не по привычке. Расширение агента на рабочий стол — логичный шаг для любого инструмента, претендующего на роль полноценного помощника разработчика.

Разработчик редко работает только в редакторе кода: нужно запустить тест в браузере, проверить визуальный результат в дизайн-инструменте, переключиться в терминал, сверить логи, открыть документацию. Если агент видит весь этот контекст — не только содержимое файлов в репозитории, — он может принимать более осознанные решения и выполнять задачи с меньшим количеством прерываний со стороны пользователя. К обновлениям также относится встроенная генерация изображений прямо в интерфейсе Codex и долгосрочная память: агент запоминает результаты прошлых сессий, контекст проекта и предпочтения команды.

Это снимает одну из главных болей при работе с агентами — необходимость каждый раз заново объяснять архитектуру проекта, стиль кода и принятые соглашения. Память — это не просто удобство: агенты без контекста склонны повторять одни и те же ошибки и терять суть задачи при переключении между сессиями. Codex как продукт имеет долгую историю.

Первая версия появилась в 2021 году и стала технической основой GitHub Copilot — инструмента, который фактически создал рынок AI-ассистентов для разработчиков. Затем OpenAI перезапустила его как самостоятельный агентский инструмент. Текущее обновление добавляет слой компьютерного управления, ранее реализованного в Operator, — компания консолидирует разрозненные технологии в единый продукт.

Для разработчиков это означает одного агента, способного работать и с кодом, и с GUI, и с памятью о проекте. Пока неизвестно, насколько стабильно управление рабочим столом работает в реальных, нетривиальных условиях. OpenAI признаёт, что часть возможностей находится на ранней стадии.

Демонстрации выглядят убедительно, но настоящий тест — это сложные сценарии: одновременная отладка в нескольких окнах, тестирование с визуальной верификацией, работа с legacy-приложениями без открытого API. Гонка агентских инструментов для разработки вышла на новый уровень. Claude Code, Cursor, Devin, Windsurf — все крупные игроки формируют свой ответ на один вопрос: кто способен выполнить задачу разработки от начала до конца с минимальным вмешательством человека, не ломая то, что уже работает?

Ответ будет виден не из анонсов, а из практики в ближайшие недели.

ЖХ
Hamidun News
AI‑новости без шума. Ежедневный редакторский отбор из 400+ источников. Продукт Жемала Хамидуна, Head of AI в Alpina Digital.
Загружаем комментарии…