Habr AI→ оригинал

OpenAI integra tecnologias Sky no Codex para Mac e aprimora gerenciamento de aplicativos em segundo plano

OpenAI integrou tecnologias Sky no Codex para Mac e aprimorou significativamente o modo de gerenciamento de computador. O agente agora trabalha com múltiplos ap

OpenAI integra tecnologias Sky no Codex para Mac e aprimora gerenciamento de aplicativos em segundo plano
Источник: Habr AI. Коллаж: Hamidun News.

OpenAI превратила Codex для Mac из инструмента для написания кода в полноценного оператора рабочего стола: агент теперь умеет управлять приложениями в фоне, переключаться между несколькими окнами и выполнять рутинные действия, не перетягивая их на передний план и не требуя постоянного вмешательства пользователя. Ключевое обновление связано с технологией Sky — macOS-стартапа, который OpenAI официально приобрела вместе с командой разработчиков. На уровне продукта это уже не выглядит как побочный эксперимент.

В Codex появился встроенный режим управления компьютером, который позволяет агенту видеть, куда он нажимает, вводить текст, открывать приложения и работать сразу в нескольких окнах. Важно, что все это происходит в фоне: пользователь может продолжать свою работу, пока агент параллельно разбирает задачи в других программах. Для Mac-среды, где многие процессы до сих пор плохо автоматизируются, это заметный сдвиг.

Технически новый подход интересен тем, что Codex опирается не только на запись экрана и имитацию кликов по картинке. Вместо этого система использует механизмы универсального доступа macOS, которые позволяют считывать иерархию элементов интерфейса — кнопки, поля ввода, списки, вкладки и другие объекты внутри окна. Для языковой модели это намного богаче обычного скриншота: она получает не просто картинку, а структурированное описание интерфейса и может точнее понять, что находится перед ней.

В результате агенту проще выбирать нужное действие и меньше полагаться на хрупкие сценарии с координатами курсора или обходными скриптами. Именно поэтому новая версия Codex выглядит сильнее многих конкурирующих решений. Большая часть систем управления компьютером сегодня по-прежнему строится на комбинации скриншотов, OCR и базовой автоматизации через системные команды.

Такой подход работает, пока интерфейс предсказуем, но быстро ломается в реальных приложениях. Codex, судя по первым обзорам, лучше справляется с задачами, где нужно ориентироваться в сложных окнах, прокручивать длинные ленты, открывать вложенные элементы и последовательно выполнять цепочки действий. Отдельный плюс — параллельные курсоры: несколько агентов могут работать на одном Mac одновременно, не мешая друг другу и не перетягивая фокус на себя.

Практическая ценность обновления хорошо видна на бытовых сценариях. Codex может открыть музыкальное приложение и запустить нужный альбом, даже если команда сформулирована неидеально. Может просмотреть несколько рабочих программ — например, мессенджер, RSS-клиент и читалку — а затем собрать из них короткую сводку.

Может установить файлы, открыть их, проверить результат и продолжить отладку без ручного переключения между окнами. Такие действия человек часто делает быстрее, но в этом и не главная идея: агент берет на себя рутину, которая может выполняться в фоне, особенно там, где нет API, консольных команд или полноценной поддержки AppleScript. Для OpenAI это еще и стратегический шаг.

Codex все меньше похож на обычного помощника по коду и все больше — на центр управления агентами. Сначала компания выпустила приложение Codex для macOS 2 февраля 2026 года, а 16 апреля добавила крупное обновление с фоновым управлением компьютером, памятью, автоматизациями и новыми плагинами. По данным OpenAI, сервисом уже пользуются более 3 миллионов разработчиков в неделю, и компания явно пытается расширить сценарии за пределы IDE: от написания кода к тестированию интерфейсов, работе с документами, браузером и настольными приложениями.

Главный вывод простой: OpenAI делает ставку не только на более сильные модели, но и на более глубокий контроль над пользовательской средой. Если Codex действительно сохранит нынешнюю точность и скорость, рынок AI-агентов может быстро сместиться от чат-окна к фоновым ассистентам, которые умеют работать в реальных программах так же уверенно, как сегодня работают с текстом и кодом.

ЖХ
Hamidun News
AI‑новости без шума. Ежедневный редакторский отбор из 400+ источников. Продукт Жемала Хамидуна, Head of AI в Alpina Digital.
Загружаем комментарии…