OpenAI lance GPT-5.4 : pari sur les agents informatiques, pas seulement sur le code
Le 5 mars 2026, OpenAI a lancé GPT-5.4, son modèle phare avec contrôle natif de l’ordinateur, tool search et mode xhigh pour les tâches complexes. Le changement

OpenAI 5 марта 2026 года представила GPT-5.4 — новый флагман, который объединяет сильный кодинг, reasoning и нативное управление компьютером. Главный акцент релиза сместился с «умного чат-бота» на AI-агента, который умеет не только отвечать, но и сам выполнять цепочки действий в интерфейсах и рабочих инструментах.
Ставка на агентов Главная новость в GPT-5.4 — встроенный Computer Use.
Модель умеет работать по скриншотам, управлять курсором, нажимать кнопки, заполнять формы и проверять результат. Для разработчиков это означает более зрелый переход от обычной генерации текста к агентным сценариям: боты могут ходить по сайтам, запускать браузерные шаги и выполнять рутинные операции без жёстко прописанного сценария на каждый клик. Это уже не фича для demo-роликов, а базовый слой для реальных бизнес-процессов, где агенту нужно видеть интерфейс и подтверждать, что действие действительно сработало.
По официальным данным OpenAI, прирост особенно заметен там, где модель должна действовать автономно, а не просто писать код в пустоте. На OSWorld-Verified GPT-5.4 поднялась до 75,0% против 47,3% у GPT-5.
2, а на BrowseComp — до 82,7% против 65,8%. При этом в SWE-Bench Pro рост оказался скромнее: 57,7% против 55,6%. Это хороший сигнал для тех, кто строит ассистентов и workflow-агентов, и более сдержанный — для тех, кто ждал безусловного прорыва именно в программировании.
- Нативное управление компьютером через screenshots и UI-действия Tool Search для больших наборов инструментов без раздувания промпта Режим рассуждений `xhigh` для тяжёлых задач До 1 млн токенов контекста в Codex с экспериментальной поддержкой Более низкая доля фактических ошибок по сравнению с GPT-5.2 ## Что показали тесты На практике картина получилась не такой ровной, как в презентационных бенчмарках. В визуальном тесте модель попросили сверстать сложный дашборд умного дома, затем сама же отрендерить результат и исправить ошибки после самопроверки. Общая композиция и стилистика получились узнаваемыми, но детали подвели: текст налезал на блоки, отступы расползались, часть элементов обрезалась, а заявленный неоморфный термостат оказался упрощённым кружком. То есть чувство «дорогого интерфейса» модель уже ловит, но до автономного senior frontend ей ещё далеко. Зато в backend-сценарии GPT-5.4 выглядела убедительнее. На задаче про production-ready rate limiter для FastAPI и Redis модель не ограничилась базовым решением, а построила полноценную схему со строгой типизацией, Lua-скриптом для атомарности и локальным fallback на случай падения Redis. В логическом тесте с конфликтующими условиями расписания она тоже сработала правильно: не стала выдумывать «хоть какой-то» ответ, а последовательно доказала, что решения не существует. Это важный маркер зрелости: модель чаще распознаёт противоречие, вместо того чтобы уверенно галлюцинировать.
Цена и доступность
OpenAI запустила GPT-5.4 5 марта 2026 года сразу в API, Codex и ChatGPT как GPT-5.4 Thinking.
По состоянию на релиз модель начала заменять GPT-5.2 Thinking для платных пользователей ChatGPT Plus, Team и Pro, а версия GPT-5.4 Pro стала доступна на Pro и Enterprise.
Для разработчиков это, пожалуй, не менее важная новость, чем сами бенчмарки: новый флагман не остался лабораторной демкой, а сразу встроился в рабочие продукты. По API прайс выглядит агрессивнее, чем можно было ожидать от флагмана OpenAI: $2,50 за миллион входных токенов, $0,25 за кэшированный ввод и $15 за миллион выходных токенов. Да, модель дороже GPT-5.
2 в пересчёте на токен, но OpenAI делает ставку на лучшую token efficiency: если агент решает задачу за меньшее число шагов и меньше блуждает по контексту, итоговая экономика может оказаться вполне разумной даже для небольших команд.
Что это значит GPT-5.4 не выглядит как «магическая замена
разработчику», но ясно показывает, куда движется рынок. Следующая конкуренция идёт не только за качество ответов, а за способность модели видеть интерфейс, пользоваться инструментами, помнить длинный контекст и доводить задачу до результата. Для бизнеса это означает простую вещь: ценность смещается от одиночных промптов к агентам, которые умеют работать внутри реальных процессов. Именно в таких сценариях теперь будет решаться, какая платформа лучше подходит для реальной работы, а не для одиночных вау-демо.