OpenAI встраивает в ChatGPT Bidi 1 — голосовую модель, которая говорит и слушает одновременно
OpenAI превращает ChatGPT в суперприложение. В разработке — масштабное обновление с тремя ключевыми компонентами: Codex (AI-помощник программиста)…
AI-обработка оригинала 3DNews AI; редакция Hamidun News
OpenAI ускоряет превращение ChatGPT в суперприложение: компания одновременно разрабатывает двунаправленную голосовую модель Bidi 1, встраивает помощника программиста Codex и расширяет агентные возможности.
Что такое GPT
Bidi 1 В коде мобильного приложения ChatGPT исследователи обнаружили следы новой аудиомодели с кодовым названием GPT Bidi 1. «Bidi» расшифровывается как bidirectional — двунаправленный. Это принципиально иной подход по сравнению с нынешним голосовым режимом, где модель последовательно переключается между прослушиванием и ответом: сначала слушает, затем говорит — как рация с кнопкой «приём».
Дуплексный режим меняет саму динамику диалога. Пользователь сможет перебить ассистента на полуслове, а ассистент — реагировать на интонацию, паузы и темп речи в реальном времени, не дожидаясь паузы. Задержка между репликами заметно сокращается, разговор становится менее роботизированным.
Именно так работают наиболее продвинутые голосовые интерфейсы: Apple Intelligence в iOS 18 и Google Duplex давно поддерживают полноценный дуплексный обмен. Что меняется с Bidi 1: голос и слух работают одновременно — без очереди на «эфир» пользователь может перебить ответ в любой момент время отклика между репликами сокращается ассистент слышит интонацию и реагирует на паузы * разговор звучит естественнее и ближе к диалогу с человеком Конкретная дата выхода Bidi 1 пока не объявлена, но присутствие модели в production-коде ChatGPT говорит о том, что релиз уже близко.
Codex внутри
ChatGPT Параллельно с работой над голосом OpenAI встраивает в ChatGPT своего помощника для программистов — Codex. До сих пор Codex существовал как отдельный продукт с собственным интерфейсом. После интеграции писать, отлаживать и объяснять код можно будет прямо в основном окне чата, не переключая вкладки. Для разработчиков, которые уже сделали ChatGPT частью рабочего процесса, это серьёзное упрощение: вместо двух отдельных инструментов появится единое рабочее пространство. Codex будет доступен в том же диалоге, что и веб-поиск, генерация изображений, анализ файлов и — скоро — голосовой режим Bidi 1.
Агенты — третий фронт Третья составляющая масштабного обновления — инструменты для AI-агентов.
ChatGPT планомерно превращается из реактивного чат-бота в проактивного ассистента, способного выполнять многошаговые задачи автономно: бронировать билеты, сравнивать товары на маркетплейсах, заполнять онлайн-формы, искать и синтезировать информацию из разных источников.
«Мы хотим сделать ChatGPT приложением, которое делает за вас всё, что вы обычно делаете в интернете», — передают источники, знакомые со стратегией OpenAI.
Все три компонента — живой голос Bidi 1, встроенный Codex и автономные агенты — усиливают друг друга. Агент с дуплексным голосом и умением писать код — это принципиально иной класс инструмента, а не просто обновлённый чат-бот.
Что это значит
OpenAI целенаправленно движется к формату суперприложения — единого продукта, закрывающего большинство повседневных сценариев: голос, код, автоматизация задач, поиск информации. Для рядового пользователя ближайшее следствие — разговор с ChatGPT станет заметно живее и естественнее. Для бизнеса это означает новый уровень автоматизации операционных задач, которые раньше требовали человека или набора отдельных SaaS-инструментов. Конкурентам — от Google до Anthropic — придётся снова ускоряться.
Хотите не читать про ИИ, а внедрить его?
«AI News» — это полезные новости из мира ИИ. Системно научиться работать с нейросетями и применять их в работе — в Hamidun Academy.