Parloa на моделях OpenAI запустила голосовых AI-агентов для поддержки крупных компаний
Parloa рассказала, как использует модели OpenAI для голосовых AI-агентов в клиентской поддержке крупных компаний. Платформа AMP дает бизнес-командам способ без

Parloa, берлинский разработчик платформы для клиентского сервиса, рассказала, как использует модели OpenAI для запуска голосовых AI-агентов в крупных компаниях. Платформа AMP помогает не просто отвечать на звонки, а проектировать, тестировать и выводить в прод системы, которые должны работать стабильно в режиме реального времени.
Как устроена AMP История Parloa началась с довольно приземленной задачи.
Один из сооснователей компании, Стефан Оствальд, провел день в страховом колл-центре и увидел, как сотрудники снова и снова обрабатывают одинаковые запросы: сброс пароля, вопросы по полису, рутинные изменения в аккаунте. Сначала компания делала rule-based голосовых ботов, но с появлением ChatGPT и новых моделей OpenAI перешла к AI Agent Management Platform, или AMP. Теперь речь идет уже не о жестко прописанных сценариях, а о платформе, где компании могут собирать, тестировать и запускать голосовой сервис на базе LLM.
Главная идея AMP в том, что ею могут пользоваться не только разработчики. Бизнес-команда или предметные эксперты задают роль агента, инструкции, ограничения и подключаемые инструменты обычным языком, без дерева интентов и без ручного описания каждого шага. После этого систему можно прогнать в симуляции: одна модель играет клиента, другая — настроенного агента.
Команда видит, как агент отвечает, правильно ли вызывает API, не уходит ли за рамки сценария, и может быстро исправить конфигурацию еще до реальных звонков.
Ставка на проверку Parloa делает сильную ставку на подход **evaluation-first**.
Для корпоративных клиентов важны не только красивые демо, но и предсказуемость в продакшене, потому что переход на новую модель всегда связан с затратами и риском. Поэтому компания не берет абстрактные бенчмарки за истину, а строит собственные тестовые наборы, которые повторяют реальные сценарии клиентской поддержки. В них измеряют, насколько модель следует инструкциям, насколько стабильно вызывает инструменты, какова задержка ответа и как система ведет себя на пограничных кейсах.
«Модели имеют значение только тогда, когда они работают в продакшене», — так в Parloa объясняют свой подход к голосовым системам в реальном времени.
Если модель показывает хороший результат на бумаге, этого недостаточно. В прод отправляют только те конфигурации, которые стабильно проходят симуляции и автоматические проверки. В платформе сочетаются LLM-as-a-judge и детерминированные правила: одни оценки проверяют качество ответа и соблюдение инструкций, другие — что критические шаги действительно происходят в нужном порядке. Такой подход уже дает бизнес-эффект: в одном внедрении глобальная travel-компания сократила количество запросов на перевод к живому оператору на 80%.
Голос без пауз Голосовой интерфейс для Parloa — это отдельный инженерный вызов.
В отличие от текстового чата, здесь каждая секунда чувствуется пользователем напрямую. Вся цепочка должна работать с минимальной задержкой: сначала система распознает речь, потом модель формирует ответ, затем включается синтез голоса. Даже небольшая пауза на модельном слое превращается в заметное молчание в трубке, поэтому Parloa вместе с OpenAI оптимизирует не только качество ответа, но и скорость, устойчивость и дисциплину следования инструкциям.
- Распознавание речи проверяют по word error rate, особенно на чувствительных данных вроде номеров полисов и идентификаторов аккаунтов.
- Синтез речи оценивают слепыми прослушиваниями, чтобы понять, насколько естественно голос звучит для реальных людей.
- Speech-to-speech модели отдельно тестируют на готовность к продакшену по задержке, точности и стоимости.
- Многоязычные бенчмарки прогоняют для разных рынков, потому что корпоративным клиентам нужна одинаковая надежность не в одной стране, а глобально. Сегодня агенты Parloa обрабатывают миллионы разговоров в ритейле, туризме и страховании. Компания смотрит и дальше классического звонка: один сценарий обслуживания может начаться по телефону, продолжиться в чате и по ходу общения включать ссылки или интерактивные элементы. В таком подходе каналы уже не живут отдельно друг от друга. Для клиента это должен быть один цельный диалог, а не набор разрозненных касаний, и именно под такой формат компания строит свою платформу.
Что это значит
История Parloa показывает, что рынок корпоративной поддержки смещается от простых IVR-деревьев к полноценным платформам управления AI-агентами. Побеждать здесь будут не те, у кого самая громкая модель, а те, кто умеет проверять ее на реальных сценариях, держать низкую задержку и безопасно подключать к внутренним системам бизнеса.