Habr AI→ оригинал

Стартап Дани Щербакова сократил паузы в голосовых агентах до 0,3 секунды и 1 млн вызовов в месяц

Команда Дани Щербакова показала, как современные ИИ-агенты для звонков уходят от старых скриптовых роботов. Их система держит паузу меньше 0,3 секунды, интегрир

Стартап Дани Щербакова сократил паузы в голосовых агентах до 0,3 секунды и 1 млн вызовов в месяц
Источник: Habr AI. Коллаж: Hamidun News.
◐ Слушать статью

Стартап Дани Щербакова показал, как голосовые ИИ-агенты для бизнеса уходят от старых скриптовых роботов. За счет собственной оркестрации, дообученных моделей и интеграции с CRM система отвечает быстрее человека, выдерживает большие объемы обзвона и уже используется в коммерческих кейсах.

Почему звонки живее

Главное отличие от классических роботов на интентах — работа не по жесткому набору фраз, а по контексту компании, цели звонка и истории диалога. В статье приводится пример с питомником растений: клиентка спросила про сроки посадки и наличие груши с закрытой корневой системой, а агент не сбился со скрипта и продолжил разговор как консультант, а не как автоответчик. Именно такие моменты, по словам автора, меняют отношение к обзвону: человек не слышит бесконечных пауз, повторов и попыток вернуть его в исходную ветку.

«Осень — это хороший период для посадки фруктовых деревьев».

Для бизнеса это важно не только из-за пользовательского опыта. Живой колл-центр требует долгого обучения, контроля качества и постоянного найма, а результат все равно зависит от усталости сотрудников и их знания предметной области. В недвижимости, например, менеджер начинает стабильно продавать лишь после сотен или тысяч звонков. ИИ-агент лишен этого разброса: он одинаково разговаривает утром, ночью и в конце недели, а собеседники, как утверждается в материале, чаще продолжают диалог даже после признания, что звонит не человек.

Как собран стек Внутри платформа устроена как модульная система с единым оркестратором.

Сначала речь собеседника в реальном времени переводится в текст модулем распознавания, затем этот текст обрабатывает языковая модель вместе с диалоговой логикой, после чего ответ уходит в синтез речи. Параллельно система пишет историю контакта, статус лида и ключевые метрики в CRM и внутреннюю аналитику. Ключевой показатель — задержка менее 0,3 секунды между репликой человека и ответом системы.

Это тот рубеж, на котором разговор перестает звучать как типичный роботизированный обзвон и начинает восприниматься почти как обычный телефонный диалог. Отдельный акцент сделан не на самой LLM, а на связке модели с жесткими сценарными ограничениями. Базовая модель может сгенерировать правдоподобный, но нецелевой ответ, а в продажах важны квалификация лида, обязательные вопросы, обработка возражений и перевод разговора к следующему шагу.

Поэтому поверх модели команда собрала собственный диалоговый слой. По словам автора, он обучен на больших массивах реальных бизнес-разговоров и клиентских скриптах, а его задача — держать разговор в рамках бизнес-логики, даже если собеседник отвечает нестандартно или резко меняет тему.

Какие цифры получаются В материале говорится, что запуск такого агента

занимает считаные дни: сначала собирают данные о продукте и сценариях, затем настраивают агента, подключают CRM и запускают тестирование. После этого система управляется через облачный кабинет, где можно быстро менять логику разговоров, проверять гипотезы A/B-тестами и смотреть аналитику по каждому диалогу. Уже на этой стадии ценность смещается от простой экономии к скорости реакции: сервис способен прозванивать большие базы за минуты, пока конкуренты только распределяют лиды между операторами.

  • Конверсия в квалифицированного лида в холодных обзвонах застройщика выросла на 50%.
  • В клининге конверсия из заявки в лида поднялась с 48% до 59%.
  • Затраты на обзвон в одном из кейсов снизились на 60%.
  • Время реакции на входящую заявку сократилось с 1,5 часа до 3 секунд.
  • Переход от 5 000 к 20 000 звонков в день занимает не месяцы найма, а несколько дней настройки. Отдельно автор подчеркивает управляемость. Если в традиционном колл-центре прослушивают лишь малую долю разговоров, здесь можно анализировать каждый звонок и быстро исправлять сценарии. Это важно для компаний, которые конкурируют за одну и ту же базу контактов: когда весь массив можно обработать за 9–10 минут, преимущество получает не тот, у кого больше операторов, а тот, кто быстрее квалифицирует лида и передает его в продажи. В таком режиме миллион звонков в месяц перестает быть экзотикой.

Что это значит

Голосовые ИИ-агенты постепенно переходят из категории «демо для вау-эффекта» в полноценный операционный инструмент. Если заявленные метрики подтверждаются на разных вертикалях, бизнес получает не просто замену первой линии поддержки, а управляемый канал продаж и сервиса, где скорость ответа, стабильность сценария и масштабирование важнее человеческой импровизации.

ЖХ
Hamidun News
AI‑новости без шума. Ежедневный редакторский отбор из 400+ источников. Продукт Жемала Хамидуна, Head of AI в Alpina Digital.
Загружаем комментарии…