خفضت شركة داني شيرباكوف الناشئة فترات التوقف في الوكلاء الصوتيين إلى 0.3 ثانية ووصلت إلى مليون مكالمة شهريًا
أظهر فريق داني شيرباكوف كيف بات وكلاء AI الحديثون للمكالمات يتجاوزون الروبوتات القديمة القائمة على سيناريوهات ثابتة. ويحافظ نظامهم على فاصل يقل عن 0.3 ثانية، وي
Стартап Дани Щербакова показал, как голосовые ИИ-агенты для бизнеса уходят от старых скриптовых роботов. За счет собственной оркестрации, дообученных моделей и интеграции с CRM система отвечает быстрее человека, выдерживает большие объемы обзвона и уже используется в коммерческих кейсах.
Почему звонки живее
Главное отличие от классических роботов на интентах — работа не по жесткому набору фраз, а по контексту компании, цели звонка и истории диалога. В статье приводится пример с питомником растений: клиентка спросила про сроки посадки и наличие груши с закрытой корневой системой, а агент не сбился со скрипта и продолжил разговор как консультант, а не как автоответчик. Именно такие моменты, по словам автора, меняют отношение к обзвону: человек не слышит бесконечных пауз, повторов и попыток вернуть его в исходную ветку.
«Осень — это хороший период для посадки фруктовых деревьев».
Для бизнеса это важно не только из-за пользовательского опыта. Живой колл-центр требует долгого обучения, контроля качества и постоянного найма, а результат все равно зависит от усталости сотрудников и их знания предметной области. В недвижимости, например, менеджер начинает стабильно продавать лишь после сотен или тысяч звонков. ИИ-агент лишен этого разброса: он одинаково разговаривает утром, ночью и в конце недели, а собеседники, как утверждается в материале, чаще продолжают диалог даже после признания, что звонит не человек.
Как собран стек Внутри платформа устроена как модульная система с единым оркестратором.
Сначала речь собеседника в реальном времени переводится в текст модулем распознавания, затем этот текст обрабатывает языковая модель вместе с диалоговой логикой, после чего ответ уходит в синтез речи. Параллельно система пишет историю контакта, статус лида и ключевые метрики в CRM и внутреннюю аналитику. Ключевой показатель — задержка менее 0,3 секунды между репликой человека и ответом системы.
Это тот рубеж, на котором разговор перестает звучать как типичный роботизированный обзвон и начинает восприниматься почти как обычный телефонный диалог. Отдельный акцент сделан не на самой LLM, а на связке модели с жесткими сценарными ограничениями. Базовая модель может сгенерировать правдоподобный, но нецелевой ответ, а в продажах важны квалификация лида, обязательные вопросы, обработка возражений и перевод разговора к следующему шагу.
Поэтому поверх модели команда собрала собственный диалоговый слой. По словам автора, он обучен на больших массивах реальных бизнес-разговоров и клиентских скриптах, а его задача — держать разговор в рамках бизнес-логики, даже если собеседник отвечает нестандартно или резко меняет тему.
Какие цифры получаются В материале говорится, что запуск такого агента
занимает считаные дни: сначала собирают данные о продукте и сценариях, затем настраивают агента, подключают CRM и запускают тестирование. После этого система управляется через облачный кабинет, где можно быстро менять логику разговоров, проверять гипотезы A/B-тестами и смотреть аналитику по каждому диалогу. Уже на этой стадии ценность смещается от простой экономии к скорости реакции: сервис способен прозванивать большие базы за минуты, пока конкуренты только распределяют лиды между операторами.
- Конверсия в квалифицированного лида в холодных обзвонах застройщика выросла на 50%.
- В клининге конверсия из заявки в лида поднялась с 48% до 59%.
- Затраты на обзвон в одном из кейсов снизились на 60%.
- Время реакции на входящую заявку сократилось с 1,5 часа до 3 секунд.
- Переход от 5 000 к 20 000 звонков в день занимает не месяцы найма, а несколько дней настройки. Отдельно автор подчеркивает управляемость. Если в традиционном колл-центре прослушивают лишь малую долю разговоров, здесь можно анализировать каждый звонок и быстро исправлять сценарии. Это важно для компаний, которые конкурируют за одну и ту же базу контактов: когда весь массив можно обработать за 9–10 минут, преимущество получает не тот, у кого больше операторов, а тот, кто быстрее квалифицирует лида и передает его в продажи. В таком режиме миллион звонков в месяц перестает быть экзотикой.
Что это значит
Голосовые ИИ-агенты постепенно переходят из категории «демо для вау-эффекта» в полноценный операционный инструмент. Если заявленные метрики подтверждаются на разных вертикалях, бизнес получает не просто замену первой линии поддержки, а управляемый канал продаж и сервиса, где скорость ответа, стабильность сценария и масштабирование важнее человеческой импровизации.