Habr AI→ original

La startup de Dani Shcherbakov redujo las pausas en agentes de voz a 0,3 segundos y escaló a 1 millón de llamadas al mes

El equipo de Dani Shcherbakov mostró cómo los agentes modernos de AI para llamadas están dejando atrás los viejos robots basados en guiones. Su sistema…

Procesado por IA desde Habr AI; editado por Hamidun News
La startup de Dani Shcherbakov redujo las pausas en agentes de voz a 0,3 segundos y escaló a 1 millón de llamadas al mes
Fuente: Habr AI. Collage: Hamidun News.
◐ Escuchar artículo

La startup de Daniil Shcherbakov demuestra cómo los agentes de IA por voz para empresas se alejan de los robots guionizados tradicionales. A través de orquestación personalizada, modelos ajustados e integración con CRM, el sistema responde más rápido que los humanos, maneja grandes volúmenes de llamadas y ya se utiliza en casos comerciales.

Por qué las llamadas suenan más naturales

La diferencia clave respecto a los robots basados en intención clásicos es trabajar no por un conjunto rígido de frases, sino por contexto de la empresa, propósito de la llamada e historial del diálogo. El artículo proporciona un ejemplo de un vivero de plantas: una cliente preguntó sobre plazos de plantación y disponibilidad de un peral con sistema radicular cerrado, y el agente no se desvió del guión—continuó la conversación como consultor en lugar de como respondedor automatizado. Estos momentos, según el autor, cambian las actitudes hacia la llamada de salida: la gente no escucha pausas interminables, repeticiones e intentos de redireccionarla de vuelta a la rama original.

"El otoño es un buen período para plantar árboles frutales."

Para los negocios, esto importa no solo por la experiencia del usuario. Un centro de llamadas vivo requiere entrenamiento prolongado, control de calidad y contratación constante, mientras que los resultados aún dependen de la fatiga de los empleados y del conocimiento del dominio. En inmuebles, por ejemplo, un gerente comienza a vender consistentemente solo después de cientos o miles de llamadas. Un agente de IA está libre de esta variación: habla de la misma manera por la mañana, por la noche y a final de semana, y según el material, los interlocutores frecuentemente continúan el diálogo incluso después de saber que no es un humano quien llama.

Cómo se construye el stack

Internamente, la plataforma está estructurada como un sistema modular con un orquestrador unificado. Primero, el habla del llamador se convierte a texto en tiempo real por el módulo de reconocimiento, luego este texto se procesa por un modelo de lenguaje junto con lógica de diálogo, después de lo cual la respuesta va a síntesis de voz. En paralelo, el sistema escribe historial de contacto, estado de lead y métricas clave en el CRM y análisis internos.

La métrica clave es la latencia inferior a 0,3 segundos entre la frase del humano y la respuesta del sistema. Este es el umbral en el que la conversación deja de soar como una llamada de salida robótica típica y comienza a parecer un diálogo telefónico ordinario.

Se hace énfasis especial no en la LLM en sí, sino en la combinación del modelo con restricciones de escenario rígidas. Un modelo base puede generar una respuesta plausible pero fuera de objetivo, mientras que en ventas, la calificación de lead, preguntas obligatorias, tratamiento de objeciones y progresión de la conversación al siguiente paso son críticos. Por lo tanto, el equipo construyó su propia capa de diálogo sobre el modelo. Según el autor, fue entrenada en grandes conjuntos de conversaciones comerciales reales y scripts de clientes, y su tarea es mantener la conversación dentro de la lógica empresarial, incluso si el interlocutor responde de forma poco convencional o cambia abruptamente de tema.

Qué números obtenemos

El material afirma que lanzar un agente así toma solo días: primero, recopilan datos sobre el producto y escenarios, luego configuran el agente, conectan el CRM y lanzan pruebas. Después, el sistema se gestiona a través de un panel en la nube donde puede cambiar rápidamente la lógica de diálogo, probar hipótesis con pruebas A/B y ver análisis para cada diálogo.

Ya en esta etapa, el valor se desplaza de simples ahorros de costos a velocidad de respuesta: el servicio puede marcar bases grandes en minutos, mientras que los competidores aún están distribuyendo leads entre operadores.

  • La conversión a lead calificado en llamadas de salida frías para un promotor inmobiliario aumentó 50%.
  • En servicios de limpieza, la conversión de solicitud a lead subió de 48% a 59%.
  • Los costos de llamadas de salida en un caso bajaron 60%.
  • El tiempo de respuesta a una solicitud entrante cayó de 1,5 horas a 3 segundos.
  • Escalar de 5.000 a 20.000 llamadas por día toma no meses de contratación, sino algunos días de configuración.

El autor subraya por separado la manejabilidad. Si en un centro de llamadas tradicional solo se supervisa una pequeña fracción de conversaciones, aquí cada llamada puede ser analizada y los escenarios corregidos rápidamente. Esto importa para empresas que compiten por la misma base de contactos: cuando una base completa puede procesarse en 9–10 minutos, la ventaja va no al que tiene más operadores, sino al que califica leads más rápido y los pasa a ventas. En este modo, un millón de llamadas por mes ya no es exótico.

Qué significa esto

Los agentes de IA por voz se están moviendo gradualmente de la categoría de "demostraciones con efecto de asombro" a una herramienta operacional completa. Si las métricas declaradas se confirman en diferentes verticales, el negocio obtiene no solo un reemplazo para soporte de primera línea, sino un canal de ventas y servicio gestionado donde la velocidad de respuesta, la consistencia de escenario y la escalabilidad importan más que la improvisación humana.

ZK
Hamidun News
Noticias de AI sin ruido. Selección editorial diaria de más de 400 fuentes. Producto de Zhemal Khamidun, Head of AI en Alpina Digital.

¿Quieres dejar de leer sobre IA y empezar a usarla?

AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.

¿Qué te parece?
Cargando comentarios…