QSOFT implementó un bot RAG con YandexGPT para Boiron sin Python ni orquestadores
QSOFT presentó un caso para Boiron: un bot RAG médico en Yandex Cloud Agent procesa solicitudes de usuarios sin Python ni orquestadores externos. El…
Procesado por IA desde Habr AI; editado por Hamidun News
QSOFT compartió detalles sobre la implementación de un bot RAG basado en Yandex Cloud Agent para la empresa farmacéutica Boiron. El asistente funciona en el sitio web existente con PHP y WordPress, responde las preguntas de los usuarios las 24 horas del día y asume parte de la carga que anteriormente iba al soporte manual.
Por Qué Era Necesario
Boiron en Rusia tiene un catálogo grande y complejo: 130 preparados homeopáticos de ingrediente único y 10 medicamentos complejos. Para los usuarios, el problema no es solo la cantidad de fichas de productos, sino la estructura del conocimiento alrededor de ellos. El portal contiene descripciones de productos individuales, colecciones temáticas y secciones más complejas como "Protocolo ORL". Debido a esto, la pregunta de un visitante no puede simplemente emparejarse con un único producto por palabra clave: el sistema necesita entender el contexto y guiar al usuario a la sección correcta de la base de conocimiento.
La carga de soporte también era significativa. Según QSOFT, el sitio web recibe más de 300 mil solicitudes al año, es decir, más de 800 por día. Con tal flujo, algunas preguntas no se resolvían inmediatamente, algunas consultas se perdían y otras tenían que ser manejadas manualmente por especialistas. Para temas médicos, esto es especialmente importante: el usuario espera una respuesta rápida, pero la respuesta debe basarse en datos precisos, no en la improvisación libre del modelo.
Cómo Se Construyó la Solución
En lugar de un servicio Python separado y un complejo bucle de orquestración, el equipo utilizó Yandex Cloud Agent con el modelo YandexGPT e integró el asistente en la pila existente de PHP y WordPress. Esencialmente, este es un escenario RAG: el bot primero busca un fragmento relevante en la base de conocimiento y solo luego formula una respuesta para el usuario. Este enfoque reduce el riesgo de "alucinaciones" y ayuda a mantener las respuestas dentro de los límites del contenido verificado, lo que para productos farmacéuticos es más importante que una formulación elegante.
El proyecto resolvió varias tareas prácticas simultáneamente:
- lanzamiento sin una reconstrucción completa del sitio web y sin abandonar la pila actual
- búsqueda en una gran base de conocimiento médico considerando conexiones entre secciones
- procesamiento de solicitudes 24 horas sin cola para especialistas
- reducción del número de solicitudes perdidas y manejo manual
La elección misma de la arquitectura es particularmente importante. En muchos proyectos RAG, una capa de orquestadores, servicios intermedios y canalizaciones personalizadas crece rápidamente alrededor del modelo. Aquí, el equipo tomó el enfoque opuesto: primero preservaron la combinación funcional de CMS y backend, y luego agregaron una capa de agente encima. Para el negocio, esto es más simple de mantener, más barato de lanzar y más directo para equipos que ya tienen un sitio web que funciona y no desean construir una plataforma ML separada desde cero.
Lo Que Proporcionó la Implementación
El efecto principal de tal asistente no está en "reemplazar a un operador", sino en cerrar escenarios típicos en el primer contacto. Los usuarios encuentran el medicamento, sección o protocolo necesario más rápidamente, y los especialistas se involucran donde se necesita experiencia humana. Esto cambia la economía del soporte: se dedica menos tiempo a navegar por el portal y menos consultas se quedan atrapadas entre el formulario del sitio web y el procesamiento manual.
El dominio de implementación en sí es notable. En medicina y campos relacionados, no se puede permitir que el modelo responda demasiado libremente, porque el costo de un error es mayor que en el e-commerce típico. Por lo tanto, el caso de Boiron es interesante no como una demostración de otro chatbot más, sino como un ejemplo de aplicación cuidadosa de RAG en una industria sensible. El equipo no intentó convertir el asistente en un consultor universal, sino que lo limitó a una base de conocimiento confiable y a la tarea de búsqueda precisa dentro de ella.
Lo Que Esto Significa
El caso de QSOFT muestra que la IA aplicada para medicina se puede implementar sin un cambio radical en la pila y sin orquestración compleja alrededor del modelo. Si una base de conocimiento está bien estructurada y la búsqueda dentro de ella se configura cuidadosamente, incluso un sitio web en PHP y WordPress puede obtener un asistente útil que responde más rápido que las personas y se mantiene dentro de los límites del contenido verificado.
¿Quieres dejar de leer sobre IA y empezar a usarla?
AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.