Habr AI→ original

QSOFT a mis en place un bot RAG basé sur YandexGPT pour Boiron sans Python ni orchestrateurs

QSOFT a présenté un cas pour Boiron : un bot RAG médical sur Yandex Cloud Agent traite les demandes des utilisateurs sans Python ni orchestrateurs externes…

Traité par IA depuis Habr AI ; édité par Hamidun News
QSOFT a mis en place un bot RAG basé sur YandexGPT pour Boiron sans Python ni orchestrateurs
Source : Habr AI. Collage: Hamidun News.
◐ Écouter l'article

QSOFT a partagé des détails sur la mise en œuvre d'un bot RAG basé sur Yandex Cloud Agent pour l'entreprise pharmaceutique Boiron. L'assistant fonctionne sur le site existant en PHP et WordPress, répond aux questions des utilisateurs 24 heures sur 24 et assume une partie de la charge qui était auparavant traitée par le support manuel.

Pourquoi C'était Nécessaire

Boiron en Russie dispose d'un catalogue large et complexe : 130 préparations homéopathiques monocomposants et 10 médicaments composés. Pour les utilisateurs, le problème ne réside pas seulement dans le nombre de fiches produit, mais dans la structure des connaissances qui les entourent. Le portail contient des descriptions de produits individuels, des collections thématiques et des sections plus complexes comme le « Protocole ORL ». Pour cette raison, la question d'un visitant ne peut pas simplement être appariée à un seul produit par mot clé : le système doit comprendre le contexte et guider l'utilisateur vers la bonne section de la base de connaissances.

La charge du support était également importante. Selon QSOFT, le site Web reçoit plus de 300 000 demandes par an, soit plus de 800 par jour. Avec un tel flux, certaines questions n'étaient pas résolues immédiatement, certaines demandes étaient perdues et d'autres devaient être traitées manuellement par des spécialistes. Pour les sujets médicaux, cela est particulièrement important : l'utilisateur s'attend à une réponse rapide, mais la réponse doit être basée sur des données précises, non sur l'improvisation libre du modèle.

Comment la Solution a Été Construite

Au lieu d'un service Python distinct et d'une boucle d'orchestration complexe, l'équipe a utilisé Yandex Cloud Agent avec le modèle YandexGPT et intégré l'assistant à la pile existante de PHP et WordPress. Essentiellement, il s'agit d'un scénario RAG : le bot recherche d'abord un fragment pertinent dans la base de connaissances, puis formule une réponse pour l'utilisateur. Cette approche réduit le risque d'« hallucinations » et aide à maintenir les réponses dans les limites du contenu vérifié, ce qui pour les produits pharmaceutiques est plus important qu'une formulation élégante.

Le projet a résolu plusieurs tâches pratiques simultanément :

  • lancement sans reconstruction complète du site Web et sans abandonner la pile actuelle
  • recherche dans une grande base de connaissances médicales en tenant compte des connexions entre les sections
  • traitement des demandes 24 heures sur 24 sans file d'attente pour les spécialistes
  • réduction du nombre de demandes perdues et du traitement manuel

Le choix de l'architecture lui-même est particulièrement important. Dans de nombreux projets RAG, une couche d'orchestrateurs, de services intermédiaires et de pipelines personnalisés se développe rapidement autour du modèle. Ici, l'équipe a adopté l'approche inverse : elle a d'abord préservé la combinaison fonctionnelle CMS et backend, puis ajouté une couche d'agent dessus. Pour l'entreprise, cela est plus simple à maintenir, moins cher à lancer et plus simple pour les équipes qui ont déjà un site Web fonctionnel et ne souhaitent pas construire une plateforme ML séparée à partir de zéro.

Ce Que la Mise en Œuvre a Apporté

L'effet principal d'un tel assistant ne réside pas dans le « remplacement d'un opérateur », mais dans la fermeture de scénarios types au premier contact. Les utilisateurs trouvent plus rapidement le médicament, la section ou le protocole nécessaire, et les spécialistes sont impliqués où l'expertise humaine est vraiment nécessaire. Cela change l'économie du support : moins de temps est consacré à la navigation sur le portail et moins de demandes restent bloquées entre le formulaire du site Web et le traitement manuel.

Le domaine d'application lui-même est remarquable. En médecine et dans les domaines connexes, on ne peut pas permettre au modèle de répondre trop librement, car le coût d'une erreur est plus élevé que dans l'e-commerce typique. Par conséquent, le cas Boiron est intéressant non pas comme une démonstration d'un énième chatbot, mais comme un exemple d'application prudente de RAG dans un secteur sensible. L'équipe n'a pas tenté de transformer l'assistant en un consultant universel, mais l'a limité à une base de connaissances fiable et à la tâche de recherche précise dans celle-ci.

Ce Que Cela Signifie

Le cas de QSOFT montre que l'IA appliquée à la médecine peut être déployée sans un changement radical de pile et sans orchestration complexe autour du modèle. Si une base de connaissances est bien structurée et la recherche au sein de celle-ci soigneusement configurée, même un site Web en PHP et WordPress peut obtenir un assistant utile qui répond plus vite que les gens et reste dans les limites du contenu vérifié.

ZK
Hamidun News
Actualités IA sans bruit. Sélection éditoriale quotidienne de plus de 400 sources. Produit de Zhemal Khamidun, Head of AI chez Alpina Digital.

Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?

AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.

Qu'en pensez-vous ?
Chargement des commentaires…