QSOFT implemented a YandexGPT-based RAG bot for Boiron without Python or orchestrators
QSOFT presented a case study for Boiron: a medical RAG bot on Yandex Cloud Agent handles user requests without Python or external orchestrators. The assistant i
QSOFT рассказала о внедрении для фармкомпании Boiron RAG-бота на базе Yandex Cloud Agent. Ассистент работает на существующем сайте с PHP и WordPress, отвечает на вопросы пользователей круглосуточно и берет на себя часть нагрузки, которая раньше уходила в ручную поддержку.
Почему это понадобилось У
Boiron в России большой и непростой каталог: 130 гомеопатических монопрепаратов и 10 комплексных лекарств. Для пользователя проблема не только в количестве карточек, но и в структуре знаний вокруг них. На портале есть описания отдельных средств, тематические подборки и более сложные разделы вроде «ЛОР-протокола».
Из-за этого вопрос посетителя нельзя просто сопоставить с одним товаром по ключевому слову: системе нужно понять контекст и вывести человека в правильный раздел базы знаний. Нагрузка на поддержку тоже была заметной. По данным QSOFT, сайт получает больше 300 тысяч запросов в год — это свыше 800 в сутки.
При таком потоке часть вопросов не закрывалась сразу, часть обращений терялась, а часть приходилось разбирать специалистам вручную. Для медицинской тематики это особенно чувствительно: пользователь ждет быстрый ответ, но ответ должен опираться на точные данные, а не на свободную импровизацию модели.
Как устроили решение
Вместо отдельного Python-сервиса и сложного контура оркестрации команда использовала Yandex Cloud Agent с моделью YandexGPT и встроила ассистента в уже существующий стек на PHP и WordPress. По сути, это RAG-сценарий: бот сначала ищет релевантный фрагмент в базе знаний, а уже потом формирует ответ для пользователя. Такой подход снижает риск «галлюцинаций» и помогает удерживать ответы в рамках проверенного контента, что для фармы важнее красивой формулировки.
Проект решал сразу несколько практических задач: запуск без полной перестройки сайта и отказа от текущего стека поиск по большой медицинской базе знаний с учетом связей между разделами круглосуточная обработка обращений без очереди к специалистам снижение числа потерянных запросов и ручных разборов Отдельно важен сам выбор архитектуры. Во многих RAG-проектах вокруг модели быстро нарастает слой из оркестраторов, промежуточных сервисов и кастомных пайплайнов. Здесь команда пошла от обратного: сначала сохранила рабочую связку CMS и бэкенда, а затем добавила поверх нее агентный слой.
Для бизнеса это проще в поддержке, дешевле в запуске и понятнее для команд, у которых уже есть рабочий сайт и нет желания строить отдельную ML-платформу с нуля.
Что дало внедрение
Главный эффект такого помощника — не в том, что он «заменяет оператора», а в том, что он закрывает типовые сценарии первым касанием. Пользователь быстрее находит нужный препарат, раздел или протокол, а специалисты подключаются там, где действительно нужен человек. Это меняет экономику поддержки: меньше времени уходит на навигацию по порталу и меньше обращений провисает между формой на сайте и ручной обработкой.
Показателен и сам домен внедрения. В медицине и смежных темах нельзя позволить модели отвечать слишком вольно, потому что цена ошибки выше, чем в обычном e-commerce. Поэтому кейс Boiron интересен не как демонстрация очередного чат-бота, а как пример аккуратного применения RAG в чувствительной отрасли.
Команда не пыталась превратить ассистента в универсального консультанта, а ограничила его надежной базой знаний и задачей точного поиска по ней.
Что это значит
Кейс QSOFT показывает, что прикладной AI для медицины можно внедрять без радикальной смены стека и без сложной оркестрации вокруг модели. Если база знаний структурирована, а поиск по ней настроен аккуратно, даже сайт на PHP и WordPress может получить полезного ассистента, который отвечает быстрее людей и не выходит за пределы проверенного контента.