QSOFT implementou um bot RAG com YandexGPT para a Boiron sem Python nem orquestradores
A QSOFT apresentou um case da Boiron: um bot RAG médico no Yandex Cloud Agent processa solicitações de usuários sem Python nem orquestradores externos. O…
Processado por IA de Habr AI; editado por Hamidun News
A QSOFT compartilhou detalhes sobre a implementação de um bot RAG baseado no Yandex Cloud Agent para a empresa farmacêutica Boiron. O assistente funciona no site existente em PHP e WordPress, responde às perguntas dos usuários 24 horas por dia e assume parte da carga que anteriormente era tratada pelo suporte manual.
Por Que Isso Foi Necessário
Boiron na Rússia possui um catálogo grande e complexo: 130 preparados homeopáticos de ingrediente único e 10 medicamentos compostos. Para os usuários, o problema não é apenas o número de fichas de produtos, mas a estrutura do conhecimento ao seu redor. O portal contém descrições de produtos individuais, coleções temáticas e seções mais complexas como "Protocolo ORL". Por isso, a pergunta de um visitante não pode ser simplesmente correspondida a um único produto por palavra-chave: o sistema precisa compreender o contexto e guiar o usuário para a seção correta da base de conhecimento.
A carga no suporte também era significativa. De acordo com a QSOFT, o site recebe mais de 300 mil requisições por ano — isso representa mais de 800 por dia. Com tal fluxo, algumas perguntas não eram resolvidas imediatamente, algumas consultas eram perdidas e outras precisavam ser tratadas manualmente por especialistas. Para tópicos médicos, isso é especialmente importante: o usuário espera uma resposta rápida, mas a resposta deve ser baseada em dados precisos, não na improvisação livre do modelo.
Como a Solução Foi Construída
Em vez de um serviço Python separado e um loop de orquestração complexo, a equipe usou o Yandex Cloud Agent com o modelo YandexGPT e integrou o assistente à pilha existente de PHP e WordPress. Essencialmente, este é um cenário RAG: o bot primeiro procura um fragmento relevante na base de conhecimento e só depois formula uma resposta para o usuário. Essa abordagem reduz o risco de "alucinações" e ajuda a manter as respostas dentro dos limites do conteúdo verificado, o que para produtos farmacêuticos é mais importante do que uma formulação bonita.
O projeto resolveu várias tarefas práticas simultaneamente:
- implementação sem reconstrução completa do site e abandono da pilha atual
- busca em uma grande base de conhecimento médico considerando conexões entre seções
- processamento de requisições 24 horas por dia sem fila para especialistas
- redução do número de consultas perdidas e tratamento manual
A escolha da arquitetura em si é particularmente importante. Em muitos projetos RAG, uma camada de orquestradores, serviços intermediários e pipelines personalizados cresce rapidamente ao redor do modelo. Aqui, a equipe tomou a abordagem oposta: primeiro preservaram a combinação funcional de CMS e backend, e depois adicionaram uma camada de agente no topo. Para o negócio, isso é mais simples de manter, mais barato de implementar e mais direto para equipes que já têm um site funcional e não desejam construir uma plataforma ML separada do zero.
O Que a Implementação Proporcionou
O efeito principal de tal assistente não está em "substituir um operador", mas em resolver cenários típicos no primeiro contato. Os usuários encontram o medicamento, seção ou protocolo necessário mais rapidamente, e os especialistas são envolvidos onde a experiência humana é realmente necessária. Isso muda a economia do suporte: menos tempo é gasto navegando pelo portal e menos consultas ficam presas entre o formulário do site e o processamento manual.
O domínio de implementação em si é digno de nota. Em medicina e campos relacionados, você não pode permitir que o modelo responda muito livremente, porque o custo de um erro é maior do que no e-commerce típico. Portanto, o caso Boiron é interessante não como uma demonstração de mais um chatbot, mas como um exemplo de aplicação cuidadosa de RAG em um setor sensível. A equipe não tentou transformar o assistente em um consultor universal, mas o limitou a uma base de conhecimento confiável e à tarefa de busca precisa dentro dela.
O Que Isto Significa
O caso da QSOFT mostra que a IA aplicada para medicina pode ser implementada sem uma mudança radical na pilha e sem orquestração complexa ao redor do modelo. Se uma base de conhecimento for bem estruturada e a busca dentro dela for cuidadosamente configurada, até mesmo um site em PHP e WordPress pode ganhar um assistente útil que responde mais rápido do que pessoas e permanece dentro dos limites do conteúdo verificado.
Quer parar de ler sobre IA e começar a usar?
AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.