Habr AI→ original

QSOFT implementou um bot RAG com YandexGPT para a Boiron sem Python nem orquestradores

A QSOFT apresentou um case da Boiron: um bot RAG médico no Yandex Cloud Agent processa solicitações de usuários sem Python nem orquestradores externos. O…

Processado por IA de Habr AI; editado por Hamidun News
QSOFT implementou um bot RAG com YandexGPT para a Boiron sem Python nem orquestradores
Fonte: Habr AI. Colagem: Hamidun News.
◐ Ouvir artigo

A QSOFT compartilhou detalhes sobre a implementação de um bot RAG baseado no Yandex Cloud Agent para a empresa farmacêutica Boiron. O assistente funciona no site existente em PHP e WordPress, responde às perguntas dos usuários 24 horas por dia e assume parte da carga que anteriormente era tratada pelo suporte manual.

Por Que Isso Foi Necessário

Boiron na Rússia possui um catálogo grande e complexo: 130 preparados homeopáticos de ingrediente único e 10 medicamentos compostos. Para os usuários, o problema não é apenas o número de fichas de produtos, mas a estrutura do conhecimento ao seu redor. O portal contém descrições de produtos individuais, coleções temáticas e seções mais complexas como "Protocolo ORL". Por isso, a pergunta de um visitante não pode ser simplesmente correspondida a um único produto por palavra-chave: o sistema precisa compreender o contexto e guiar o usuário para a seção correta da base de conhecimento.

A carga no suporte também era significativa. De acordo com a QSOFT, o site recebe mais de 300 mil requisições por ano — isso representa mais de 800 por dia. Com tal fluxo, algumas perguntas não eram resolvidas imediatamente, algumas consultas eram perdidas e outras precisavam ser tratadas manualmente por especialistas. Para tópicos médicos, isso é especialmente importante: o usuário espera uma resposta rápida, mas a resposta deve ser baseada em dados precisos, não na improvisação livre do modelo.

Como a Solução Foi Construída

Em vez de um serviço Python separado e um loop de orquestração complexo, a equipe usou o Yandex Cloud Agent com o modelo YandexGPT e integrou o assistente à pilha existente de PHP e WordPress. Essencialmente, este é um cenário RAG: o bot primeiro procura um fragmento relevante na base de conhecimento e só depois formula uma resposta para o usuário. Essa abordagem reduz o risco de "alucinações" e ajuda a manter as respostas dentro dos limites do conteúdo verificado, o que para produtos farmacêuticos é mais importante do que uma formulação bonita.

O projeto resolveu várias tarefas práticas simultaneamente:

  • implementação sem reconstrução completa do site e abandono da pilha atual
  • busca em uma grande base de conhecimento médico considerando conexões entre seções
  • processamento de requisições 24 horas por dia sem fila para especialistas
  • redução do número de consultas perdidas e tratamento manual

A escolha da arquitetura em si é particularmente importante. Em muitos projetos RAG, uma camada de orquestradores, serviços intermediários e pipelines personalizados cresce rapidamente ao redor do modelo. Aqui, a equipe tomou a abordagem oposta: primeiro preservaram a combinação funcional de CMS e backend, e depois adicionaram uma camada de agente no topo. Para o negócio, isso é mais simples de manter, mais barato de implementar e mais direto para equipes que já têm um site funcional e não desejam construir uma plataforma ML separada do zero.

O Que a Implementação Proporcionou

O efeito principal de tal assistente não está em "substituir um operador", mas em resolver cenários típicos no primeiro contato. Os usuários encontram o medicamento, seção ou protocolo necessário mais rapidamente, e os especialistas são envolvidos onde a experiência humana é realmente necessária. Isso muda a economia do suporte: menos tempo é gasto navegando pelo portal e menos consultas ficam presas entre o formulário do site e o processamento manual.

O domínio de implementação em si é digno de nota. Em medicina e campos relacionados, você não pode permitir que o modelo responda muito livremente, porque o custo de um erro é maior do que no e-commerce típico. Portanto, o caso Boiron é interessante não como uma demonstração de mais um chatbot, mas como um exemplo de aplicação cuidadosa de RAG em um setor sensível. A equipe não tentou transformar o assistente em um consultor universal, mas o limitou a uma base de conhecimento confiável e à tarefa de busca precisa dentro dela.

O Que Isto Significa

O caso da QSOFT mostra que a IA aplicada para medicina pode ser implementada sem uma mudança radical na pilha e sem orquestração complexa ao redor do modelo. Se uma base de conhecimento for bem estruturada e a busca dentro dela for cuidadosamente configurada, até mesmo um site em PHP e WordPress pode ganhar um assistente útil que responde mais rápido do que pessoas e permanece dentro dos limites do conteúdo verificado.

ZK
Hamidun News
Notícias de AI sem ruído. Seleção editorial diária de mais de 400 fontes. Produto de Zhemal Khamidun, Head of AI na Alpina Digital.

Quer parar de ler sobre IA e começar a usar?

AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.

O que você acha?
Carregando comentários…