Não é modelo, é sistema: como Svoi construiu a arquitetura de um bot fintech em 7 camadas
Quando um LLM dá ao cliente de um banco o saldo de conta incorreto ou sugere um produto desatualizado — isso não é um erro da rede neural, mas a falha de um dos
Processado por IA de Habr AI; editado por Hamidun News
Quando um assistente de voz diz a um cliente de banco que ele tem um milhão de rublos em sua conta, quando na verdade tem cem — esse não é um problema da rede neural. É uma falha do sistema como um todo.
Arquitetura em vez de magia
A arquitetura híbrida de um bot de voz em fintech não é apenas 'uma boa LLM e pronto'. São sete camadas, cada uma com sua própria tarefa:
- ASR (reconhecimento de fala) — o que o usuário disse
- NLU (entendimento da intenção) — o que ele queria fazer
- Routing (roteamento) — para onde encaminhá-lo
- API (obtenção de dados) — fatos sobre o cliente e suas contas
- Knowledge (base de conhecimento) — informações atualizadas sobre produtos
- Compliance (verificação de regras) — isso é permitido?
- Voice (síntese de fala) — como responder adequadamente
Além disso, há a orquestração no topo: a LLM decide como conectar todas essas partes. Quando o sistema funciona, ninguém percebe. Quando um elo falha — tudo falha.
Por que o elo fraco é mais importante que o modelo poderoso
O paradoxo do fintech em uma frase: se o conhecimento está desatualizado em três dias, nenhuma GPT-5 o salvará. Se o roteamento não consegue transferir para um operador quando não entende, o melhor NLU é inútil. Se a API retorna dados com três horas de atraso, o assistente mentirá dia após dia.
Svoi.ru viu isso em condições reais de operação. Um cliente pode reclamar por muito tempo sobre a 'falta de inteligência do bot', quando na verdade o problema é que o histórico de transações não é atualizado em tempo real. Uma LLM muito boa responderia honestamente o que lhe foi fornecido como entrada.
Como tudo isso está conectado
Imagine um cenário: um cliente liga para o banco, perguntando sobre cashback em rublos. O ASR ouviu corretamente. O NLU entendeu que era necessária informação sobre o produto. O Routing encaminhou para a base de conhecimento. Mas o conhecimento foi atualizado uma semana atrás, antes da última mudança nas condições. O Voice sintetiza a resposta. E a LLM não tem culpa — ela honestamente repetiu o que lhe foi fornecido.
É por isso que em tais sistemas, os desenvolvedores gastam 80% de seu tempo não melhorando o modelo, mas em:
- atualizar e manter a consistência da base de conhecimento
- confiabilidade e velocidade da API
- qualidade e relevância da lógica de roteamento
- degradação graciosa quando um componente falha
- teste de cada camada separadamente
O que isso significa
A era em que você podia escolher o modelo mais incrível e esperar magia acabou. Em bancos, seguros, corretoras — em qualquer lugar onde um erro custa dinheiro, quem vencer não será a empresa com a melhor LLM, mas a empresa com a melhor engenharia. E isso é bom: significa que a entrada para iniciantes permanece aberta, se você entender como os sistemas funcionam como um todo.
Quer parar de ler sobre IA e começar a usar?
AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.