Não é modelo, é sistema: como Svoi construiu a arquitetura de um bot fintech em 7 camadas

Q: Qual é a fonte?

Publicado originalmente em Habr AI. O Hamidun News processa e adapta os materiais com IA.

Q: Quando foi publicado?

2026-05-21. Tempo de leitura: 2 min.

Quando um LLM dá ao cliente de um banco o saldo de conta incorreto ou sugere um produto desatualizado — isso não é um erro da rede neural, mas a falha de um dos

Redação da Hamidun News

Monitoramento de AI · Habr AI

2026-05-21· 2 min

Processado por IA de Habr AI; editado por Hamidun News

Não é modelo, é sistema: como Svoi construiu a arquitetura de um bot fintech em 7 camadas — Fonte: Habr AI. Colagem: Hamidun News.

◐ Ouvir artigo

Quando um assistente de voz diz a um cliente de banco que ele tem um milhão de rublos em sua conta, quando na verdade tem cem — esse não é um problema da rede neural. É uma falha do sistema como um todo.

Arquitetura em vez de magia

A arquitetura híbrida de um bot de voz em fintech não é apenas 'uma boa LLM e pronto'. São sete camadas, cada uma com sua própria tarefa:

ASR (reconhecimento de fala) — o que o usuário disse
NLU (entendimento da intenção) — o que ele queria fazer
Routing (roteamento) — para onde encaminhá-lo
API (obtenção de dados) — fatos sobre o cliente e suas contas
Knowledge (base de conhecimento) — informações atualizadas sobre produtos
Compliance (verificação de regras) — isso é permitido?
Voice (síntese de fala) — como responder adequadamente

Além disso, há a orquestração no topo: a LLM decide como conectar todas essas partes. Quando o sistema funciona, ninguém percebe. Quando um elo falha — tudo falha.

Por que o elo fraco é mais importante que o modelo poderoso

O paradoxo do fintech em uma frase: se o conhecimento está desatualizado em três dias, nenhuma GPT-5 o salvará. Se o roteamento não consegue transferir para um operador quando não entende, o melhor NLU é inútil. Se a API retorna dados com três horas de atraso, o assistente mentirá dia após dia.

Svoi.ru viu isso em condições reais de operação. Um cliente pode reclamar por muito tempo sobre a 'falta de inteligência do bot', quando na verdade o problema é que o histórico de transações não é atualizado em tempo real. Uma LLM muito boa responderia honestamente o que lhe foi fornecido como entrada.

Como tudo isso está conectado

Imagine um cenário: um cliente liga para o banco, perguntando sobre cashback em rublos. O ASR ouviu corretamente. O NLU entendeu que era necessária informação sobre o produto. O Routing encaminhou para a base de conhecimento. Mas o conhecimento foi atualizado uma semana atrás, antes da última mudança nas condições. O Voice sintetiza a resposta. E a LLM não tem culpa — ela honestamente repetiu o que lhe foi fornecido.

É por isso que em tais sistemas, os desenvolvedores gastam 80% de seu tempo não melhorando o modelo, mas em:

atualizar e manter a consistência da base de conhecimento
confiabilidade e velocidade da API
qualidade e relevância da lógica de roteamento
degradação graciosa quando um componente falha
teste de cada camada separadamente

O que isso significa

A era em que você podia escolher o modelo mais incrível e esperar magia acabou. Em bancos, seguros, corretoras — em qualquer lugar onde um erro custa dinheiro, quem vencer não será a empresa com a melhor LLM, mas a empresa com a melhor engenharia. E isso é bom: significa que a entrada para iniciantes permanece aberta, se você entender como os sistemas funcionam como um todo.

Hamidun News

Notícias de AI sem ruído. Seleção editorial diária de mais de 400 fontes. Produto de Zhemal Khamidun, Head of AI na Alpina Digital.

Canal do Telegram RSS hamidun.com

Quer parar de ler sobre IA e começar a usar?

AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.

🎓 Academy — 7 dias grátis Consultoria grátis