Habr AI→ original

Não é modelo, é sistema: como Svoi construiu a arquitetura de um bot fintech em 7 camadas

Quando um LLM dá ao cliente de um banco o saldo de conta incorreto ou sugere um produto desatualizado — isso não é um erro da rede neural, mas a falha de um dos

Processado por IA de Habr AI; editado por Hamidun News
Não é modelo, é sistema: como Svoi construiu a arquitetura de um bot fintech em 7 camadas
Fonte: Habr AI. Colagem: Hamidun News.
◐ Ouvir artigo

Quando um assistente de voz diz a um cliente de banco que ele tem um milhão de rublos em sua conta, quando na verdade tem cem — esse não é um problema da rede neural. É uma falha do sistema como um todo.

Arquitetura em vez de magia

A arquitetura híbrida de um bot de voz em fintech não é apenas 'uma boa LLM e pronto'. São sete camadas, cada uma com sua própria tarefa:

  • ASR (reconhecimento de fala) — o que o usuário disse
  • NLU (entendimento da intenção) — o que ele queria fazer
  • Routing (roteamento) — para onde encaminhá-lo
  • API (obtenção de dados) — fatos sobre o cliente e suas contas
  • Knowledge (base de conhecimento) — informações atualizadas sobre produtos
  • Compliance (verificação de regras) — isso é permitido?
  • Voice (síntese de fala) — como responder adequadamente

Além disso, há a orquestração no topo: a LLM decide como conectar todas essas partes. Quando o sistema funciona, ninguém percebe. Quando um elo falha — tudo falha.

Por que o elo fraco é mais importante que o modelo poderoso

O paradoxo do fintech em uma frase: se o conhecimento está desatualizado em três dias, nenhuma GPT-5 o salvará. Se o roteamento não consegue transferir para um operador quando não entende, o melhor NLU é inútil. Se a API retorna dados com três horas de atraso, o assistente mentirá dia após dia.

Svoi.ru viu isso em condições reais de operação. Um cliente pode reclamar por muito tempo sobre a 'falta de inteligência do bot', quando na verdade o problema é que o histórico de transações não é atualizado em tempo real. Uma LLM muito boa responderia honestamente o que lhe foi fornecido como entrada.

Como tudo isso está conectado

Imagine um cenário: um cliente liga para o banco, perguntando sobre cashback em rublos. O ASR ouviu corretamente. O NLU entendeu que era necessária informação sobre o produto. O Routing encaminhou para a base de conhecimento. Mas o conhecimento foi atualizado uma semana atrás, antes da última mudança nas condições. O Voice sintetiza a resposta. E a LLM não tem culpa — ela honestamente repetiu o que lhe foi fornecido.

É por isso que em tais sistemas, os desenvolvedores gastam 80% de seu tempo não melhorando o modelo, mas em:

  • atualizar e manter a consistência da base de conhecimento
  • confiabilidade e velocidade da API
  • qualidade e relevância da lógica de roteamento
  • degradação graciosa quando um componente falha
  • teste de cada camada separadamente

O que isso significa

A era em que você podia escolher o modelo mais incrível e esperar magia acabou. Em bancos, seguros, corretoras — em qualquer lugar onde um erro custa dinheiro, quem vencer não será a empresa com a melhor LLM, mas a empresa com a melhor engenharia. E isso é bom: significa que a entrada para iniciantes permanece aberta, se você entender como os sistemas funcionam como um todo.

ZK
Hamidun News
Notícias de AI sem ruído. Seleção editorial diária de mais de 400 fontes. Produto de Zhemal Khamidun, Head of AI na Alpina Digital.

Quer parar de ler sobre IA e começar a usar?

AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.

O que você acha?
Carregando comentários…