Habr AI→ original

Pas un modèle, mais un système : comment Svoi a construit l'architecture d'un bot fintech en 7 couches

Lorsqu'une LLM donne à un client bancaire un solde incorrect ou propose un produit obsolète, ce n'est pas une erreur du réseau de neurones, mais une défaillance

Traité par IA depuis Habr AI ; édité par Hamidun News
Pas un modèle, mais un système : comment Svoi a construit l'architecture d'un bot fintech en 7 couches
Source : Habr AI. Collage: Hamidun News.
◐ Écouter l'article

Quand un assistant vocal dit à un client bancaire qu'il a un million de roubles sur son compte alors qu'il n'y en a que cent, ce n'est pas un problème du réseau de neurones. C'est une défaillance du système dans son ensemble.

Architecture au lieu de magie

L'architecture hybride d'un bot vocal en fintech n'est pas « une bonne LLM et c'est fini ». C'est sept couches, chacune avec sa propre tâche :

  • ASR (reconnaissance vocale) — ce que l'utilisateur a dit
  • NLU (compréhension du sens) — ce qu'il voulait faire
  • Routing (routage) — où diriger cela
  • API (obtention de données) — les faits sur le client et ses comptes
  • Knowledge (base de connaissances) — informations actuelles sur les produits
  • Compliance (vérification des règles) — est-ce autorisé
  • Voice (synthèse vocale) — comment répondre élégamment

Plus en haut l'orchestration : le LLM décide comment lier toutes ces parties. Quand le système fonctionne, personne ne remarque. Quand un maillon tombe, tout s'effondre.

Pourquoi le maillon faible est plus fort qu'un modèle puissant

Le paradoxe de la fintech en une phrase : si la base de connaissances est obsolète de trois jours, aucun GPT-5 ne sauvera. Si le routage ne sait pas transférer à un opérateur en cas de malentendu, le meilleur NLU est inutile. Si l'API retourne les données avec trois heures de retard, l'assistant mentira jour après jour.

Svoi.ru l'a vu en conditions réelles. Un client peut se plaindre longtemps de la « stupidité du bot », alors que le problème est que l'historique des transactions ne se met pas à jour en temps réel. Une excellente LLM répondra honnêtement à ce qu'on lui a soumis en entrée.

Comment tout cela est connecté

Imaginez ce scénario : un client appelle la banque et demande des informations sur le cashback en roubles. L'ASR a bien entendu. Le NLU a compris qu'il fallait obtenir des informations sur le produit. Le routage a orienté vers la base de connaissances. Mais les connaissances ont été mises à jour il y a une semaine, avant le dernier changement de conditions. La synthèse vocale formule la réponse. Et le LLM n'est pas fautif — il a redit fidèlement ce qu'on lui avait soumis.

C'est pourquoi dans ces systèmes, les développeurs consacrent 80% de leur temps non à l'amélioration du modèle, mais à :

  • la mise à jour et la cohérence de la base de connaissances
  • la fiabilité et la rapidité de l'API
  • la qualité et la pertinence de la logique de routage
  • la dégradation progressive quand un composant tombe en panne
  • les tests de chaque couche séparément

Ce que cela signifie

L'époque où on pouvait choisir le meilleur modèle et attendre la magie est révolue. Dans les banques, l'assurance, les courtiers — partout où une erreur coûte de l'argent, ce n'est pas la compagnie avec le meilleur LLM qui gagnera, mais celle avec la meilleure ingénierie. Et c'est tant mieux : cela signifie que la porte reste ouverte aux nouveaux venus, si vous comprenez comment les systèmes fonctionnent dans leur ensemble.

ZK
Hamidun News
Actualités IA sans bruit. Sélection éditoriale quotidienne de plus de 400 sources. Produit de Zhemal Khamidun, Head of AI chez Alpina Digital.

Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?

AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.

Qu'en pensez-vous ?
Chargement des commentaires…