Habr AI→ original

Не модель, а система: как Свои построили архитектуру финтех-бота в 7 слоёв

Когда LLM даёт клиенту банка неправильный баланс счёта или предлагает устаревший продукт — это не ошибка нейросети, а отказ одного из семи звеньев в архитектуре

Traité par IA depuis Habr AI ; édité par Hamidun News
Не модель, а система: как Свои построили архитектуру финтех-бота в 7 слоёв
Source : Habr AI. Collage: Hamidun News.

Когда голосовой ассистент говорит клиенту банка, что у того на счёте миллион рублей, хотя там сотня, — это проблема не нейросети. Это отказ системы в целом.

Архитектура вместо волшебства

Гибридная архитектура голосового бота в финтехе — это не «одна хорошая LLM и готово». Это семь слоёв, каждый со своей задачей: ASR (распознавание речи) — что пользователь сказал NLU (понимание смысла) — что он хотел сделать Routing (маршрутизация) — куда это направить API (получение данных) — факты о клиенте и его счётах Knowledge (база знаний) — актуальная информация о продуктах Compliance (проверка правил) — разрешено ли это делать * Voice (синтез речи) — как ответить красиво Плюс сверху оркестрация: LLM решает, как связать все эти части. Когда система работает, никто не замечает. Когда падает одно звено — падает всё.

Почему слабое звено сильнее сильной модели

Парадокс финтеха в одной фразе: если knowledge устарела на три дня, никакая GPT-5 не спасёт. Если routing не умеет передавать на оператора при непонимании, лучший NLU бесполезен. Если API возвращает данные с трёхчасовой задержкой, ассистент будет врать изо дня в день. Свои.ру видели это в боевых условиях. Клиент может долго жаловаться на «глупость бота», а проблема в том, что истории транзакций не обновляются в реальном времени. Очень хорошая LLM честно ответит то, что ей подали на вход.

Как всё это связано Представьте сценарий: клиент звонит в банк, спрашивает про кешбэк на рубли.

ASR расслышал правильно. NLU понял, что нужна информация о продукте. Routing отправил в knowledge-базу.

Но знания обновлялись неделю назад, до последнего изменения условий. Voice синтезирует ответ. И LLM не виновата — она добросовестно пересказала то, что ей дали.

Вот почему в таких системах разработчики тратят 80% времени не на улучшение модели, а на: обновление и консистентность базы знаний надёжность и скорость API качество и релевантность routing-логики graceful деградацию, когда компонент падает * тестирование каждого слоя отдельно ## Что это значит Эра, когда можно было выбрать самую крутую модель и ждать волшебства, закончилась. В банках, страховке, брокерах — везде, где ошибка стоит денег, победит не компания с лучшим LLM, а компания с лучшей инженерией. И это хорошо: значит, вход для новичков остаётся открытым, если разбираетесь в том, как системы работают целиком.

ZK
Hamidun News
Actualités IA sans bruit. Sélection éditoriale quotidienne de plus de 400 sources. Produit de Zhemal Khamidun, Head of AI chez Alpina Digital.

Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?

AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.

Qu'en pensez-vous ?
Chargement des commentaires…