Habr AI→ original

Не модель, а система: как Свои построили архитектуру финтех-бота в 7 слоёв

Когда LLM даёт клиенту банка неправильный баланс счёта или предлагает устаревший продукт — это не ошибка нейросети, а отказ одного из семи звеньев в архитектуре

AI-processed from Habr AI; edited by Hamidun News
Не модель, а система: как Свои построили архитектуру финтех-бота в 7 слоёв
Source: Habr AI. Collage: Hamidun News.

Когда голосовой ассистент говорит клиенту банка, что у того на счёте миллион рублей, хотя там сотня, — это проблема не нейросети. Это отказ системы в целом.

Архитектура вместо волшебства

Гибридная архитектура голосового бота в финтехе — это не «одна хорошая LLM и готово». Это семь слоёв, каждый со своей задачей: ASR (распознавание речи) — что пользователь сказал NLU (понимание смысла) — что он хотел сделать Routing (маршрутизация) — куда это направить API (получение данных) — факты о клиенте и его счётах Knowledge (база знаний) — актуальная информация о продуктах Compliance (проверка правил) — разрешено ли это делать * Voice (синтез речи) — как ответить красиво Плюс сверху оркестрация: LLM решает, как связать все эти части. Когда система работает, никто не замечает. Когда падает одно звено — падает всё.

Почему слабое звено сильнее сильной модели

Парадокс финтеха в одной фразе: если knowledge устарела на три дня, никакая GPT-5 не спасёт. Если routing не умеет передавать на оператора при непонимании, лучший NLU бесполезен. Если API возвращает данные с трёхчасовой задержкой, ассистент будет врать изо дня в день. Свои.ру видели это в боевых условиях. Клиент может долго жаловаться на «глупость бота», а проблема в том, что истории транзакций не обновляются в реальном времени. Очень хорошая LLM честно ответит то, что ей подали на вход.

Как всё это связано Представьте сценарий: клиент звонит в банк, спрашивает про кешбэк на рубли.

ASR расслышал правильно. NLU понял, что нужна информация о продукте. Routing отправил в knowledge-базу.

Но знания обновлялись неделю назад, до последнего изменения условий. Voice синтезирует ответ. И LLM не виновата — она добросовестно пересказала то, что ей дали.

Вот почему в таких системах разработчики тратят 80% времени не на улучшение модели, а на: обновление и консистентность базы знаний надёжность и скорость API качество и релевантность routing-логики graceful деградацию, когда компонент падает * тестирование каждого слоя отдельно ## Что это значит Эра, когда можно было выбрать самую крутую модель и ждать волшебства, закончилась. В банках, страховке, брокерах — везде, где ошибка стоит денег, победит не компания с лучшим LLM, а компания с лучшей инженерией. И это хорошо: значит, вход для новичков остаётся открытым, если разбираетесь в том, как системы работают целиком.

ZK
Hamidun News
AI news without noise. Daily editorial selection from 400+ sources. A product by Zhemal Khamidun, Head of AI at Alpina Digital.

Want to stop reading about AI and start using it?

AI News is a curated feed of AI/tech news. Hamidun Academy teaches you to use AI systematically in your work.

What do you think?
Loading comments…