Не модель, а система: как Свои построили архитектуру финтех-бота в 7 слоёв
Когда LLM даёт клиенту банка неправильный баланс счёта или предлагает устаревший продукт — это не ошибка нейросети, а отказ одного из семи звеньев в архитектуре

Когда голосовой ассистент говорит клиенту банка, что у того на счёте миллион рублей, хотя там сотня, — это проблема не нейросети. Это отказ системы в целом.
Архитектура вместо волшебства
Гибридная архитектура голосового бота в финтехе — это не «одна хорошая LLM и готово». Это семь слоёв, каждый со своей задачей: ASR (распознавание речи) — что пользователь сказал NLU (понимание смысла) — что он хотел сделать Routing (маршрутизация) — куда это направить API (получение данных) — факты о клиенте и его счётах Knowledge (база знаний) — актуальная информация о продуктах Compliance (проверка правил) — разрешено ли это делать * Voice (синтез речи) — как ответить красиво Плюс сверху оркестрация: LLM решает, как связать все эти части. Когда система работает, никто не замечает. Когда падает одно звено — падает всё.
Почему слабое звено сильнее сильной модели
Парадокс финтеха в одной фразе: если knowledge устарела на три дня, никакая GPT-5 не спасёт. Если routing не умеет передавать на оператора при непонимании, лучший NLU бесполезен. Если API возвращает данные с трёхчасовой задержкой, ассистент будет врать изо дня в день. Свои.ру видели это в боевых условиях. Клиент может долго жаловаться на «глупость бота», а проблема в том, что истории транзакций не обновляются в реальном времени. Очень хорошая LLM честно ответит то, что ей подали на вход.
Как всё это связано Представьте сценарий: клиент звонит в банк, спрашивает про кешбэк на рубли.
ASR расслышал правильно. NLU понял, что нужна информация о продукте. Routing отправил в knowledge-базу.
Но знания обновлялись неделю назад, до последнего изменения условий. Voice синтезирует ответ. И LLM не виновата — она добросовестно пересказала то, что ей дали.
Вот почему в таких системах разработчики тратят 80% времени не на улучшение модели, а на: обновление и консистентность базы знаний надёжность и скорость API качество и релевантность routing-логики graceful деградацию, когда компонент падает * тестирование каждого слоя отдельно ## Что это значит Эра, когда можно было выбрать самую крутую модель и ждать волшебства, закончилась. В банках, страховке, брокерах — везде, где ошибка стоит денег, победит не компания с лучшим LLM, а компания с лучшей инженерией. И это хорошо: значит, вход для новичков остаётся открытым, если разбираетесь в том, как системы работают целиком.