Не модель, а система: как Свои построили архитектуру финтех-бота в 7 слоёв

Q: Источник материала?

Оригинальная публикация на Habr AI. Hamidun News обрабатывает и адаптирует материалы с помощью AI.

Q: Когда опубликовано?

2026-05-21. Время чтения: 2 мин.

Когда LLM даёт клиенту банка неправильный баланс счёта или предлагает устаревший продукт — это не ошибка нейросети, а отказ одного из семи звеньев в архитектуре

ЖХ

Редакция Hamidun News

AI‑мониторинг · Habr AI

2026-05-21· 2 мин

Не модель, а система: как Свои построили архитектуру финтех-бота в 7 слоёв — Источник: Habr AI. Коллаж: Hamidun News.

◐ Слушать статью

Когда голосовой ассистент говорит клиенту банка, что у того на счёте миллион рублей, хотя там сотня, — это проблема не нейросети. Это отказ системы в целом.

Архитектура вместо волшебства

Гибридная архитектура голосового бота в финтехе — это не «одна хорошая LLM и готово». Это семь слоёв, каждый со своей задачей: ASR (распознавание речи) — что пользователь сказал NLU (понимание смысла) — что он хотел сделать Routing (маршрутизация) — куда это направить API (получение данных) — факты о клиенте и его счётах Knowledge (база знаний) — актуальная информация о продуктах Compliance (проверка правил) — разрешено ли это делать * Voice (синтез речи) — как ответить красиво Плюс сверху оркестрация: LLM решает, как связать все эти части. Когда система работает, никто не замечает. Когда падает одно звено — падает всё.

Почему слабое звено сильнее сильной модели

Парадокс финтеха в одной фразе: если knowledge устарела на три дня, никакая GPT-5 не спасёт. Если routing не умеет передавать на оператора при непонимании, лучший NLU бесполезен. Если API возвращает данные с трёхчасовой задержкой, ассистент будет врать изо дня в день. Свои.ру видели это в боевых условиях. Клиент может долго жаловаться на «глупость бота», а проблема в том, что истории транзакций не обновляются в реальном времени. Очень хорошая LLM честно ответит то, что ей подали на вход.

Как всё это связано Представьте сценарий: клиент звонит в банк, спрашивает про кешбэк на рубли.

ASR расслышал правильно. NLU понял, что нужна информация о продукте. Routing отправил в knowledge-базу.

Но знания обновлялись неделю назад, до последнего изменения условий. Voice синтезирует ответ. И LLM не виновата — она добросовестно пересказала то, что ей дали.

Вот почему в таких системах разработчики тратят 80% времени не на улучшение модели, а на: обновление и консистентность базы знаний надёжность и скорость API качество и релевантность routing-логики graceful деградацию, когда компонент падает * тестирование каждого слоя отдельно ## Что это значит Эра, когда можно было выбрать самую крутую модель и ждать волшебства, закончилась. В банках, страховке, брокерах — везде, где ошибка стоит денег, победит не компания с лучшим LLM, а компания с лучшей инженерией. И это хорошо: значит, вход для новичков остаётся открытым, если разбираетесь в том, как системы работают целиком.

ЖХ

Hamidun News

AI‑новости без шума. Ежедневный редакторский отбор из 400+ источников. Продукт Жемала Хамидуна, Head of AI в Alpina Digital.

Telegram-канал RSS hamidun.com