Habr AI→ original

Не модель, а система: как Свои построили архитектуру финтех-бота в 7 слоёв

Когда LLM даёт клиенту банка неправильный баланс счёта или предлагает устаревший продукт — это не ошибка нейросети, а отказ одного из семи звеньев в архитектуре

Procesado por IA desde Habr AI; editado por Hamidun News
Не модель, а система: как Свои построили архитектуру финтех-бота в 7 слоёв
Fuente: Habr AI. Collage: Hamidun News.

Когда голосовой ассистент говорит клиенту банка, что у того на счёте миллион рублей, хотя там сотня, — это проблема не нейросети. Это отказ системы в целом.

Архитектура вместо волшебства

Гибридная архитектура голосового бота в финтехе — это не «одна хорошая LLM и готово». Это семь слоёв, каждый со своей задачей: ASR (распознавание речи) — что пользователь сказал NLU (понимание смысла) — что он хотел сделать Routing (маршрутизация) — куда это направить API (получение данных) — факты о клиенте и его счётах Knowledge (база знаний) — актуальная информация о продуктах Compliance (проверка правил) — разрешено ли это делать * Voice (синтез речи) — как ответить красиво Плюс сверху оркестрация: LLM решает, как связать все эти части. Когда система работает, никто не замечает. Когда падает одно звено — падает всё.

Почему слабое звено сильнее сильной модели

Парадокс финтеха в одной фразе: если knowledge устарела на три дня, никакая GPT-5 не спасёт. Если routing не умеет передавать на оператора при непонимании, лучший NLU бесполезен. Если API возвращает данные с трёхчасовой задержкой, ассистент будет врать изо дня в день. Свои.ру видели это в боевых условиях. Клиент может долго жаловаться на «глупость бота», а проблема в том, что истории транзакций не обновляются в реальном времени. Очень хорошая LLM честно ответит то, что ей подали на вход.

Как всё это связано Представьте сценарий: клиент звонит в банк, спрашивает про кешбэк на рубли.

ASR расслышал правильно. NLU понял, что нужна информация о продукте. Routing отправил в knowledge-базу.

Но знания обновлялись неделю назад, до последнего изменения условий. Voice синтезирует ответ. И LLM не виновата — она добросовестно пересказала то, что ей дали.

Вот почему в таких системах разработчики тратят 80% времени не на улучшение модели, а на: обновление и консистентность базы знаний надёжность и скорость API качество и релевантность routing-логики graceful деградацию, когда компонент падает * тестирование каждого слоя отдельно ## Что это значит Эра, когда можно было выбрать самую крутую модель и ждать волшебства, закончилась. В банках, страховке, брокерах — везде, где ошибка стоит денег, победит не компания с лучшим LLM, а компания с лучшей инженерией. И это хорошо: значит, вход для новичков остаётся открытым, если разбираетесь в том, как системы работают целиком.

ZK
Hamidun News
Noticias de AI sin ruido. Selección editorial diaria de más de 400 fuentes. Producto de Zhemal Khamidun, Head of AI en Alpina Digital.

¿Quieres dejar de leer sobre IA y empezar a usarla?

AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.

¿Qué te parece?
Cargando comentarios…