Habr AI→ оригинал

Когда нейросети судятся: как мультиагентные системы меняют юридический AI

Университет Цинхуа доказал: классические RAG-пайплайны в юридических задачах страдают от confirmation bias. Решение — состязательные симуляции, где AI-прокурор

Когда нейросети судятся: как мультиагентные системы меняют юридический AI
Источник: Habr AI. Коллаж: Hamidun News.

Одна из самых устойчивых проблем языковых моделей в профессиональных задачах — склонность к уверенному вранью. В юриспруденции, где каждая ссылка на закон должна быть точной, а логика аргументации — безупречной, эта слабость становится критической. Исследователи из Университета Цинхуа и российская компания АйЮрист независимо друг от друга нашли один и тот же ответ: чтобы нейросеть перестала галлюцинировать, ей нужен оппонент.

В конце 2025 года команда из Цинхуа опубликовала препринт «Chinese Court Simulation with LLM-Based Agent System», в котором системно разобрала фундаментальную слабость привычного подхода к юридическому AI. Классическая схема — пользователь задает вопрос, система ищет релевантные документы в базе, модель генерирует ответ — выглядит логично, но на практике ломается из-за confirmation bias. Нейросеть находит первый подходящий аргумент и начинает выстраивать вокруг него всю логику, игнорируя противоречащие факты. У неё нет внутреннего критика, который мог бы сказать: «Подожди, а вот эта статья закона говорит ровно обратное».

Решение оказалось элегантным и, если задуматься, очевидным. Китайские исследователи применили принцип состязательности — тот самый, на котором построена вся судебная система. Они создали двух AI-агентов: прокурора и адвоката, каждый из которых работал на базе большой языковой модели. Агенты не просто генерировали аргументы — они активно атаковали позицию оппонента. Когда адвокат ссылался на несуществующую норму, прокурор немедленно это опровергал. Результат оказался впечатляющим: количество галлюцинаций резко снизилось, а качество правовой аргументации выросло. Истина, как и в реальном суде, рождалась в споре.

Однако между академическим экспериментом и работающим продуктом лежит пропасть, которую хорошо понимают практики. Российская компания АйЮрист, параллельно строившая мультиагентную систему для арбитражных судов на базе собственной открытой модели Ken1.0, попыталась перенести наработки китайских коллег в реальную бизнес-среду — и столкнулась с тем, что архитектура полностью рассыпается при контакте с действительностью. Академический подход, отлично работавший на контролируемых датасетах, не выдерживал столкновения с хаосом реальных судебных дел, где документы приходят в разных форматах, правовые нормы противоречат друг другу, а контекст дела может кардинально меняться от одного абзаца к другому.

Команда АйЮрист пошла дальше и построила то, что они называют первой в России системой судебных симуляций. Вместо двух агентов — десять, каждый со своей ролью и зоной ответственности. Такая архитектура ближе к тому, как устроен реальный судебный процесс: здесь есть не только стороны спора, но и судья, эксперты, аналитики, которые проверяют факты и оценивают доказательства. Масштабирование количества агентов решает ещё одну важную проблему — оно не позволяет системе зациклиться на противостоянии двух позиций и создает пространство для нюансированного анализа.

Важно понимать контекст, в котором появляются подобные системы. Юридическая отрасль — одна из самых консервативных, и одновременно одна из самых перегруженных рутиной. Корпоративные юристы тратят десятки часов на анализ судебной практики, прогнозирование исходов дел и подготовку аргументации. Мультиагентные симуляции не заменяют юриста — они дают ему инструмент для стресс-тестирования собственной позиции ещё до подачи иска. Это принципиально иной уровень подготовки к процессу.

Этот кейс показателен и в более широком смысле. Он демонстрирует общий тренд в развитии AI-систем: переход от монолитных моделей, решающих задачу за один проход, к оркестрированным ансамблям специализированных агентов. Тот же принцип уже работает в программировании, где AI-ревьюер проверяет код AI-разработчика, и в медицине, где диагностические модели верифицируют друг друга. Юриспруденция — следующий полигон, и ставки здесь особенно высоки: ошибка в коде приводит к багу, ошибка в суде — к реальным финансовым потерям.

Главный вывод из истории Цинхуа и АйЮрист прост, но важен. Мультиагентность — это не академическая игрушка, а архитектурный паттерн, который будет определять следующее поколение профессиональных AI-инструментов. Но путь от исследовательского препринта до продукта, за который платят корпоративные клиенты, требует не просто масштабирования — он требует переосмысления самой архитектуры под реальные условия конкретной правовой системы.

ЖХ
Hamidun News
AI‑новости без шума. Ежедневный редакторский отбор из 400+ источников. Продукт Жемала Хамидуна, Head of AI в Alpina Digital.
Загружаем комментарии…