Cuando las redes neuronales litigan: cómo los sistemas multiagente están cambiando el AI jurídico
La Universidad de Tsinghua demostró que los pipelines RAG clásicos en tareas jurídicas sufren de sesgo de confirmación. La solución son simulaciones adversarial

Одна из самых устойчивых проблем языковых моделей в профессиональных задачах — склонность к уверенному вранью. В юриспруденции, где каждая ссылка на закон должна быть точной, а логика аргументации — безупречной, эта слабость становится критической. Исследователи из Университета Цинхуа и российская компания АйЮрист независимо друг от друга нашли один и тот же ответ: чтобы нейросеть перестала галлюцинировать, ей нужен оппонент.
В конце 2025 года команда из Цинхуа опубликовала препринт «Chinese Court Simulation with LLM-Based Agent System», в котором системно разобрала фундаментальную слабость привычного подхода к юридическому AI. Классическая схема — пользователь задает вопрос, система ищет релевантные документы в базе, модель генерирует ответ — выглядит логично, но на практике ломается из-за confirmation bias. Нейросеть находит первый подходящий аргумент и начинает выстраивать вокруг него всю логику, игнорируя противоречащие факты. У неё нет внутреннего критика, который мог бы сказать: «Подожди, а вот эта статья закона говорит ровно обратное».
Решение оказалось элегантным и, если задуматься, очевидным. Китайские исследователи применили принцип состязательности — тот самый, на котором построена вся судебная система. Они создали двух AI-агентов: прокурора и адвоката, каждый из которых работал на базе большой языковой модели. Агенты не просто генерировали аргументы — они активно атаковали позицию оппонента. Когда адвокат ссылался на несуществующую норму, прокурор немедленно это опровергал. Результат оказался впечатляющим: количество галлюцинаций резко снизилось, а качество правовой аргументации выросло. Истина, как и в реальном суде, рождалась в споре.
Однако между академическим экспериментом и работающим продуктом лежит пропасть, которую хорошо понимают практики. Российская компания АйЮрист, параллельно строившая мультиагентную систему для арбитражных судов на базе собственной открытой модели Ken1.0, попыталась перенести наработки китайских коллег в реальную бизнес-среду — и столкнулась с тем, что архитектура полностью рассыпается при контакте с действительностью. Академический подход, отлично работавший на контролируемых датасетах, не выдерживал столкновения с хаосом реальных судебных дел, где документы приходят в разных форматах, правовые нормы противоречат друг другу, а контекст дела может кардинально меняться от одного абзаца к другому.
Команда АйЮрист пошла дальше и построила то, что они называют первой в России системой судебных симуляций. Вместо двух агентов — десять, каждый со своей ролью и зоной ответственности. Такая архитектура ближе к тому, как устроен реальный судебный процесс: здесь есть не только стороны спора, но и судья, эксперты, аналитики, которые проверяют факты и оценивают доказательства. Масштабирование количества агентов решает ещё одну важную проблему — оно не позволяет системе зациклиться на противостоянии двух позиций и создает пространство для нюансированного анализа.
Важно понимать контекст, в котором появляются подобные системы. Юридическая отрасль — одна из самых консервативных, и одновременно одна из самых перегруженных рутиной. Корпоративные юристы тратят десятки часов на анализ судебной практики, прогнозирование исходов дел и подготовку аргументации. Мультиагентные симуляции не заменяют юриста — они дают ему инструмент для стресс-тестирования собственной позиции ещё до подачи иска. Это принципиально иной уровень подготовки к процессу.
Этот кейс показателен и в более широком смысле. Он демонстрирует общий тренд в развитии AI-систем: переход от монолитных моделей, решающих задачу за один проход, к оркестрированным ансамблям специализированных агентов. Тот же принцип уже работает в программировании, где AI-ревьюер проверяет код AI-разработчика, и в медицине, где диагностические модели верифицируют друг друга. Юриспруденция — следующий полигон, и ставки здесь особенно высоки: ошибка в коде приводит к багу, ошибка в суде — к реальным финансовым потерям.
Главный вывод из истории Цинхуа и АйЮрист прост, но важен. Мультиагентность — это не академическая игрушка, а архитектурный паттерн, который будет определять следующее поколение профессиональных AI-инструментов. Но путь от исследовательского препринта до продукта, за который платят корпоративные клиенты, требует не просто масштабирования — он требует переосмысления самой архитектуры под реальные условия конкретной правовой системы.