Quando redes neurais litigam: como sistemas multiagentes estão mudando o AI jurídico
A Universidade Tsinghua demonstrou que pipelines RAG clássicos em tarefas jurídicas sofrem de viés de confirmação. A solução são simulações adversariais, nas…
Processado por IA de Habr AI; editado por Hamidun News
Um dos problemas mais persistentes com modelos de linguagem em tarefas profissionais é sua tendência a mentiras confiantes. Na jurisprudência, onde cada referência à lei deve ser precisa e a lógica da argumentação deve ser impecável, essa fraqueza se torna crítica. Pesquisadores da Universidade de Tsinghua e da empresa russa AiJurist encontraram independentemente a mesma resposta: para evitar que uma rede neural alucine, ela precisa de um oponente.
No final de 2025, uma equipe de Tsinghua publicou um pré-print intitulado "Chinese Court Simulation with LLM-Based Agent System", que analisou sistematicamente uma fraqueza fundamental da abordagem convencional para IA jurídica. O esquema clássico — usuário faz uma pergunta, sistema busca documentos relevantes em um banco de dados, modelo gera uma resposta — parece lógico, mas na prática se quebra devido ao viés de confirmação. A rede neural encontra o primeiro argumento adequado e começa a construir toda sua lógica em torno dele, ignorando fatos contraditórios. Ela não tem nenhum crítico interno que pudesse dizer: "Espera, este artigo da lei diz exatamente o oposto."
A solução se mostrou elegante e, se você pensar bem, óbvia. Pesquisadores chineses aplicaram o princípio da adversariedade — o mesmo princípio sobre o qual todo o sistema judicial é construído. Eles criaram dois agentes de IA: um promotor e um advogado, cada um baseado em um grande modelo de linguagem. Os agentes não simplesmente geravam argumentos — eles atacavam ativamente a posição do oponente. Quando o advogado citava uma regulamentação inexistente, o promotor imediatamente refutava. O resultado foi impressionante: o número de alucinações diminuiu drasticamente e a qualidade da argumentação legal melhorou. A verdade, como em um tribunal real, nasceu da disputa.
No entanto, entre um experimento acadêmico e um produto funcional existe um abismo bem compreendido por profissionais. A empresa russa AiJurist, que estava simultaneamente construindo um sistema multiagente para tribunais de arbitragem baseado em seu próprio modelo aberto Ken1.0, tentou transferir as descobertas dos colegas chineses para um ambiente de negócios real — e enfrentou o problema de que a arquitetura se desintegrou completamente ao entrar em contato com a realidade.
A abordagem acadêmica, que funcionava muito bem em conjuntos de dados controlados, não conseguia resistir ao choque com o caos dos casos judiciais reais, onde documentos chegam em formatos diferentes, normas legais se contradizem mutuamente e o contexto do caso pode mudar dramaticamente de um parágrafo para o outro.
A equipe AiJurist foi além e construiu o que chamam de primeiro sistema russo de simulações judiciais. Em vez de dois agentes — dez, cada um com seu próprio papel e área de responsabilidade. Esta arquitetura é mais próxima de como um processo judicial real é estruturado: aqui não há apenas partes adversárias, mas também um juiz, especialistas, analistas que verificam fatos e avaliam provas. Aumentar a escala do número de agentes resolve outro problema importante — impede que o sistema fique preso na oposição entre duas posições e cria espaço para uma análise matizada.
É importante entender o contexto em que tais sistemas emergem. A profissão jurídica é uma das mais conservadoras e, simultaneamente, uma das mais sobrecarregadas por rotina. Advogados corporativos gastam dezenas de horas analisando jurisprudência, prevendo resultados e preparando argumentos. Simulações multiagente não substituem advogados — elas lhes dão uma ferramenta para testar sua própria posição antes de ingressar com uma ação. Este é um nível fundamentalmente diferente de preparação de caso.
Este caso é indicativo também em um sentido mais amplo. Demonstra uma tendência geral no desenvolvimento de sistemas de IA: a transição de modelos monolíticos que resolvem uma tarefa em uma única passagem para orquestras de agentes especializados. O mesmo princípio já funciona em programação, onde um revisor de IA verifica código escrito por um desenvolvedor de IA, e em medicina, onde modelos diagnósticos se verificam mutuamente. A jurisprudência é a próxima fronteira, e as apostas são particularmente altas aqui: um erro em código leva a um bug, um erro em tribunal leva a perdas financeiras reais.
A conclusão principal da história de Tsinghua e AiJurist é simples mas importante. Multiagência não é um brinquedo acadêmico, mas um padrão arquitetônico que definirá a próxima geração de ferramentas profissionais de IA. Mas o caminho de um pré-print de pesquisa para um produto pelo qual clientes corporativos pagam exige não apenas dimensionamento — exige repensar a própria arquitetura à luz das condições reais de um sistema jurídico específico.
Quer parar de ler sobre IA e começar a usar?
AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.