Habr explicou por que modelos de linguagem e o RAG clássico perdem a compreensão das relações
O RAG transformou os modelos de linguagem em uma interface conveniente para documentos, mas essa abordagem começa a falhar em cenários corporativos com…
Processado por IA de Habr AI; editado por Hamidun News
O Habr publicou uma análise sobre por que a euforia em torno de grandes modelos de linguagem e RAG está começando a esbarrar em limitações arquitetônicas. A ideia principal é simples: um modelo pode trabalhar com confiança com documentos, mas isso não significa que ele realmente entenda o conhecimento e as conexões entre os fatos.
Por que o RAG decolou
O RAG rapidamente se tornou a forma padrão de "conectar" um grande modelo de linguagem aos dados corporativos. A lógica é clara: o próprio modelo formula bem as respostas, parafraseia textos complexos e mantém o estilo, mas sem memória externa ele é limitado pelo que foi treinado previamente. Adicione busca de documentos, e o sistema começa a parecer um analista universal: responde por regulamentos, reescreve contratos, monta relatórios e ajuda a encontrar fragmentos necessários sem retreinar o modelo.
Em pequenos conjuntos de dados, essa abordagem realmente causa uma forte impressão. Se a base de conhecimento consiste em dezenas de arquivos e as perguntas são bastante diretas, o RAG clássico recupera quase sem erros os trechos de texto relevantes, passa-os para o contexto do modelo e obtém uma resposta clara. É por isso que o esquema rapidamente se enraizou em suporte, assistentes internos, serviços jurídicos, produtos educacionais e análise: é relativamente simples de implementar, e os resultados práticos aparecem rapidamente.
Onde começam os problemas
O problema é que o RAG, por sua natureza, permanece uma camada de busca, não um sistema de conhecimento completo. Pode encontrar fragmentos de texto semelhantes, mas não garante compreensão de causalidade, hierarquias e conexões ocultas entre entidades. Quando as informações estão espalhadas em diferentes documentos, a resposta geralmente não pode vir de um único parágrafo: ela precisa ser montada a partir de vários fatos e etapas intermediárias de raciocínio. Para um humano isso é natural, mas para o RAG clássico já é um cenário limite.
- o sistema retorna os fragmentos mais semelhantes, não necessariamente os mais importantes;
- conforme a base de conhecimento cresce, um trecho de texto crítico pode facilmente não entrar no contexto;
- uma janela de contexto grande não resolve o problema da seleção e ordenação de dados;
- o modelo ainda pode misturar fontes e generalizar muito ousadamente.
Por causa disso, o modelo pode honestamente dizer que os dados são insuficientes, mesmo que a cadeia de fatos necessária já esteja nos documentos. O artigo apresenta um exemplo simples: se em um texto Alice está conectada a Bob, e em outro Bob estudou pinturas de Leonardo da Vinci, um humano é capaz de construir uma conexão intermediária. Um sistema de busca baseado em similaridade de texto frequentemente procura confirmação direta e não faz esse passo por si mesmo. Isso mostra a lacuna entre "encontrar similaridade" e o trabalho real com conhecimento.
Por que as ontologias são necessárias
O autor conduz à ideia de que o próximo estágio na evolução dos sistemas de IA corporativa é uma representação mais explícita do conhecimento. Quando se trata de centenas de milhares ou milhões de documentos, armazenar significado como um conjunto de chunks e representações vetoriais torna-se inconveniente. É preciso uma estrutura onde entidades, suas propriedades e conexões sejam definidas explicitamente, em vez de serem reconstruídas cada vez em tempo real a partir de fragmentos de texto.
Caso contrário, o sistema permanece dependente da sorte da busca e da qualidade da formulação da consulta. É aqui que as ontologias se tornam relevantes novamente — um tópico que por muito tempo parecia muito acadêmico para IA aplicada. Na lógica do artigo, isso não é uma tentativa de abandonar modelos de linguagem ou RAG, mas uma forma de criar a próxima camada sobre eles.
O modelo ainda é necessário para comunicação em linguagem natural, mas a própria base de conhecimento deve descrever o mundo não apenas através de texto, mas através de conexões. Essa abordagem é mais complexa de implementar, mas é mais adequada para tarefas onde dependências, causalidade, interseções entre objetos e longas cadeias de inferência importam.
O que isso significa
O boom do RAG não desaparece em lugar nenhum, mas o mercado está gradualmente chegando ao seu limite. Se um sistema de IA deve não apenas buscar parágrafos, mas explicar conexões entre fatos e fazer conclusões estáveis em grandes conjuntos de dados, um banco de dados vetorial sozinho não é mais suficiente. A próxima iteração pertencerá àquelas soluções que combinam modelos de linguagem com estruturas de conhecimento mais rigorosas.
Quer parar de ler sobre IA e começar a usar?
AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.