Habr AI→ original

Habr explicou por que modelos de linguagem e o RAG clássico perdem a compreensão das relações

O RAG transformou os modelos de linguagem em uma interface conveniente para documentos, mas essa abordagem começa a falhar em cenários corporativos com…

Processado por IA de Habr AI; editado por Hamidun News
Habr explicou por que modelos de linguagem e o RAG clássico perdem a compreensão das relações
Fonte: Habr AI. Colagem: Hamidun News.
◐ Ouvir artigo

O Habr publicou uma análise sobre por que a euforia em torno de grandes modelos de linguagem e RAG está começando a esbarrar em limitações arquitetônicas. A ideia principal é simples: um modelo pode trabalhar com confiança com documentos, mas isso não significa que ele realmente entenda o conhecimento e as conexões entre os fatos.

Por que o RAG decolou

O RAG rapidamente se tornou a forma padrão de "conectar" um grande modelo de linguagem aos dados corporativos. A lógica é clara: o próprio modelo formula bem as respostas, parafraseia textos complexos e mantém o estilo, mas sem memória externa ele é limitado pelo que foi treinado previamente. Adicione busca de documentos, e o sistema começa a parecer um analista universal: responde por regulamentos, reescreve contratos, monta relatórios e ajuda a encontrar fragmentos necessários sem retreinar o modelo.

Em pequenos conjuntos de dados, essa abordagem realmente causa uma forte impressão. Se a base de conhecimento consiste em dezenas de arquivos e as perguntas são bastante diretas, o RAG clássico recupera quase sem erros os trechos de texto relevantes, passa-os para o contexto do modelo e obtém uma resposta clara. É por isso que o esquema rapidamente se enraizou em suporte, assistentes internos, serviços jurídicos, produtos educacionais e análise: é relativamente simples de implementar, e os resultados práticos aparecem rapidamente.

Onde começam os problemas

O problema é que o RAG, por sua natureza, permanece uma camada de busca, não um sistema de conhecimento completo. Pode encontrar fragmentos de texto semelhantes, mas não garante compreensão de causalidade, hierarquias e conexões ocultas entre entidades. Quando as informações estão espalhadas em diferentes documentos, a resposta geralmente não pode vir de um único parágrafo: ela precisa ser montada a partir de vários fatos e etapas intermediárias de raciocínio. Para um humano isso é natural, mas para o RAG clássico já é um cenário limite.

  • o sistema retorna os fragmentos mais semelhantes, não necessariamente os mais importantes;
  • conforme a base de conhecimento cresce, um trecho de texto crítico pode facilmente não entrar no contexto;
  • uma janela de contexto grande não resolve o problema da seleção e ordenação de dados;
  • o modelo ainda pode misturar fontes e generalizar muito ousadamente.

Por causa disso, o modelo pode honestamente dizer que os dados são insuficientes, mesmo que a cadeia de fatos necessária já esteja nos documentos. O artigo apresenta um exemplo simples: se em um texto Alice está conectada a Bob, e em outro Bob estudou pinturas de Leonardo da Vinci, um humano é capaz de construir uma conexão intermediária. Um sistema de busca baseado em similaridade de texto frequentemente procura confirmação direta e não faz esse passo por si mesmo. Isso mostra a lacuna entre "encontrar similaridade" e o trabalho real com conhecimento.

Por que as ontologias são necessárias

O autor conduz à ideia de que o próximo estágio na evolução dos sistemas de IA corporativa é uma representação mais explícita do conhecimento. Quando se trata de centenas de milhares ou milhões de documentos, armazenar significado como um conjunto de chunks e representações vetoriais torna-se inconveniente. É preciso uma estrutura onde entidades, suas propriedades e conexões sejam definidas explicitamente, em vez de serem reconstruídas cada vez em tempo real a partir de fragmentos de texto.

Caso contrário, o sistema permanece dependente da sorte da busca e da qualidade da formulação da consulta. É aqui que as ontologias se tornam relevantes novamente — um tópico que por muito tempo parecia muito acadêmico para IA aplicada. Na lógica do artigo, isso não é uma tentativa de abandonar modelos de linguagem ou RAG, mas uma forma de criar a próxima camada sobre eles.

O modelo ainda é necessário para comunicação em linguagem natural, mas a própria base de conhecimento deve descrever o mundo não apenas através de texto, mas através de conexões. Essa abordagem é mais complexa de implementar, mas é mais adequada para tarefas onde dependências, causalidade, interseções entre objetos e longas cadeias de inferência importam.

O que isso significa

O boom do RAG não desaparece em lugar nenhum, mas o mercado está gradualmente chegando ao seu limite. Se um sistema de IA deve não apenas buscar parágrafos, mas explicar conexões entre fatos e fazer conclusões estáveis em grandes conjuntos de dados, um banco de dados vetorial sozinho não é mais suficiente. A próxima iteração pertencerá àquelas soluções que combinam modelos de linguagem com estruturas de conhecimento mais rigorosas.

ZK
Hamidun News
Notícias de AI sem ruído. Seleção editorial diária de mais de 400 fontes. Produto de Zhemal Khamidun, Head of AI na Alpina Digital.

Quer parar de ler sobre IA e começar a usar?

AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.

O que você acha?
Carregando comentários…