Habr AI→ original

Habr a expliqué pourquoi les modèles de langage et le RAG classique perdent la compréhension des relations

Le RAG a fait des modèles de langage une interface pratique vers les documents, mais cette approche commence à se dégrader dans les scénarios d'entreprise…

Traité par IA depuis Habr AI ; édité par Hamidun News
Habr a expliqué pourquoi les modèles de langage et le RAG classique perdent la compréhension des relations
Source : Habr AI. Collage: Hamidun News.
◐ Écouter l'article

Habr a publié une analyse sur la raison pour laquelle l'euphorie autour des grands modèles de langage et de RAG commence à buter contre des limites architecturales. L'idée principale est simple : un modèle peut travailler avec confiance sur des documents, mais cela ne signifie pas qu'il comprenne réellement le savoir et les connexions entre les faits.

Pourquoi RAG a décollé

RAG est rapidement devenu le moyen standard de « connecter » un grand modèle de langage à des données d'entreprise. La logique est claire : le modèle lui-même formule bien les réponses, paraphrase les textes complexes et maintient le style, mais sans mémoire externe il est limité par ce sur quoi il a été entraîné au préalable. Ajoutez une recherche de documents, et le système commence à ressembler à un analyste universel : il répond selon les réglementations, reformule les contrats, compile les rapports et aide à trouver les fragments nécessaires sans réentraîner le modèle.

Sur de petits ensembles de données, cette approche fait vraiment une forte impression. Si la base de connaissance se compose de dizaines de fichiers et que les questions sont assez directes, le RAG classique récupère presque sans erreur les fragments de texte pertinents, les transmet au contexte du modèle et obtient une réponse claire. C'est pourquoi le schéma s'est rapidement implanté dans le support, les assistants internes, les services juridiques, les produits éducatifs et l'analyse : il est relativement simple à mettre en œuvre, et les résultats pratiques apparaissent rapidement.

Où commencent les défaillances

Le problème est que RAG par sa nature reste une couche de recherche, pas un système de connaissance à part entière. Il peut trouver des fragments de texte similaires, mais ne garantit pas la compréhension de la causalité, des hiérarchies et des connexions cachées entre les entités. Quand l'information est dispersée dans différents documents, la réponse ne peut souvent pas être tirée d'un seul paragraphe : elle doit être assemblée à partir de plusieurs faits et étapes intermédiaires de raisonnement. Pour un humain c'est naturel, mais pour le RAG classique c'est déjà un scénario limite.

  • le système retourne les fragments les plus similaires, pas nécessairement les plus importants ;
  • à mesure que la base de connaissance grandit, un morceau de texte critique ne rentre facilement pas dans le contexte ;
  • une grande fenêtre contextuelle ne résout pas le problème de la sélection et de l'ordonnancement des données ;
  • le modèle peut toujours mélanger les sources et généraliser trop hardiment.

À cause de cela, le modèle peut honnêtement dire que les données sont insuffisantes, alors que la chaîne de faits nécessaire est déjà dans les documents. L'article fournit un exemple simple : si dans un texte Alice est connectée à Bob, et dans un autre Bob a étudié les peintures de Léonard de Vinci, un humain est capable de construire une connexion intermédiaire. Un système de recherche basé sur la similarité de texte cherche souvent une confirmation directe et ne fait pas cette étape lui-même. Cela montre l'écart entre « trouver du similaire » et le travail réel avec le savoir.

Pourquoi les ontologies sont nécessaires

L'auteur mène à l'idée que l'étape suivante dans l'évolution des systèmes d'IA d'entreprise est une représentation plus explicite du savoir. Quand on parle de centaines de milliers ou de millions de documents, stocker le sens comme un ensemble de chunks et de représentations vectorielles devient peu commode. Il faut une structure où les entités, leurs propriétés et leurs connexions sont définies explicitement, plutôt que reconstruites chaque fois à la volée à partir de fragments de texte.

Sinon, le système reste dépendant de la chance de la recherche et de la qualité de la formulation de la requête. C'est là que les ontologies redeviennent pertinentes — un sujet qui longtemps a semblé trop académique pour l'IA appliquée. Dans la logique de l'article, ce n'est pas une tentative d'abandonner les modèles de langage ou le RAG, mais une façon de créer la couche suivante au-dessus d'eux.

Le modèle est toujours nécessaire pour la communication en langage naturel, mais la base de connaissance elle-même doit décrire le monde non seulement par du texte, mais par des connexions. Cette approche est plus complexe à mettre en œuvre, mais elle convient mieux aux tâches où les dépendances, la causalité, les intersections entre objets et les longues chaînes d'inférence importent.

Qu'est-ce que cela signifie

Le boom du RAG ne disparaît nulle part, mais le marché atteint progressivement son plafond. Si un système d'IA doit non seulement chercher des paragraphes, mais expliquer les connexions entre les faits et tirer des conclusions stables sur de grands ensembles de données, une base de données vectorielle seule ne suffit plus. La prochaine itération appartiendra à ces solutions qui combinent les modèles de langage avec des structures de connaissance plus rigoureuses.

ZK
Hamidun News
Actualités IA sans bruit. Sélection éditoriale quotidienne de plus de 400 sources. Produit de Zhemal Khamidun, Head of AI chez Alpina Digital.

Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?

AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.

Qu'en pensez-vous ?
Chargement des commentaires…