Habr AI→ original

Mémoire cognitive pour un agent AI : comment SQLite a remplacé les bases de données vectorielles

Un développeur a présenté une architecture ouverte de mémoire cognitive pour des agents AI locaux, construite sur un seul fichier SQLite. Au lieu de…

Traité par IA depuis Habr AI ; édité par Hamidun News
Mémoire cognitive pour un agent AI : comment SQLite a remplacé les bases de données vectorielles
Source : Habr AI. Collage: Hamidun News.
◐ Écouter l'article

L'un des principaux problèmes non résolus des agents d'IA modernes semble trompeusement simple : comment les enseigner à retenir ce qui est important et à oublier ce qui est devenu obsolète. Un développeur qui a publié une analyse technique détaillée sur Habr a proposé une solution qui va à l'encontre de la tendance dominante de l'industrie. Au lieu d'utiliser des bases de données vectorielles populaires, il a construit une mémoire cognitive complète sur un seul fichier SQLite.

Le problème qu'il décrit est familier à tous ceux qui ont essayé de créer un agent d'IA de longue durée. La recette standard ressemble à ceci : vous prenez le texte, le divisez en chunks, le convertissez en embeddings vectoriels, le stockez dans Pinecone ou Chroma, et récupérez les plus proches par distance cosinus lors d'une requête. À court terme, cela fonctionne.

Mais dès que l'agent vit plus longtemps, le chaos commence : la fenêtre de contexte se remplit de fragments non pertinents, des faits contradictoires de différentes périodes coexistent comme si de rien n'était, et il n'existe aucun mécanisme d'oubli. L'agent se souvient de tout de manière égale, ce qui en pratique signifie qu'il se souvient de tout de manière égale mal.

L'architecture proposée emprunte des principes à la psychologie cognitive et aux neurosciences. La mémoire est organisée comme un graphe avec deux types de nœuds : épisodiques, qui stockent des événements et des interactions spécifiques, et sémantiques, contenant des connaissances généralisées et des faits. Entre les nœuds s'étendent des arêtes typées, reflétant la nature des connexions. Les entités nommées sont mises en évidence en tant que couche séparate, permettant à l'agent de suivre les mentions de personnes, organisations, concepts spécifiques et de relier des fragments d'information disparates en une image unifiée.

Le système de recherche mérite une attention particulière. Plutôt que de s'appuyer sur une seule méthode de récupération d'informations, le développeur a implémenté une approche hybride qui combine trois mécanismes : la recherche en texte intégral via SQLite FTS5 pour les correspondances exactes et les mots-clés, la recherche vectorielle pour la proximité sémantique et le parcours de graphe pour récupérer les contextes associés. Les résultats des trois stratégies de recherche sont combinés à l'aide de Reciprocal Rank Fusion, un algorithme qui combine les listes classées de différentes sources sans avoir besoin d'étalonner leurs scores absolus. C'est une solution élégante qui permet à chaque méthode de compenser les faiblesses des autres.

Mais la partie la plus intéressante de l'architecture concerne non pas la mémorisation, mais l'oubli. Le développeur a implémenté la courbe d'oubli d'Ebbinghaus, un modèle classique de la psychologie expérimentale du XIXe siècle qui décrit la décroissance exponentielle de la mémoire au fil du temps. Chaque nœud du graphe a une métrique de « force mémoire » qui diminue progressivement. Les informations auxquelles on accède à plusieurs reprises sont renforcées, tandis que les fragments rarement demandés s'estompent naturellement. C'est fondamentalement différent de l'approche de la plupart des systèmes, où les données existent ou n'existent pas.

Le tableau est complété par un mécanisme de consolidation LLM en arrière-plan. De la même manière que le cerveau humain traite et résume l'information pendant le sommeil, l'agent lance périodiquement un modèle de langage pour analyser les souvenirs épisodiques accumulés. Le modèle identifie les modèles, résout les contradictions et crée de nouveaux nœuds sémantiques, transformant des épisodes disparates en connaissances structurées. Essentiellement, c'est la génération automatique de « sagesse de l'expérience ».

Il est important de souligner le pragmatisme technique de la solution. L'ensemble du système fonctionne sur un seul fichier SQLite, sans services externes, sans conteneurs Docker avec bases de données vectorielles, sans abonnements au stockage en nuage. Pour un agent fonctionnant localement, cela signifie des dépendances minimales, une simplicité de déploiement et un contrôle total des données. SQLite, malgré sa réputation de « base de données pour les petits projets », a depuis longtemps prouvé sa capacité à gérer des charges sérieuses, et l'extension FTS5 la transforme en un véritable moteur de recherche.

Ce projet s'inscrit dans une tendance croissante consistant à créer une mémoire plus « humaine » pour les agents d'IA. De grands laboratoires comme Google DeepMind et OpenAI recherchent activement des mécanismes de mémoire à long terme, mais leurs solutions sont généralement liées à des plates-formes propriétaires. Une architecture ouverte qui peut être déployée localement sur n'importe quelle machine démocratise l'accès à ces capacités. Si l'approche s'avère viable à l'échelle, elle pourrait changer la manière dont la mémoire des agents autonomes doit être structurée, passant de l'accumulation aveugle de données à la gestion significative des connaissances.

ZK
Hamidun News
Actualités IA sans bruit. Sélection éditoriale quotidienne de plus de 400 sources. Produit de Zhemal Khamidun, Head of AI chez Alpina Digital.

Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?

AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.

Qu'en pensez-vous ?
Chargement des commentaires…