Tencent a lancé un système de mémoire local pour les agents IA TencentDB
Tencent a publié le code source de TencentDB Agent Memory — un système de mémoire pour les agents IA. Une architecture à 4 niveaux (conversation → atome → scéna
Traité par IA depuis MarkTechPost ; édité par Hamidun News
Tencent a ouvert le code source de TencentDB Agent Memory — un système de mémoire local pour les agents IA qui fonctionne entièrement sur la machine de l'utilisateur sans le cloud. Le projet est publié sous la licence MIT et prêt à s'intégrer dans OpenClaw et d'autres frameworks.
Architecture de mémoire à deux niveaux
Le système est divisé en deux parties. La mémoire à court terme résout le problème du bruit : quand l'agent travaille avec un navigateur ou des bases de données, les outils génèrent des milliers de lignes de logs. Au lieu de tout empaqueter dans le contexte, TencentDB compresse les logs dans un canvas Mermaid compact — un graphe visuel des tâches exécutées, qui occupe 10 à 50 fois moins de tokens.
La mémoire à long terme est organisée en une pyramide à quatre niveaux d'abstractions, qui reflète le fonctionnement de la mémoire humaine :
- L0 — Conversation — l'historique de tous les messages entre l'utilisateur et l'agent
- L1 — Atome — des faits et des événements individuels extraits de la conversation via le NLP
- L2 — Scénario — des groupes d'atomes liés, des modèles répétés et des contextes
- L3 — Persona — le profil de personnalité à long terme de l'agent et de l'utilisateur, des traits stables
Cette approche multicouche permet à l'agent d'oublier les petits détails tout en conservant l'essentiel. Cela économise les tokens lors de la demande de contexte et augmente la vitesse de recherche des informations nécessaires.
Recherche hybride et stockage local
Pour extraire les informations nécessaires de la pyramide multicouche, le système utilise une recherche à deux canaux : le classique BM25 (recherche en texte intégral par mots-clés) et la recherche vectorielle (sémantique, basée sur les embeddings). Les résultats des deux recherches sont combinés via RRF (Reciprocal Rank Fusion) — un algorithme qui équilibre la contribution des deux méthodes et ramène les enregistrements les plus pertinents en tête.
Par défaut, tout est stocké dans une base de données SQLite locale avec l'extension sqlite-vec pour les vecteurs. Pas de cloud — les données et les codes de l'agent restent sur la machine de l'utilisateur. Le projet est fourni comme un plugin pour OpenClaw (le framework de Tencent) et comme une image Docker prête à l'emploi Hermes.
Benchmarks : 61% moins de tokens
Lors des tests avec WideSearch (un ensemble de tâches de recherche complexes), TencentDB a montré des résultats impressionnants :
- Réduction de la consommation de tokens de 61% par rapport à la référence
- Augmentation du taux de réussite (proportion de tâches résolues avec succès) de 51%
- Amélioration de la précision sur PersonaMem (modélisation de la personnalité) de 48% à 76%
Ces chiffres montrent qu'une architecture de mémoire appropriée aide l'agent non seulement à économiser sur les appels API, mais aussi à prendre des décisions plus fondées, car il a accès aux informations pertinentes du passé.
Ce que cela signifie
La mémoire locale pour les agents IA cesse d'être un projet de recherche et devient un outil pratique. Pour les développeurs, cela ouvre plusieurs portes : créer des agents à long terme qui apprennent des interactions précédentes tout en économisant sur les API cloud ; stocker les données confidentielles localement sans les envoyer vers le cloud ; déployer les agents IA sur sa propre infrastructure. La licence MIT signifie la liberté d'utilisation dans les projets commerciaux.
Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?
AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.