Habr AI→ original

Mémoire pour un agent AI : de la complexité à 300 lignes de code

Le développeur Nikolay Gusev a expliqué comment il a trouvé une solution optimale de mémoire pour des agents AI. Au lieu du MemPalace complexe et de ses 58 k do

Mémoire pour un agent AI : de la complexité à 300 lignes de code
Source : Habr AI. Collage: Hamidun News.
◐ Écouter l'article

La mémoire d'un agent IA est l'un des problèmes les plus complexes lors de la création de systèmes autonomes. Le développeur Nikolay Gusev a passé des mois à chercher une solution fonctionnelle et a partagé comment il a atteint à la fois la simplicité et la scalabilité.

MemPalace et la première erreur

Tout a commencé par une idée ambitieuse — MemPalace, un système de mémoire inspiré par l'architecture de palais médiévaux. Cela semblait intelligent sur le papier, mais en pratique, cela a créé 58 mille fragments dupliqués et s'est transformé en un labyrinthe impénétrable. Trop de couches d'abstraction, trop de magie. L'agent s'est perdu dans sa propre mémoire.

Le chemin vers la simplicité

Après MemPalace, l'auteur a simplifié la pile à quatre composants : MEMORY.md (base de données principale), USER.md (contexte utilisateur), SQLite state.db (état), HippoRAG (recherche) et fichiers wiki (données structurées). Mais même cela semblait excessif. Le bon geste était d'écrire `findings_to_wiki`, un simple script Python de 300 lignes qui sauvegarde automatiquement les analyses structurées (marquées avec des en-têtes comme `## Findings`) dans des fichiers markdown et les transforme en pages wiki. Aucun framework, aucun ORM, juste des fichiers et du texte.

Mise à l'échelle : ClickHouse

Quand il y a un seul agent, le stockage de fichiers fonctionne parfaitement. Mais si vous avez besoin de supporter 100+ utilisateurs simultanément, vous avez besoin d'une véritable base de données. C'est là que ClickHouse 24.x entre en jeu. Caractéristiques principales :

  • Recherche vectorielle via la fonction `cosineDistance()` — recherche rapide de souvenirs sémantiquement similaires
  • Recherche de texte avec l'index `tokenbf_v1` — recherche en texte intégral dans la mémoire
  • Partitionnement par user_id — isolement des données utilisateur intégré à la base de données
  • TTL pour suppression automatique — les anciens enregistrements sont supprimés sans intervention manuelle

ClickHouse effectue l'analyse et la recherche sur des millions d'enregistrements en millisecondes. Pour la mémoire d'un agent, c'est plus que suffisant.

Ce que cela signifie

Le point clé : ne commencez pas par la mise à l'échelle. Résolvez le problème simplement (fichiers, markdown, 300 lignes de code), puis mettez à l'échelle uniquement si nécessaire. Nikolay a démontré que le meilleur chemin d'ingénierie est de la complexité à la simplicité, et non l'inverse.

ZK
Hamidun News
Actualités IA sans bruit. Sélection éditoriale quotidienne de plus de 400 sources. Produit de Zhemal Khamidun, Head of AI chez Alpina Digital.
Qu'en pensez-vous ?
Chargement des commentaires…