Habr AI→ original

Memoria para un agente de AI: de la complejidad a 300 líneas de código

El desarrollador Nikolay Gusev explicó cómo encontró una solución óptima de memoria para agentes de AI. En lugar del complejo MemPalace, con 58 mil duplicados,

Memoria para un agente de AI: de la complejidad a 300 líneas de código
Fuente: Habr AI. Collage: Hamidun News.
◐ Escuchar artículo

La memoria del agente de IA es uno de los problemas más complejos al crear sistemas autónomos. El desarrollador Nikolay Gusev pasó meses buscando una solución que funcionara y compartió cómo logró simplicidad y escalabilidad al mismo tiempo.

MemPalace y el primer error

Todo comenzó con una idea ambiciosa — MemPalace, un sistema de memoria inspirado en la arquitectura de palacios medievales. Lucía inteligente sobre el papel, pero en la práctica creó 58 mil fragmentos duplicados y se convirtió en un laberinto impenetrable. Demasiadas capas de abstracción, demasiada magia. El agente se perdía en su propia memoria.

El camino hacia la simplicidad

Después de MemPalace, el autor simplificó la pila a cuatro componentes: MEMORY.md (base de datos principal), USER.md (contexto del usuario), SQLite state.db (estado), HippoRAG (búsqueda) y archivos wiki (datos estructurados). Pero incluso esto parecía excesivo. El movimiento correcto fue escribir `findings_to_wiki`, un simple script de Python de 300 líneas que automáticamente guarda análisis estructurados (marcados con encabezados como `## Findings`) en archivos markdown y los transforma en páginas wiki. Sin frameworks, sin ORM, solo archivos y texto.

Escalado: ClickHouse

Cuando hay un solo agente, el almacenamiento de archivos funciona perfectamente. Pero si necesita soportar 100+ usuarios simultáneamente, necesita una base de datos real. Aquí es donde entra en juego ClickHouse 24.x. Características clave:

  • Búsqueda vectorial a través de la función `cosineDistance()` — búsqueda rápida de recuerdos semánticamente similares
  • Búsqueda de texto con índice `tokenbf_v1` — búsqueda de texto completo en la memoria
  • Particionamiento por user_id — aislamiento de datos del usuario integrado en la base de datos
  • TTL para eliminación automática — los registros antiguos se eliminan sin intervención manual

ClickHouse realiza análisis y búsqueda en millones de registros en milisegundos. Para la memoria del agente, esto es más que suficiente.

Qué significa esto

La conclusión clave: no comience con el escalado. Resuelva el problema de forma simple (archivos, markdown, 300 líneas de código), luego escale solo si es necesario. Nikolay demostró que el mejor camino de ingeniería es de la complejidad a la simplicidad, no al revés.

ZK
Hamidun News
Noticias de AI sin ruido. Selección editorial diaria de más de 400 fuentes. Producto de Zhemal Khamidun, Head of AI en Alpina Digital.
¿Qué te parece?
Cargando comentarios…