Convirtieron Codex en un asistente personal con memoria en Markdown, Git y Telegram
En Habr AI mostraron cómo convertir un coding agent común en un 'Jarvis' personal sin una pila RAG pesada. El autor construyó para Codex una capa de memoria…
Procesado por IA desde Habr AI; editado por Hamidun News
En Habr AI se publicó un estudio de caso detallado sobre cómo Codex se transformó de un agente de codificación en un asistente personal con memoria a largo plazo. En lugar de bases de datos vectoriales y RAG complejos, el autor construyó un sistema manejable basado en Markdown, Git, roles, automatizaciones y fuentes externas como Telegram y Anki.
Por Qué No RAG
El autor comienza con un problema simple: un chat IA típico responde bien en el momento, pero lucha por vivir a lo largo del tiempo. Cada nuevo diálogo pierde parte del contexto, distingue mal hechos estables de notas temporales e hipótesis, y la personalización permanece atrapada dentro de un hilo específico. Para un asistente personal, esto es insuficiente, porque necesita no solo responder preguntas sino también recordar hábitos, objetivos, historial de decisiones y escenarios recurrentes.
En lugar de un stack típico con embeddings, vector DB y GraphRAG, eligió una opción más transparente: una jerarquía de archivos Markdown en Git. Este enfoque, según él, funciona mejor en un corpus de conocimiento pequeño a medio que puede organizarse en una estructura clara. Los archivos son legibles por humanos, fácilmente versionables, no ocultan la lógica de búsqueda en una caja negra y te obligan a pensar no solo en recuperación sino también en disciplina de almacenamiento.
La idea principal del artículo es esta: en la memoria personal, la arquitectura y las reglas importan más que la tecnología de moda más reciente.
Cómo Funciona Jarvis
Jarvis se construye sobre un repositorio dividido en varias capas: profile para información de usuario estable, areas para esferas principales de la vida, events para cronología, preferences para restricciones y patrones, roles para modos de respuesta, skills para procedimientos locales, assets para fuentes externas e inbox para material bruto.
El punto no son las carpetas en sí, sino que al agente se le da un comportamiento rígido: primero buscar contexto relevante, luego responder, y si es necesario también actualizar la memoria sin contaminar todo el sistema.
El valor práctico surge en escenarios específicos que el autor ya ha vinculado con Codex:
- Rol de profesor de inglés que se basa en el historial de lecciones y puede trabajar con AnkiConnect
- Análisis diario de descuentos en tiendas y construcción de una dieta económica para ganancia de masa
- Reestructuración semanal de un plan deportivo basado en carga actual y recuperación
- Breves resúmenes de tareas, decisiones sin resolver y resultados personales semanales
- Conexión de archivos de Telegram, donde casi 300 mil mensajes y más de 3 mil mensajes de voz ya se han acumulado
Se hace especial énfasis en roles y automatizaciones. El mismo agente puede actuar como un asistente de vida contextual, analista, operador de procedimientos rutinarios o asistente de bienestar. Gracias a esto, las respuestas no son genéricas sino vinculadas a las tareas reales del usuario.
Telegram aquí se necesita no como un almacenamiento infinito de datos brutos, sino como una fuente para normalización: los mensajes se indexan por año, los mensajes de voz se transcriben, las tarjetas de personas y síntesis generales se actualizan basándose en diálogos. Sin esta capa de limpieza, la memoria rápidamente se convierte en un vertedero, y los permisos de escritura demasiado amplios comienzan a generar ruido y duplicados.
"Cada subagent es como un pulpo en un acuario separado."
Qué Significa Esto
El artículo muestra claramente hacia dónde se está desplazando el enfoque práctico hoy en torno a los agentes de IA. Para asistentes personales y escenarios de trabajo con Copilot, el ganador no será quien simplemente tenga un modelo más fuerte, sino quien mejor diseñe la memoria, roles, límites de acceso y costos de mantenimiento. Si esta capa se hace transparente y económica de mantener, incluso un agente de codificación ordinario puede comenzar a funcionar como un asistente digital verdadeiramente útil, especialmente donde es crítico recordar a la persona y no perder contexto entre sesiones. Esto es exactamente lo que hace que este enfoque sea práctico.
¿Quieres dejar de leer sobre IA y empezar a usarla?
AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.