Memória cognitiva para um agente de AI: como o SQLite substituiu os bancos de dados vetoriais
Um desenvolvedor apresentou uma arquitetura aberta de memória cognitiva para agentes locais de AI, construída sobre um único arquivo SQLite. Em vez da…
Processado por IA de Habr AI; editado por Hamidun News
Um dos principais problemas não resolvidos dos agentes de IA modernos soa enganosamente simples: como ensiná-los a lembrar o que é importante e esquecer o que ficou obsoleto. Um desenvolvedor que publicou uma análise técnica detalhada no Habr propôs uma solução que vai contra o mainstream da indústria. Em vez de usar bancos de dados vetoriais populares, ele construiu uma memória cognitiva completa sobre um único arquivo SQLite.
O problema que ele descreve é familiar para qualquer um que tenha tentado criar um agente de IA de longa duração. A receita padrão se parece com isto: você pega o texto, o divide em chunks, o converte em embeddings vetoriais, o armazena no Pinecone ou Chroma, e recupera os mais próximos pela distância do cosseno quando consultado. Em curtos períodos de tempo isso funciona.
Mas assim que o agente vive mais tempo, o caos começa: a janela de contexto fica entulhada com fragmentos irrelevantes, fatos contraditórios de diferentes períodos coexistem como se nada tivesse acontecido, e não há mecanismo de esquecimento algum. O agente lembra de tudo igualmente bem, o que na prática significa que ele lembra de tudo igualmente mal.
A arquitetura proposta pega emprestado princípios da psicologia cognitiva e neurociência. A memória é organizada como um grafo com dois tipos de nós: episódicos, que armazenam eventos e interações específicas, e semânticos, contendo conhecimento generalizado e fatos. Entre os nós estão dispostas arestas tipificadas, refletindo a natureza das conexões. Entidades nomeadas são destacadas como uma camada separada, permitindo ao agente rastrear menções de pessoas, organizações, conceitos específicos e vincular fragmentos de informação disparatados em uma imagem unificada.
O sistema de busca merece atenção especial. Em vez de depender de um único método de recuperação de informação, o desenvolvedor implementou uma abordagem híbrida que combina três mecanismos: busca de texto completo via SQLite FTS5 para correspondências exatas e palavras-chave, busca vetorial para proximidade semântica e travessia de grafo para recuperar contextos associados. Os resultados das três estratégias de busca são combinados usando Reciprocal Rank Fusion, um algoritmo que combina listas classificadas de diferentes fontes sem precisar calibrar suas pontuações absolutas. Esta é uma solução elegante que permite a cada método compensar as fraquezas dos outros.
Mas a parte mais interessante da arquitetura está relacionada não ao lembrar, mas ao esquecer. O desenvolvedor implementou a curva de esquecimento de Ebbinghaus, um modelo clássico da psicologia experimental do século XIX que descreve o decaimento exponencial da memória ao longo do tempo. Cada nó do grafo tem uma métrica de "força da memória" que diminui gradualmente. Informações acessadas repetidamente são reforçadas, enquanto fragmentos raramente solicitados naturalmente recuam para o fundo. Isto é fundamentalmente diferente da abordagem da maioria dos sistemas, onde os dados existem ou não existem.
O quadro é complementado por um mecanismo de consolidação LLM em segundo plano. De forma análoga a como o cérebro humano processa e resume informações durante o sono, o agente periodicamente inicia um modelo de linguagem para analisar memórias episódicas acumuladas. O modelo identifica padrões, resolve contradições e cria novos nós semânticos, transformando episódios disparatados em conhecimento estruturado. Essencialmente isto é geração automática de "sabedoria da experiência."
É importante enfatizar o pragmatismo da engenharia da solução. Todo o sistema roda em um único arquivo SQLite, sem serviços externos, sem contêineres Docker com bancos de dados vetoriais, sem assinaturas de armazenamento em nuvem. Para um agente rodando localmente, isso significa dependências mínimas, simplicidade de implantação e controle total sobre os dados. SQLite, apesar de sua reputação de "banco de dados para pequenos projetos," há muito tempo provou sua capacidade de lidar com cargas sérias, e a extensão FTS5 a transforma em um mecanismo de busca completo.
Este projeto se encaixa em uma tendência crescente de criar memória mais "humana" para agentes de IA. Grandes laboratórios como Google DeepMind e OpenAI estão ativamente pesquisando mecanismos de memória de longo prazo, mas suas soluções geralmente estão ligadas a plataformas proprietárias. Uma arquitetura aberta que pode ser implantada localmente em qualquer máquina democratiza o acesso a essas capacidades. Se a abordagem se provar viável em escala, ela pode mudar como a memória dos agentes autônomos deve ser estruturada, de acúmulo cego de dados para gerenciamento significativo de conhecimento.
Quer parar de ler sobre IA e começar a usar?
AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.