Tencent lança sistema de memória local para agentes de IA TencentDB
Tencent lançou o código aberto do TencentDB Agent Memory — um sistema de memória para agentes de IA que funciona completamente na máquina do usuário sem nuvem.
Processado por IA de MarkTechPost; editado por Hamidun News
Tencent abriu o código-fonte do TencentDB Agent Memory — um sistema de memória local para agentes de IA que funciona completamente na máquina do usuário sem nuvem. O projeto foi lançado sob a licença MIT e está pronto para integração no OpenClaw e outros frameworks.
Arquitetura de memória em dois níveis
O sistema é dividido em duas partes. A memória de curto prazo resolve o problema do ruído: quando o agente trabalha com navegadores ou bancos de dados, as ferramentas geram milhares de linhas de logs. Em vez de empacotar tudo isso no contexto, o TencentDB compacta os logs em um canvas Mermaid compacto — um grafo visual das tarefas executadas que ocupa 10 a 50 vezes menos tokens.
A memória de longo prazo é organizada em uma pirâmide de abstração de quatro níveis que reflete como funciona a memória humana:
- L0 — Diálogo — histórico de todas as mensagens entre o usuário e o agente
- L1 — Átomo — fatos e eventos individuais extraídos do diálogo através de PNL
- L2 — Cenário — grupos de átomos relacionados, padrões repetidos e contextos
- L3 — Persona — perfil de personalidade de longo prazo do agente e do usuário, traços sustentados
Essa abordagem de múltiplos níveis permite que o agente esqueça os pequenos detalhes, mas se lembre do essencial. Isso economiza tokens ao solicitar contexto e aumenta a velocidade de localização das informações necessárias.
Busca híbrida e armazenamento local
Para extrair as informações necessárias da pirâmide de múltiplos níveis, o sistema usa uma busca de dois canais: BM25 clássico (busca de texto completo por palavras-chave) e busca vetorial (semântica, baseada em embeddings). Os resultados das duas buscas são combinados através de RRF (Reciprocal Rank Fusion) — um algoritmo que equilibra a contribuição de ambos os métodos e retorna os registros mais relevantes no início.
Por padrão, tudo é armazenado em um banco de dados SQLite local com a extensão sqlite-vec para vetores. Sem nuvem — os dados e códigos do agente permanecem na máquina do usuário.
O projeto é fornecido como um plugin para OpenClaw (framework Tencent) e como uma imagem Docker Hermes pronta.
Benchmarks: 61% menos tokens
Nos testes com WideSearch (conjunto de tarefas complexas de busca), TencentDB mostrou resultados impressionantes:
- Redução de 61% no consumo de tokens contra a baseline
- Aumento de 51% na taxa de acerto (proporção de tarefas resolvidas com sucesso)
- Melhoria de precisão em PersonaMem (modelagem de personalidade) de 48% para 76%
Esses números mostram que uma arquitetura de memória apropriada ajuda o agente não apenas a economizar em chamadas de API, mas também a tomar decisões mais fundamentadas, porque tem acesso a informações relevantes do passado.
O que isso significa
A memória local para agentes de IA deixa de ser um projeto de pesquisa e se torna uma ferramenta prática. Para os desenvolvedores, isso abre várias portas: criar agentes de longo prazo que aprendem com as interações anteriores, economizando nas APIs em nuvem; armazenar dados confidenciais localmente, sem enviar para a nuvem; implantar agentes de IA em sua própria infraestrutura.
A licença MIT significa liberdade de uso em projetos comerciais.
Quer parar de ler sobre IA e começar a usar?
AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.