MarkTechPost→ original

Tencent lança sistema de memória local para agentes de IA TencentDB

Tencent lançou o código aberto do TencentDB Agent Memory — um sistema de memória para agentes de IA que funciona completamente na máquina do usuário sem nuvem.

Processado por IA de MarkTechPost; editado por Hamidun News
Tencent lança sistema de memória local para agentes de IA TencentDB
Fonte: MarkTechPost. Colagem: Hamidun News.
◐ Ouvir artigo

Tencent abriu o código-fonte do TencentDB Agent Memory — um sistema de memória local para agentes de IA que funciona completamente na máquina do usuário sem nuvem. O projeto foi lançado sob a licença MIT e está pronto para integração no OpenClaw e outros frameworks.

Arquitetura de memória em dois níveis

O sistema é dividido em duas partes. A memória de curto prazo resolve o problema do ruído: quando o agente trabalha com navegadores ou bancos de dados, as ferramentas geram milhares de linhas de logs. Em vez de empacotar tudo isso no contexto, o TencentDB compacta os logs em um canvas Mermaid compacto — um grafo visual das tarefas executadas que ocupa 10 a 50 vezes menos tokens.

A memória de longo prazo é organizada em uma pirâmide de abstração de quatro níveis que reflete como funciona a memória humana:

  • L0 — Diálogo — histórico de todas as mensagens entre o usuário e o agente
  • L1 — Átomo — fatos e eventos individuais extraídos do diálogo através de PNL
  • L2 — Cenário — grupos de átomos relacionados, padrões repetidos e contextos
  • L3 — Persona — perfil de personalidade de longo prazo do agente e do usuário, traços sustentados

Essa abordagem de múltiplos níveis permite que o agente esqueça os pequenos detalhes, mas se lembre do essencial. Isso economiza tokens ao solicitar contexto e aumenta a velocidade de localização das informações necessárias.

Busca híbrida e armazenamento local

Para extrair as informações necessárias da pirâmide de múltiplos níveis, o sistema usa uma busca de dois canais: BM25 clássico (busca de texto completo por palavras-chave) e busca vetorial (semântica, baseada em embeddings). Os resultados das duas buscas são combinados através de RRF (Reciprocal Rank Fusion) — um algoritmo que equilibra a contribuição de ambos os métodos e retorna os registros mais relevantes no início.

Por padrão, tudo é armazenado em um banco de dados SQLite local com a extensão sqlite-vec para vetores. Sem nuvem — os dados e códigos do agente permanecem na máquina do usuário.

O projeto é fornecido como um plugin para OpenClaw (framework Tencent) e como uma imagem Docker Hermes pronta.

Benchmarks: 61% menos tokens

Nos testes com WideSearch (conjunto de tarefas complexas de busca), TencentDB mostrou resultados impressionantes:

  • Redução de 61% no consumo de tokens contra a baseline
  • Aumento de 51% na taxa de acerto (proporção de tarefas resolvidas com sucesso)
  • Melhoria de precisão em PersonaMem (modelagem de personalidade) de 48% para 76%

Esses números mostram que uma arquitetura de memória apropriada ajuda o agente não apenas a economizar em chamadas de API, mas também a tomar decisões mais fundamentadas, porque tem acesso a informações relevantes do passado.

O que isso significa

A memória local para agentes de IA deixa de ser um projeto de pesquisa e se torna uma ferramenta prática. Para os desenvolvedores, isso abre várias portas: criar agentes de longo prazo que aprendem com as interações anteriores, economizando nas APIs em nuvem; armazenar dados confidenciais localmente, sem enviar para a nuvem; implantar agentes de IA em sua própria infraestrutura.

A licença MIT significa liberdade de uso em projetos comerciais.

ZK
Hamidun News
Notícias de AI sem ruído. Seleção editorial diária de mais de 400 fontes. Produto de Zhemal Khamidun, Head of AI na Alpina Digital.

Quer parar de ler sobre IA e começar a usar?

AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.

O que você acha?
Carregando comentários…