Volcengine lança OpenViking — uma base de contexto baseada em arquivos para agentes de AI como o OpenClaw
A Volcengine lançou o OpenViking como open source — uma base de contexto para agentes de AI que armazena memória, recursos e habilidades não como um conjunto…
Processado por IA de MarkTechPost; editado por Hamidun News
A Volcengine disponibilizou em open source o OpenViking — uma base de contexto para agentes de AI, incluindo sistemas como OpenClaw. O projeto propõe armazenar memória, recursos e habilidades não em índices vector dispersos, mas em uma hierarquia parecida com um sistema de arquivos comum.
Contexto como sistema de arquivos
A ideia principal do OpenViking é que, para um agente, é incômodo trabalhar com o contexto como um conjunto plano de pedaços de texto. Em um pipeline RAG típico, os documentos ficam separados, a memória do usuário fica separada, e ferramentas e habilidades vivem em outros lugares. Por causa disso, fica difícil para o desenvolvedor entender exatamente o que o agente viu, por que escolheu este ou aquele fragmento e onde procurar o erro se a resposta saiu fraca. O OpenViking tenta reunir tudo isso em um único modelo — um sistema de arquivos virtual com endereços `viking://`.
- `viking://resources` — documentação, repositórios, páginas web e outros conhecimentos externos
- `viking://user` — memória sobre o usuário, seus hábitos e preferências
- `viking://agent` — habilidades, instruções e a memória de trabalho do próprio agente
- `.abstract` — camada L0 curta para verificar relevância rapidamente
- `.overview` — camada L1 com uma visão geral antes da leitura do conteúdo completo
Dentro dessa estrutura, os diferentes tipos de contexto são organizados em diretórios com URI claros, e o agente pode acessá-los quase como um desenvolvedor acessa arquivos locais.
Com isso, o contexto deixa de ser uma caixa-preta. Em vez da ideia abstrata de que algo foi encontrado por embedding, aparece uma navegação compreensível: o agente pode percorrer a árvore, ler arquivos específicos, pesquisar dentro de um diretório, rastrear o caminho até o fragmento necessário e controlar com mais precisão o que entra no prompt.
Menos ruído no prompt
Outro mecanismo-chave do OpenViking é o carregamento de contexto em três níveis. Ao gravar, o sistema não apenas coloca o arquivo em um índice, mas prepara de forma assíncrona vários níveis de representação. L0 é um resumo curto de uma frase, L1 é uma visão geral com destilação semântica e cenários de uso, L2 é o material original completo. O agente primeiro vê os níveis compactos e só depois, se necessário, desce aos detalhes. Essa abordagem reduz o gasto de tokens e diminui o ruído em tarefas longas.
Por baixo dos panos, o OpenViking separa parsing e processamento semântico. Primeiro, os documentos são convertidos para uma forma estruturada; depois, uma fila separada cuida da geração de visões gerais e da vectorization. Isso permite importar não só Markdown ou texto, mas também PDF, HTML, Word, PowerPoint, Excel, EPUB, imagens, áudio e vídeo. Para código, existe um modo separado com tree-sitter: o sistema consegue extrair o esqueleto estrutural de arquivos em Python, JavaScript, TypeScript, Rust, Go, Java e C/C++, para não gastar chamadas extras de LLM onde um esqueleto de AST basta.
Busca e memória
A busca no OpenViking não é organizada como uma única consulta vector sobre toda a base. Primeiro, o sistema analisa a intenção; depois, encontra rapidamente o diretório com maior probabilidade de conter a resposta certa, e então refina a busca dentro desse diretório e, se necessário, desce mais fundo pelos subdiretórios. Os desenvolvedores chamam isso de directory recursive retrieval. A ideia é que o agente não procura apenas um pedaço de texto parecido, mas também entende em que contexto esse pedaço está. Isso aumenta a precisão e torna a saída menos aleatória.
A observabilidade também é importante. O OpenViking salva a trajetória da busca pelos diretórios, então dá para ver exatamente para onde o agente foi e em que passo ele virou para o lado errado. Para equipes que depuram sistemas de agentes, isso é mais útil do que um log de RAG comum com alguns valores de score.
Além disso, o projeto já traz trabalho com memória de longo prazo: depois da sessão, o sistema pode extrair de forma assíncrona fatos de diálogos, chamadas de ferramentas e resultados de tarefas, e depois atualizar a memória do usuário e do próprio agente.
Um cenário prático já foi mostrado no exemplo do OpenClaw. Há um plugin para ele que usa o OpenViking como backend de memória de longo prazo, importa recursos e habilidades para os espaços `viking://` correspondentes e depois dá ao agente comandos separados para busca, salvamento de memórias e abertura de arquivos de arquivo. Ou seja, o projeto não parece uma ideia de pesquisa abstrata, mas uma camada de infraestrutura que já pode ser conectada a agentes reais em pipelines de trabalho.
O que isso significa
O OpenViking mostra que o mercado de infraestrutura para agentes está saindo do esquema primitivo de chat plus vector database e indo para uma memória mais gerenciável, com hierarquia, rastreamento e modo de longa vida. Se essa abordagem pegar, os desenvolvedores vão projetar a memória dos agentes com o mesmo nível de consciência com que hoje projetam estruturas de arquivos, API e bancos de dados.
Quer parar de ler sobre IA e começar a usar?
AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.
O essencial da IA — uma vez por semana
Sete histórias que realmente importaram, escolhidas a dedo. Sem ruído nem releases.
Pronto! Verifique seu e-mail para a confirmação.