MarkTechPost→ original

Volcengine lança OpenViking — uma base de contexto baseada em arquivos para agentes de AI como o OpenClaw

A Volcengine lançou o OpenViking como open source — uma base de contexto para agentes de AI que armazena memória, recursos e habilidades não como um conjunto…

Processado por IA de MarkTechPost; editado por Hamidun News
Volcengine lança OpenViking — uma base de contexto baseada em arquivos para agentes de AI como o OpenClaw
Fonte: MarkTechPost. Colagem: Hamidun News.
◐ Ouvir artigo

A Volcengine disponibilizou em open source o OpenViking — uma base de contexto para agentes de AI, incluindo sistemas como OpenClaw. O projeto propõe armazenar memória, recursos e habilidades não em índices vector dispersos, mas em uma hierarquia parecida com um sistema de arquivos comum.

Contexto como sistema de arquivos

A ideia principal do OpenViking é que, para um agente, é incômodo trabalhar com o contexto como um conjunto plano de pedaços de texto. Em um pipeline RAG típico, os documentos ficam separados, a memória do usuário fica separada, e ferramentas e habilidades vivem em outros lugares. Por causa disso, fica difícil para o desenvolvedor entender exatamente o que o agente viu, por que escolheu este ou aquele fragmento e onde procurar o erro se a resposta saiu fraca. O OpenViking tenta reunir tudo isso em um único modelo — um sistema de arquivos virtual com endereços `viking://`.

  • `viking://resources` — documentação, repositórios, páginas web e outros conhecimentos externos
  • `viking://user` — memória sobre o usuário, seus hábitos e preferências
  • `viking://agent` — habilidades, instruções e a memória de trabalho do próprio agente
  • `.abstract` — camada L0 curta para verificar relevância rapidamente
  • `.overview` — camada L1 com uma visão geral antes da leitura do conteúdo completo

Dentro dessa estrutura, os diferentes tipos de contexto são organizados em diretórios com URI claros, e o agente pode acessá-los quase como um desenvolvedor acessa arquivos locais.

Com isso, o contexto deixa de ser uma caixa-preta. Em vez da ideia abstrata de que algo foi encontrado por embedding, aparece uma navegação compreensível: o agente pode percorrer a árvore, ler arquivos específicos, pesquisar dentro de um diretório, rastrear o caminho até o fragmento necessário e controlar com mais precisão o que entra no prompt.

Menos ruído no prompt

Outro mecanismo-chave do OpenViking é o carregamento de contexto em três níveis. Ao gravar, o sistema não apenas coloca o arquivo em um índice, mas prepara de forma assíncrona vários níveis de representação. L0 é um resumo curto de uma frase, L1 é uma visão geral com destilação semântica e cenários de uso, L2 é o material original completo. O agente primeiro vê os níveis compactos e só depois, se necessário, desce aos detalhes. Essa abordagem reduz o gasto de tokens e diminui o ruído em tarefas longas.

Por baixo dos panos, o OpenViking separa parsing e processamento semântico. Primeiro, os documentos são convertidos para uma forma estruturada; depois, uma fila separada cuida da geração de visões gerais e da vectorization. Isso permite importar não só Markdown ou texto, mas também PDF, HTML, Word, PowerPoint, Excel, EPUB, imagens, áudio e vídeo. Para código, existe um modo separado com tree-sitter: o sistema consegue extrair o esqueleto estrutural de arquivos em Python, JavaScript, TypeScript, Rust, Go, Java e C/C++, para não gastar chamadas extras de LLM onde um esqueleto de AST basta.

Busca e memória

A busca no OpenViking não é organizada como uma única consulta vector sobre toda a base. Primeiro, o sistema analisa a intenção; depois, encontra rapidamente o diretório com maior probabilidade de conter a resposta certa, e então refina a busca dentro desse diretório e, se necessário, desce mais fundo pelos subdiretórios. Os desenvolvedores chamam isso de directory recursive retrieval. A ideia é que o agente não procura apenas um pedaço de texto parecido, mas também entende em que contexto esse pedaço está. Isso aumenta a precisão e torna a saída menos aleatória.

A observabilidade também é importante. O OpenViking salva a trajetória da busca pelos diretórios, então dá para ver exatamente para onde o agente foi e em que passo ele virou para o lado errado. Para equipes que depuram sistemas de agentes, isso é mais útil do que um log de RAG comum com alguns valores de score.

Além disso, o projeto já traz trabalho com memória de longo prazo: depois da sessão, o sistema pode extrair de forma assíncrona fatos de diálogos, chamadas de ferramentas e resultados de tarefas, e depois atualizar a memória do usuário e do próprio agente.

Um cenário prático já foi mostrado no exemplo do OpenClaw. Há um plugin para ele que usa o OpenViking como backend de memória de longo prazo, importa recursos e habilidades para os espaços `viking://` correspondentes e depois dá ao agente comandos separados para busca, salvamento de memórias e abertura de arquivos de arquivo. Ou seja, o projeto não parece uma ideia de pesquisa abstrata, mas uma camada de infraestrutura que já pode ser conectada a agentes reais em pipelines de trabalho.

O que isso significa

O OpenViking mostra que o mercado de infraestrutura para agentes está saindo do esquema primitivo de chat plus vector database e indo para uma memória mais gerenciável, com hierarquia, rastreamento e modo de longa vida. Se essa abordagem pegar, os desenvolvedores vão projetar a memória dos agentes com o mesmo nível de consciência com que hoje projetam estruturas de arquivos, API e bancos de dados.

ZK
Hamidun News
Notícias de AI sem ruído. Seleção editorial diária de mais de 400 fontes. Produto de Zhemal Khamidun, Head of AI na Alpina Digital.

Quer parar de ler sobre IA e começar a usar?

AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.

O que você acha?
Carregando comentários…