MarkTechPost→ original

Volcengine lanza OpenViking — una base de contexto basada en archivos para agentes de AI como OpenClaw

Volcengine liberó OpenViking como código abierto: una base de contexto para agentes de AI que almacena memoria, recursos y habilidades no como un conjunto de…

Procesado por IA desde MarkTechPost; editado por Hamidun News
Volcengine lanza OpenViking — una base de contexto basada en archivos para agentes de AI como OpenClaw
Fuente: MarkTechPost. Collage: Hamidun News.
◐ Escuchar artículo

Volcengine ha publicado como open source OpenViking — una base de contexto para agentes de AI, incluidos sistemas como OpenClaw. El proyecto propone almacenar memoria, recursos y habilidades no en índices vector dispersos, sino en una jerarquía parecida a un sistema de archivos convencional.

Contexto como sistema de archivos

La idea principal de OpenViking es que a un agente le resulta incómodo trabajar con el contexto como un conjunto plano de fragmentos de texto. En un pipeline RAG típico, los documentos están por separado, la memoria del usuario está por separado, y las herramientas y habilidades viven directamente en otros lugares. Por eso, al desarrollador le cuesta entender qué vio exactamente el agente, por qué eligió un fragmento u otro y dónde buscar el error si la respuesta resultó floja. OpenViking intenta llevar todo eso a un único modelo — un sistema de archivos virtual con direcciones `viking://`.

  • `viking://resources` — documentación, repositorios, páginas web y otros conocimientos externos
  • `viking://user` — memoria sobre el usuario, sus hábitos y preferencias
  • `viking://agent` — habilidades, instrucciones y memoria de trabajo del propio agente
  • `.abstract` — una capa L0 corta para comprobar la relevancia rápidamente
  • `.overview` — una capa L1 con una visión general antes de leer el contenido completo

Dentro de esta estructura, los distintos tipos de contexto se distribuyen en directorios con URI claros, y el agente puede acceder a ellos casi como un desarrollador accede a archivos locales.

Con ello, el contexto deja de ser una caja negra. En lugar de la idea abstracta de que algo se encontró por embedding, aparece una navegación comprensible: el agente puede recorrer el árbol, leer archivos concretos, buscar dentro de un directorio, seguir la ruta hasta el fragmento necesario y controlar con más precisión qué acaba entrando en el prompt.

Menos ruido en el prompt

Otro mecanismo clave de OpenViking es la carga de contexto en tres niveles. Al escribir, el sistema no solo mete el archivo en un índice, sino que prepara de forma asíncrona varios niveles de representación. L0 es un resumen corto de una frase, L1 es una visión general con destilación semántica y escenarios de uso, L2 es el material original completo. El agente ve primero los niveles compactos y solo después, si hace falta, baja al detalle. Este enfoque reduce el gasto de tokens y disminuye el ruido en tareas largas.

Por debajo, OpenViking separa el parsing del procesamiento semántico. Primero, los documentos se convierten a una forma estructurada; después, una cola aparte se encarga de la generación de visiones generales y de la vectorization. Esto permite importar no solo Markdown o texto, sino también PDF, HTML, Word, PowerPoint, Excel, EPUB, imágenes, audio y vídeo. Para código hay un modo independiente con tree-sitter: el sistema sabe extraer el esqueleto estructural de archivos en Python, JavaScript, TypeScript, Rust, Go, Java y C/C++, para no lanzar llamadas extra de LLM allí donde basta con un esqueleto de AST.

Búsqueda y memoria

La búsqueda en OpenViking no está planteada como una única consulta vector sobre toda la base. Primero, el sistema analiza la intención; luego encuentra rápidamente el directorio con mayor probabilidad de contener la respuesta correcta, tras lo cual afina la búsqueda ya dentro de ese directorio y, si es necesario, baja más por los subdirectorios. Los desarrolladores llaman a esto directory recursive retrieval. La idea es que el agente no solo busca un fragmento de texto parecido, sino que también entiende en qué contexto está ese fragmento. Esto mejora la precisión y hace que la salida sea menos aleatoria.

La observabilidad también es importante. OpenViking guarda la trayectoria de búsqueda por directorios, de modo que se puede ver exactamente adónde fue el agente y en qué paso se desvió. Para los equipos que depuran sistemas de agentes, esto es más útil que un log de RAG convencional con unos pocos valores de score.

Además, el proyecto incorpora memoria a largo plazo: después de una sesión, el sistema puede extraer de forma asíncrona hechos de diálogos, llamadas de herramientas y resultados de tareas, y luego actualizar la memoria del usuario y la del propio agente.

Ya se ha mostrado un escenario práctico con el ejemplo de OpenClaw. Existe un plugin para él que utiliza OpenViking como backend de memoria a largo plazo, importa recursos y habilidades a los espacios `viking://` correspondientes y luego da al agente comandos independientes para buscar, guardar recuerdos y abrir archivos de archivo. Es decir, el proyecto no parece una idea de investigación abstracta, sino una capa de infraestructura que ya puede conectarse a agentes reales en pipelines de trabajo.

Qué significa esto

OpenViking muestra que el mercado de la infraestructura para agentes se aleja del esquema primitivo de chat plus vector database y se dirige hacia una memoria más gestionable, con jerarquía, trazabilidad y un modo de larga vida. Si este enfoque se consolida, los desarrolladores diseñarán la memoria de los agentes con la misma intención con la que hoy diseñan estructuras de archivos, API y bases de datos.

ZK
Hamidun News
Noticias de AI sin ruido. Selección editorial diaria de más de 400 fuentes. Producto de Zhemal Khamidun, Head of AI en Alpina Digital.

¿Quieres dejar de leer sobre IA y empezar a usarla?

AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.

¿Qué te parece?
Cargando comentarios…