MarkTechPost→ оригинал

أطلقت Volcengine OpenViking — قاعدة سياق قائمة على الملفات لوكلاء AI مثل OpenClaw

أتاحت Volcengine مشروع OpenViking كمشروع مفتوح المصدر — قاعدة سياق لوكلاء AI تخزن الذاكرة والموارد والمهارات ليس كمجموعة من chunks، بل كنظام ملفات افتراضي. يستخ

◐ Слушать статью

Volcengine выложила в open source OpenViking — базу контекста для ИИ-агентов, включая системы вроде OpenClaw. Проект предлагает хранить память, ресурсы и навыки не в разрозненных векторных индексах, а в иерархии, похожей на обычную файловую систему.

Контекст как файловая система

Главная идея OpenViking в том, что агенту неудобно работать с контекстом как с плоским набором текстовых кусков. В типичном RAG-пайплайне документы лежат отдельно, память о пользователе отдельно, инструменты и навыки вообще живут в других местах. Из-за этого разработчику сложно понять, что именно агент увидел, почему выбрал тот или иной фрагмент и где искать ошибку, если ответ оказался слабым.

OpenViking пытается свести всё это к одной модели — виртуальной файловой системе с адресами `viking://`. `viking://resources` — документация, репозитории, веб-страницы и другие внешние знания `viking://user` — память о пользователе, его привычках и предпочтениях `viking://agent` — навыки, инструкции и рабочая память самого агента `.abstract` — короткий слой L0 для быстрой проверки релевантности * `.

overview` — слой L1 с обзором перед чтением полного содержимого Внутри этой структуры разные типы контекста раскладываются по каталогам с понятными URI, а агент может обращаться к ним почти как разработчик к локальным файлам. За счёт этого контекст перестаёт быть чёрным ящиком. Вместо абстрактного «что-то нашлось по эмбеддингам» появляется понятная навигация: агент может просматривать дерево, читать конкретные файлы, искать по каталогу, отслеживать путь до нужного фрагмента и точнее управлять тем, что попадает в промпт.

Меньше шума в промпте Ещё один ключевой механизм OpenViking — трёхуровневая загрузка контекста.

При записи система не просто складывает файл в индекс, а асинхронно подготавливает несколько уровней представления. L0 — это короткое резюме в одно предложение, L1 — обзор со смысловой выжимкой и сценариями использования, L2 — исходный полный материал. Агент сначала видит компактные уровни и только потом, если нужно, проваливается в детали.

Такой подход снижает расход токенов и уменьшает шум в длинных задачах. Под капотом OpenViking разделяет парсинг и семантическую обработку. Сначала документы переводятся в структурированный вид, затем отдельно запускается очередь генерации обзоров и векторизации.

Это позволяет импортировать не только Markdown или текст, но и PDF, HTML, Word, PowerPoint, Excel, EPUB, изображения, аудио и видео. Для кода есть отдельный режим с tree-sitter: система умеет вытаскивать структурный каркас файлов на Python, JavaScript, TypeScript, Rust, Go, Java и C/C++, чтобы не гонять лишние LLM-вызовы там, где хватит AST-скелета.

Поиск и память Поиск в OpenViking устроен не как одиночный векторный запрос по всей базе.

Сначала система анализирует намерение, затем быстро находит каталог с наибольшей вероятностью нужного ответа, после чего уточняет поиск уже внутри этой директории и при необходимости спускается глубже по подкаталогам. Разработчики называют это directory recursive retrieval. Смысл в том, что агент ищет не только похожий кусок текста, но и понимает, в каком контексте этот кусок находится.

Это повышает точность и делает выдачу менее случайной. Отдельно важна наблюдаемость. OpenViking сохраняет траекторию поиска по директориям, поэтому можно увидеть, куда именно пошёл агент и на каком шаге он свернул не туда.

Для команд, которые отлаживают агентные системы, это полезнее обычного RAG-лога с несколькими score-значениями. Плюс в проект встроена работа с долгосрочной памятью: после сессии система может асинхронно извлекать факты из диалогов, вызовов инструментов и результатов задач, а затем обновлять память пользователя и самого агента. Практический сценарий уже показан на примере OpenClaw.

Для него есть плагин, который использует OpenViking как бэкенд долгосрочной памяти, импортирует ресурсы и навыки в соответствующие пространства `viking://`, а затем даёт агенту отдельные команды для поиска, сохранения воспоминаний и раскрытия архивов. То есть проект выглядит не как абстрактная исследовательская идея, а как инфраструктурный слой, который уже можно подключать к реальным агентам в рабочих пайплайнах.

Что это значит

OpenViking показывает, что рынок агентной инфраструктуры уходит от примитивной схемы «чат плюс векторная база» к более управляемой памяти с иерархией, трассировкой и режимом долгой жизни. Если подход приживётся, разработчики будут проектировать память агентов так же осознанно, как сегодня проектируют файловые структуры, API и базы данных.

ЖХ
Hamidun News
AI‑новости без шума. Ежедневный редакторский отбор из 400+ источников. Продукт Жемала Хамидуна, Head of AI в Alpina Digital.
Загружаем комментарии…