HKUDS Présente OpenSpace en Détail — Moteur d'Auto-Évolution de Compétences pour Agents IA
HKUDS a lancé un tutoriel détaillé sur OpenSpace — un moteur qui permet aux agents IA d'apprendre des tâches complétées et de réutiliser les compétences. Le dét

HKUDS выпустила подробный разбор OpenSpace — открытого движка навыков, который позволяет AI-агентам не начинать каждую задачу с нуля, а накапливать рабочие шаблоны и переиспользовать их. В материале показан полный цикл: от настройки модели OpenAI до сравнения «холодного» и «тёплого» запуска, где повторное использование навыков снижает расход токенов и повышает качество ответа.
От холодного старта
OpenSpace ставится из GitHub-репозитория и в туториале настраивается на модели OpenAI, включая gpt-4o-mini. Дальше агенту дают первую задачу без какой-либо готовой библиотеки навыков. Система выполняет её как обычный LLM-агент, но параллельно фиксирует удачные шаги, обходные пути и рабочие инструкции, которые потом можно использовать повторно.
Навыки живут не только в контексте диалога: они сохраняются в виде файлов по конвенции SKILL.md и записываются в SQLite-базу, так что их можно просматривать, версионировать и анализировать отдельно от самого запуска. После этого авторы запускают похожую задачу ещё раз и показывают разницу между cold start и warm start.
Здесь OpenSpace уже не рассуждает с нуля, а подбирает подходящие навыки через гибридный поиск на BM25 и эмбеддингах. В демо отдельно создают три базовых навыка вручную: проверку данных, генерацию отчётов с fallback-сценариями и механизм восстановления после ошибок. Это нужно, чтобы заранее посеять полезные паттерны, а дальше дать эволюционному движку доращивать их на реальных задачах.
Как навыки растут
Ключевая идея OpenSpace в том, что навык здесь считается не статичным промптом, а живой сущностью. После каждого выполнения система анализирует, что сработало, где были сбои, какие инструменты деградировали и что можно улучшить в следующей версии. Поэтому движок не только копит успешные сценарии, но и умеет чинить их, специализировать под новые задачи и извлекать новые навыки из единичных удачных запусков.
- FIX — исправляет сломанный или устаревший навык без смены его роли.
- DERIVED — создаёт производную версию под более узкий сценарий или новый класс задач.
- CAPTURED — извлекает новый переиспользуемый паттерн прямо из успешного выполнения.
- BM25 + embeddings — помогает быстро находить самый релевантный навык под описание задачи. * open-space.cloud — даёт общий каталог, где навыки можно искать, скачивать, загружать и делить между командами. Важная часть конструкции — коллективный слой. Через облачное сообщество агенты могут обмениваться уже эволюционировавшими навыками, смотреть историю версий и строить общие репозитории для команды. В статье это подаётся как переход от одиночного ассистента к сети агентов, которые учатся не только на своих ошибках. Если один агент нашёл надёжный обход для генерации PDF, парсинга таблиц или web research, другой может забрать этот навык себе и не повторять тот же цикл проб и падений.
Экономика токенов OpenSpace Самая сильная часть материала — не установка, а цифры.
В репозитории OpenSpace приводится GDPVal-бенчмарк на выборке из 50 профессиональных задач в шести категориях: документы, формы compliance, медиа, инженерия, spreadsheets и стратегия. Для чистого сравнения OpenSpace сопоставляли с базовым агентом ClawWork на той же backbone-модели Qwen 3.5-Plus, так что разница объясняется именно накоплением навыков, а не заменой модели.
Итог — в 4,2 раза выше экономическая отдача, 70,8% среднего качества и на 45,9% меньше токенов при повторном прогоне задач. Разбивка по категориям показывает, где самоэволюция даёт максимум. В документах и переписке warm run срезал расход токенов на 56%, в задачах на формы и compliance — на 51%, в медиа — на 46%, в таблицах — на 37%.
При этом авторы подчёркивают, что из 165 эволюционировавших навыков большая часть относится не к узкой предметной экспертизе, а к надёжности исполнения: обработке форматов файлов, восстановлению после ошибок, генерации документов и проверке качества. То есть главный выигрыш приходит не от «знания отрасли», а от того, что агент перестаёт ломаться в типовых технических местах.
Что это значит
OpenSpace хорошо показывает, куда движутся агентные фреймворки: от одноразовых промптов к постоянной рабочей памяти, где каждая выполненная задача делает систему дешевле и устойчивее. Для продуктовых команд это сигнал, что следующая волна эффективности придёт не только от новых моделей, но и от инфраструктуры переиспользуемых навыков вокруг них.