MarkTechPost→ оригинал

NVIDIA Open-SWE-Traces: сборка данных для дообучения агентов по написанию кода

NVIDIA опубликовала Open-SWE-Traces — датасет с тысячами реальных сессий AI-агентов, которые решают задачи по программированию. Исследователи разобрали, как…

AI-обработка оригинала MarkTechPost; редакция Hamidun News
NVIDIA Open-SWE-Traces: сборка данных для дообучения агентов по написанию кода
Источник: MarkTechPost. Коллаж: Hamidun News.
◐ Слушать статью

NVIDIA открыла датасет Open-SWE-Traces — коллекцию реальных многоходовых сессий AI-агентов, которые решают задачи по разработке программного обеспечения. Туториал разбирает полный пайплайн: от стриминга данных до готовой выборки для supervised fine-tuning.

Что такое

Open-SWE-Traces Датасет содержит тысячи траекторий агентов: каждая — полная запись сессии, где AI получает инженерную задачу, поэтапно вызывает инструменты (чтение файлов, запуск тестов, поиск по коду), итерирует решение и выдаёт финальный патч. Это принципиально отличается от обычных датасетов вопрос-ответ: здесь зафиксировано не только что получилось, но и как агент к этому пришёл. Каждая запись содержит структурированные метаданные: длина траектории — число шагов агента список использованных инструментов и частота вызовов размер финального diff-а в строках кода язык программирования задачи * флаг успешного или неуспешного решения Данные размещены на Hugging Face и поддерживают стриминг — в Google Colab можно работать с датасетом без полной загрузки, что важно при объёмах в несколько гигабайт.

Как строится пайплайн Туториал проводит через несколько этапов обработки.

Первый — нормализация диалогов. Многоходовые сессии агента приводятся к единому формату: сообщения пользователя, ответы агента и вызовы инструментов выравниваются в последовательность. Это нужно, потому что разные версии агентов логируют сессии по-разному. Второй — парсинг патчей. Из финального вывода агента извлекается сам код изменений в unified diff-формате. Именно этот патч становится «ответом» в обучающем примере. Третий — сборка аналитического DataFrame. По каждой траектории считаются ключевые метрики: бюджеты токенов на разных этапах работы агента, распределение по инструментам, статистика успешности по языкам и типам задач.

Фильтрация для SFT Финальный шаг — отбор примеров для обучения.

Авторы применяют цепочку фильтров. По меткам успеха — в выборку попадают только траектории с успешным решением. Учить на провальных сессиях без специальной разметки опасно: модель усвоит ошибочные паттерны. По токенам — траектории длиннее заданного лимита отсеиваются. Слишком длинные примеры не помещаются в контекст при стандартных настройках обучения. По языку — если нужен специализированный агент под Python или JavaScript, фильтрация оставляет только релевантные примеры. По наличию патча — сессии без финального кода бесполезны для задачи SFT, где модель должна учиться выдавать конкретный результат.

«Качество обучающих данных важнее количества — особенно для агентских

трейсов, где неудачные сессии могут закрепить в модели плохие паттерны».

Что это значит

Open-SWE-Traces от NVIDIA — один из первых публичных датасетов с реальными траекториями агентов для инженерных задач. Туториал даёт рабочий шаблон: от сырых данных на Hugging Face до готовой SFT-выборки в несколько строк кода. Для команд, которые строят собственных агентов-кодеров, это готовый старт без необходимости собирать данные с нуля.

ЖХ
Hamidun News
AI‑новости без шума. Ежедневный редакторский отбор из 400+ источников. Продукт Жемала Хамидуна, Head of AI в Alpina Digital.

Хотите не читать про ИИ, а внедрить его?

«AI News» — это полезные новости из мира ИИ. Системно научиться работать с нейросетями и применять их в работе — в Hamidun Academy.

Что вы думаете?
Загружаем комментарии…