Composer 2.5 от Cursor: агент для кода научили лучше работать с долгими задачами
Cursor обновила Composer 2.5 — агент для кода в IDE. Теперь он лучше работает с долгосрочными задачами. Главное: обучали новым методом целевой обратной связи —

Cursor выпустила Composer 2.5 — обновление своего AI-агента для работы с кодом в IDE. Это значительный прыжок в умственных способностях и поведении по сравнению с версией 2.
Что изменилось
Composer 2.5 лучше справляется с долгосрочными задачами, точнее следует сложным инструкциям и приятнее в работе. Команда Cursor улучшила модель, наращивая объёмы обучения, создавая более сложные среды для обучения с подкреплением и внедряя новые методы. Не все улучшения видны в тестах и бенчмарках. Важные измерения — стиль общения и умение калибровать усилия. Именно эти аспекты делают модель практичнее в реальной работе.
Целевая обратная связь Главная инновация — новый метод обучения с текстовой обратной связью.
Проблема: когда RL-сигнал приходит за всю многошаговую последовательность (сотни тысяч токенов), модели трудно понять, какое решение привело к ошибке. Финальный результат — шумный сигнал. Решение: вставлять подсказку именно в момент ошибки. Например, если модель пытается вызвать несуществующий инструмент, в контекст добавляют подсказку «Доступные инструменты: [список]». Это помогает модели сразу исправиться и не делать ошибку в следующий раз.
«Это даёт модели локальный учебный сигнал для поведения, которое мы
хотим изменить, при этом сохраняя более широкую RL-задачу на всю траекторию»
Синтетические данные и масштабирование *
Composer 2.5 обучена на 25х большем количестве синтетических задач Задачи создаются динамически в процессе обучения Используется подход с удалением фич из реальных кодовых баз * Система выбирает сложные задачи прямо во время обучающего запуска Во время обучения способность Composer кодировать растёт настолько, что она начинает решать большинство задач. Чтобы продолжить рост интеллекта, команда как выбирает более сложные задачи, так и создаёт их динамически на протяжении запуска.
Что дальше Основа Composer 2.5 — открытый чекпоинт Kimi K2.5 от Moonshot.
Но это переходный шаг. Вместе с SpaceX Cursor обучает намного большую модель с нуля, используя в 10 раз больше вычислений. Colossus 2 располагает миллионом H100-эквивалентов. Cursor ожидает, что новая модель станет огромным скачком в способностях.
Что это значит Код-генерация вышла на новый уровень.
Агенты становятся не просто вспомогательным инструментом, а полноценными помощниками на долгосрочных проектах. Это приближает момент, когда AI сможет вести разработку проекта почти самостоятельно.