Harness вокруг LLM дает кратный прирост: что изменилось за год в Claude Code
После полутора лет работы с Claude Code инженер выяснил, что главный рычаг качества LLM — не новые версии моделей, а их обвязка: системный промпт, инструменты,

После полутора лет интенсивной работы с Claude Code, пробных запусков десятков экспериментов и наблюдений над командой инженеров, один опытный разработчик пришел к неожиданному выводу: главным рычагом улучшения качества LLM становится не поколение модели и не переход на более свежую версию, а сложная система её обвязки.
Что такое harness В англоязычном сообществе инженеров эта обвязка
называется harness — полный контур, в котором функционирует языковая модель. Это не просто промпт, передаваемый в чат, и не одно правило поведения. Это сложная система взаимодействия модели с внешним миром: её правила, границы, доступные инструменты, объём видимого контекста. Без этого контура даже самая мощная модель работает неэффективно — как экскаватор без рычагов, у которого есть двигатель, но нечем копать и переносить землю.
Почему обвязка дает больший прирост, чем новые модели
За год наблюдения выяснилось, что смена модели на новую версию даёт заметный, но ограниченный прирост качества. Переход с Claude 3 на Claude 4 — это улучшение, но его хватает на несколько процентов производительности. В то же время каждый новый слой обвязки вокруг той же модели — это кратный скачок. Добавили системный промпт, который чётко описывает роль модели — качество скачок. Подключили инструменты, через которые модель может взаимодействовать с реальностью — ещё скачок. Расширили контекст, добавили скиллы, настроили разрешения — каждый раз качество растет кратно. Это сдвигает фокус инженеров с охоты за новыми версиями на конструирование того контура, в котором модель работает.
Компоненты эффективной обвязки
Эффективная обвязка состоит из нескольких ключевых слоёв, каждый из которых вносит свой вклад: Системный промпт — явные инструкции, которые определяют поведение, стиль общения и границы Инструменты — доступ модели к внешним API, базам данных, браузерам и вычислительным ресурсам Контекст — сложное управление тем, что модель видит, помнит и на что может опираться Скиллы — предобученные паттерны и алгоритмы решения типовых задач Хуки — события и триггеры, которые срабатывают при определённых условиях Разрешения — граница между тем, что модель может и не может делать, какие файлы читать и писать * Память — долгосрочное и краткосрочное запоминание контекста проекта, решений и выводов Каждый из этих слоёв может быть оптимизирован независимо, давая прирост производительности для конкретного типа задач.
«Мощность есть, использовать нечем» — так описывает модель без обвязки
опытный инженер.
Что это значит
Фокус разработчиков смещается с гонки за более новыми и мощными моделями на построение интеллектуального контура вокруг имеющихся. Инвестиции в инженерию системного промпта, управление контекстом, разработку скиллов и оптимизацию разрешений окупаются быстрее и дают больший результат, чем ожидание следующей версии модели. Это открывает новые возможности для кастомизации под специфические задачи и команды, не требуя дорогостоящих обновлений железа или лицензий.