Habr AI→ оригинал

Скилл Caveman с 75 000 звёзд обещает срезать расход токенов в Copilot на 75%

Copilot поменял тарификацию — разработчики стали упираться в лимиты уже за первую рабочую неделю. В командных чатах завирусился скилл Caveman: инструкция…

AI-обработка оригинала Habr AI; редакция Hamidun News
Скилл Caveman с 75 000 звёзд обещает срезать расход токенов в Copilot на 75%
Источник: Habr AI. Коллаж: Hamidun News.
◐ Слушать статью

После смены тарификации в Copilot разработчики начали упираться в месячные лимиты токенов уже за первую рабочую неделю. В рабочих чатах все ищут способ сэкономить, и среди предложений настойчиво мелькает один скилл — Caveman. README репозитория обещает до 75% экономии без потери качества. Разбираем, как он устроен и работает ли это в реальности.

Что такое

Caveman Идея обезоруживающе проста: специальная инструкция для системного промпта велит языковой модели общаться в стиле пещерного человека — без артиклей, без вводных конструкций, предельно короткими предложениями. Принцип «говорить лаконично» снижает объём исходящих токенов на каждый ответ, а суммарный расход за день падает значительно. Авторы утверждают, что экономия может достигать 75% — и при этом без деградации качества. Репозиторий набрал более 75 000 звёзд на GitHub, что для инструмента с такой концептуально простой механикой выглядит впечатляюще. Именно вирусность скилла и породила волну обсуждений в командных чатах после смены ценовой политики Copilot.

Почему токенные лимиты стали проблемой

Copilot перешёл на новую тарификацию, и это ударило прежде всего по командам, которые используют ИИ-ассистентов активно — десятки и сотни запросов в день. Разработчики упираются в потолок быстрее, чем ожидали, а доплачивать за расширение пакетов готовы далеко не все. Стандартные способы экономии известны давно: Писать краткие и точные промпты Не передавать лишний контекст в каждый запрос Убирать повторяющиеся инструкции из диалога Ограничивать размер окна контекста * Не просить модель «думать вслух», если это не нужно Всё это работает, но требует осознанных усилий от каждого участника команды при каждом запросе. Caveman предлагает системное решение: один раз добавил инструкцию в системный промпт — и модель сама переходит в экономный режим без дополнительного контроля.

Как скилл технически экономит токены

По своей сути Caveman — набор инструкций, заставляющих модель максимально сжимать ответы. Ключевая механика: сокращение output-токенов, которые у большинства провайдеров стоят дороже input-токенов. Каждый лишний абзац, вводная фраза или повтор — это реальные деньги при интенсивной работе. Если модель переходит на телеграфный стиль при каждом запросе, суммарная экономия за сотни взаимодействий в день действительно может быть существенной. Цифра в 75% теоретически достижима при агрессивном сжатии — особенно если задачи не требуют развёрнутых объяснений или длинной документации.

«75 000 звёзд на репозитории не могут ошибаться?» — с этим вопросом

автор приступает к практическому тестированию.

Где скилл может подвести Скептицизм здесь оправдан.

Формулировка «говори как пещерный человек» нечёткая, и модели интерпретируют её по-разному. На практике мнимая экономия легко оборачивается лишними расходами: модель срезает важные пояснения — и пользователь задаёт три уточняющих вопроса вместо одного. Телеграфный стиль усложняет восприятие кода с комментариями. Для задач с документированием избыточное сжатие даёт нечитаемый результат. Отдельный вопрос — что считать «потерей качества». Если задача выполнена технически верно, но объяснение настолько сжато, что разработчик не понимает логику, — это экономия или деградация? Авторы скилла, судя по всему, подразумевают только токены, а не когнитивные усилия на расшифровку ответа. Реальная выгода зависит от типа задач. Для коротких вопросов и небольших фрагментов кода скилл работает хорошо. Для сложного рефакторинга или объяснения архитектурных решений — может навредить больше, чем сэкономить.

Что это значит

Вирусность Caveman — симптом более широкой тенденции: ИИ-инструменты дорожают, лимиты ужесточаются, и сообщество ищет системные способы остаться в рамках бюджета. Реальный тест покажет, стоит ли «пещерный» стиль своих 75 000 звёзд на практике — или это красивые цифры в README.

ЖХ
Hamidun News
AI‑новости без шума. Ежедневный редакторский отбор из 400+ источников. Продукт Жемала Хамидуна, Head of AI в Alpina Digital.

Хотите не читать про ИИ, а внедрить его?

«AI News» — это полезные новости из мира ИИ. Системно научиться работать с нейросетями и применять их в работе — в Hamidun Academy.

Что вы думаете?
Загружаем комментарии…