Skill Caveman com 75 mil estrelas promete cortar o uso de tokens no Copilot em 75%
O Copilot mudou seu modelo de cobrança, e os desenvolvedores começaram a bater nos limites já na primeira semana de trabalho. Nos chats das equipes, o skill…
Processado por IA de Habr AI; editado por Hamidun News
После смены тарификации в Copilot разработчики начали упираться в месячные лимиты токенов уже за первую рабочую неделю. В рабочих чатах все ищут способ сэкономить, и среди предложений настойчиво мелькает один скилл — Caveman. README репозитория обещает до 75% экономии без потери качества. Разбираем, как он устроен и работает ли это в реальности.
Что такое
Caveman Идея обезоруживающе проста: специальная инструкция для системного промпта велит языковой модели общаться в стиле пещерного человека — без артиклей, без вводных конструкций, предельно короткими предложениями. Принцип «говорить лаконично» снижает объём исходящих токенов на каждый ответ, а суммарный расход за день падает значительно. Авторы утверждают, что экономия может достигать 75% — и при этом без деградации качества. Репозиторий набрал более 75 000 звёзд на GitHub, что для инструмента с такой концептуально простой механикой выглядит впечатляюще. Именно вирусность скилла и породила волну обсуждений в командных чатах после смены ценовой политики Copilot.
Почему токенные лимиты стали проблемой
Copilot перешёл на новую тарификацию, и это ударило прежде всего по командам, которые используют ИИ-ассистентов активно — десятки и сотни запросов в день. Разработчики упираются в потолок быстрее, чем ожидали, а доплачивать за расширение пакетов готовы далеко не все. Стандартные способы экономии известны давно: Писать краткие и точные промпты Не передавать лишний контекст в каждый запрос Убирать повторяющиеся инструкции из диалога Ограничивать размер окна контекста * Не просить модель «думать вслух», если это не нужно Всё это работает, но требует осознанных усилий от каждого участника команды при каждом запросе. Caveman предлагает системное решение: один раз добавил инструкцию в системный промпт — и модель сама переходит в экономный режим без дополнительного контроля.
Как скилл технически экономит токены
По своей сути Caveman — набор инструкций, заставляющих модель максимально сжимать ответы. Ключевая механика: сокращение output-токенов, которые у большинства провайдеров стоят дороже input-токенов. Каждый лишний абзац, вводная фраза или повтор — это реальные деньги при интенсивной работе. Если модель переходит на телеграфный стиль при каждом запросе, суммарная экономия за сотни взаимодействий в день действительно может быть существенной. Цифра в 75% теоретически достижима при агрессивном сжатии — особенно если задачи не требуют развёрнутых объяснений или длинной документации.
«75 000 звёзд на репозитории не могут ошибаться?» — с этим вопросом
автор приступает к практическому тестированию.
Где скилл может подвести Скептицизм здесь оправдан.
Формулировка «говори как пещерный человек» нечёткая, и модели интерпретируют её по-разному. На практике мнимая экономия легко оборачивается лишними расходами: модель срезает важные пояснения — и пользователь задаёт три уточняющих вопроса вместо одного. Телеграфный стиль усложняет восприятие кода с комментариями. Для задач с документированием избыточное сжатие даёт нечитаемый результат. Отдельный вопрос — что считать «потерей качества». Если задача выполнена технически верно, но объяснение настолько сжато, что разработчик не понимает логику, — это экономия или деградация? Авторы скилла, судя по всему, подразумевают только токены, а не когнитивные усилия на расшифровку ответа. Реальная выгода зависит от типа задач. Для коротких вопросов и небольших фрагментов кода скилл работает хорошо. Для сложного рефакторинга или объяснения архитектурных решений — может навредить больше, чем сэкономить.
Что это значит
Вирусность Caveman — симптом более широкой тенденции: ИИ-инструменты дорожают, лимиты ужесточаются, и сообщество ищет системные способы остаться в рамках бюджета. Реальный тест покажет, стоит ли «пещерный» стиль своих 75 000 звёзд на практике — или это красивые цифры в README.
Precisa de IA funcionando dentro da sua empresa — não só no feed de notícias?
Eu construo IA em produção para empresas — CRM sob medida, ferramentas internas, agentes autônomos, automação de processos. Pertence a você, moldada ao seu processo, sem taxa por usuário. Feito por Zhemal Khamidun, CPO da AlpinaGPT (plataforma de IA, 6.000+ usuários).
O essencial da IA — uma vez por semana
Sete histórias que realmente importaram, escolhidas a dedo. Sem ruído nem releases.
Pronto! Verifique seu e-mail para a confirmação.