Este artigo ainda não foi traduzido para o português — exibindo o original em russo.
Habr AI→ original

Skill Caveman com 75 mil estrelas promete cortar o uso de tokens no Copilot em 75%

O Copilot mudou seu modelo de cobrança, e os desenvolvedores começaram a bater nos limites já na primeira semana de trabalho. Nos chats das equipes, o skill…

Processado por IA de Habr AI; editado por Hamidun News
Skill Caveman com 75 mil estrelas promete cortar o uso de tokens no Copilot em 75%
Fonte: Habr AI. Colagem: Hamidun News.
◐ Ouvir artigo

После смены тарификации в Copilot разработчики начали упираться в месячные лимиты токенов уже за первую рабочую неделю. В рабочих чатах все ищут способ сэкономить, и среди предложений настойчиво мелькает один скилл — Caveman. README репозитория обещает до 75% экономии без потери качества. Разбираем, как он устроен и работает ли это в реальности.

Что такое

Caveman Идея обезоруживающе проста: специальная инструкция для системного промпта велит языковой модели общаться в стиле пещерного человека — без артиклей, без вводных конструкций, предельно короткими предложениями. Принцип «говорить лаконично» снижает объём исходящих токенов на каждый ответ, а суммарный расход за день падает значительно. Авторы утверждают, что экономия может достигать 75% — и при этом без деградации качества. Репозиторий набрал более 75 000 звёзд на GitHub, что для инструмента с такой концептуально простой механикой выглядит впечатляюще. Именно вирусность скилла и породила волну обсуждений в командных чатах после смены ценовой политики Copilot.

Почему токенные лимиты стали проблемой

Copilot перешёл на новую тарификацию, и это ударило прежде всего по командам, которые используют ИИ-ассистентов активно — десятки и сотни запросов в день. Разработчики упираются в потолок быстрее, чем ожидали, а доплачивать за расширение пакетов готовы далеко не все. Стандартные способы экономии известны давно: Писать краткие и точные промпты Не передавать лишний контекст в каждый запрос Убирать повторяющиеся инструкции из диалога Ограничивать размер окна контекста * Не просить модель «думать вслух», если это не нужно Всё это работает, но требует осознанных усилий от каждого участника команды при каждом запросе. Caveman предлагает системное решение: один раз добавил инструкцию в системный промпт — и модель сама переходит в экономный режим без дополнительного контроля.

Как скилл технически экономит токены

По своей сути Caveman — набор инструкций, заставляющих модель максимально сжимать ответы. Ключевая механика: сокращение output-токенов, которые у большинства провайдеров стоят дороже input-токенов. Каждый лишний абзац, вводная фраза или повтор — это реальные деньги при интенсивной работе. Если модель переходит на телеграфный стиль при каждом запросе, суммарная экономия за сотни взаимодействий в день действительно может быть существенной. Цифра в 75% теоретически достижима при агрессивном сжатии — особенно если задачи не требуют развёрнутых объяснений или длинной документации.

«75 000 звёзд на репозитории не могут ошибаться?» — с этим вопросом

автор приступает к практическому тестированию.

Где скилл может подвести Скептицизм здесь оправдан.

Формулировка «говори как пещерный человек» нечёткая, и модели интерпретируют её по-разному. На практике мнимая экономия легко оборачивается лишними расходами: модель срезает важные пояснения — и пользователь задаёт три уточняющих вопроса вместо одного. Телеграфный стиль усложняет восприятие кода с комментариями. Для задач с документированием избыточное сжатие даёт нечитаемый результат. Отдельный вопрос — что считать «потерей качества». Если задача выполнена технически верно, но объяснение настолько сжато, что разработчик не понимает логику, — это экономия или деградация? Авторы скилла, судя по всему, подразумевают только токены, а не когнитивные усилия на расшифровку ответа. Реальная выгода зависит от типа задач. Для коротких вопросов и небольших фрагментов кода скилл работает хорошо. Для сложного рефакторинга или объяснения архитектурных решений — может навредить больше, чем сэкономить.

Что это значит

Вирусность Caveman — симптом более широкой тенденции: ИИ-инструменты дорожают, лимиты ужесточаются, и сообщество ищет системные способы остаться в рамках бюджета. Реальный тест покажет, стоит ли «пещерный» стиль своих 75 000 звёзд на практике — или это красивые цифры в README.

ZK
Hamidun News
Notícias de AI sem ruído. Seleção editorial diária de mais de 400 fontes. Produto de Zhemal Khamidun, Head of AI na Alpina Digital.

Precisa de IA funcionando dentro da sua empresa — não só no feed de notícias?

Eu construo IA em produção para empresas — CRM sob medida, ferramentas internas, agentes autônomos, automação de processos. Pertence a você, moldada ao seu processo, sem taxa por usuário. Feito por Zhemal Khamidun, CPO da AlpinaGPT (plataforma de IA, 6.000+ usuários).

O que você acha?
Carregando comentários…