Le skill Caveman, avec 75 000 étoiles, promet de réduire de 75 % la consommation de tokens dans Copilot
Copilot a changé sa tarification, et les développeurs ont commencé à se heurter aux limites dès la première semaine de travail. Dans les chats d'équipe, le…
Traité par IA depuis Habr AI ; édité par Hamidun News
После смены тарификации в Copilot разработчики начали упираться в месячные лимиты токенов уже за первую рабочую неделю. В рабочих чатах все ищут способ сэкономить, и среди предложений настойчиво мелькает один скилл — Caveman. README репозитория обещает до 75% экономии без потери качества. Разбираем, как он устроен и работает ли это в реальности.
Что такое
Caveman Идея обезоруживающе проста: специальная инструкция для системного промпта велит языковой модели общаться в стиле пещерного человека — без артиклей, без вводных конструкций, предельно короткими предложениями. Принцип «говорить лаконично» снижает объём исходящих токенов на каждый ответ, а суммарный расход за день падает значительно. Авторы утверждают, что экономия может достигать 75% — и при этом без деградации качества. Репозиторий набрал более 75 000 звёзд на GitHub, что для инструмента с такой концептуально простой механикой выглядит впечатляюще. Именно вирусность скилла и породила волну обсуждений в командных чатах после смены ценовой политики Copilot.
Почему токенные лимиты стали проблемой
Copilot перешёл на новую тарификацию, и это ударило прежде всего по командам, которые используют ИИ-ассистентов активно — десятки и сотни запросов в день. Разработчики упираются в потолок быстрее, чем ожидали, а доплачивать за расширение пакетов готовы далеко не все. Стандартные способы экономии известны давно: Писать краткие и точные промпты Не передавать лишний контекст в каждый запрос Убирать повторяющиеся инструкции из диалога Ограничивать размер окна контекста * Не просить модель «думать вслух», если это не нужно Всё это работает, но требует осознанных усилий от каждого участника команды при каждом запросе. Caveman предлагает системное решение: один раз добавил инструкцию в системный промпт — и модель сама переходит в экономный режим без дополнительного контроля.
Как скилл технически экономит токены
По своей сути Caveman — набор инструкций, заставляющих модель максимально сжимать ответы. Ключевая механика: сокращение output-токенов, которые у большинства провайдеров стоят дороже input-токенов. Каждый лишний абзац, вводная фраза или повтор — это реальные деньги при интенсивной работе. Если модель переходит на телеграфный стиль при каждом запросе, суммарная экономия за сотни взаимодействий в день действительно может быть существенной. Цифра в 75% теоретически достижима при агрессивном сжатии — особенно если задачи не требуют развёрнутых объяснений или длинной документации.
«75 000 звёзд на репозитории не могут ошибаться?» — с этим вопросом
автор приступает к практическому тестированию.
Где скилл может подвести Скептицизм здесь оправдан.
Формулировка «говори как пещерный человек» нечёткая, и модели интерпретируют её по-разному. На практике мнимая экономия легко оборачивается лишними расходами: модель срезает важные пояснения — и пользователь задаёт три уточняющих вопроса вместо одного. Телеграфный стиль усложняет восприятие кода с комментариями. Для задач с документированием избыточное сжатие даёт нечитаемый результат. Отдельный вопрос — что считать «потерей качества». Если задача выполнена технически верно, но объяснение настолько сжато, что разработчик не понимает логику, — это экономия или деградация? Авторы скилла, судя по всему, подразумевают только токены, а не когнитивные усилия на расшифровку ответа. Реальная выгода зависит от типа задач. Для коротких вопросов и небольших фрагментов кода скилл работает хорошо. Для сложного рефакторинга или объяснения архитектурных решений — может навредить больше, чем сэкономить.
Что это значит
Вирусность Caveman — симптом более широкой тенденции: ИИ-инструменты дорожают, лимиты ужесточаются, и сообщество ищет системные способы остаться в рамках бюджета. Реальный тест покажет, стоит ли «пещерный» стиль своих 75 000 звёзд на практике — или это красивые цифры в README.
Besoin d'une IA qui travaille dans votre entreprise — pas seulement dans votre fil d'actualité?
Je construis de l'IA en production pour les entreprises — CRM sur mesure, outils internes, agents autonomes, automatisation des processus. Vous en êtes propriétaire, adaptée à votre processus, sans coût par utilisateur. Réalisé par Zhemal Khamidun, CPO d'AlpinaGPT (plateforme IA, 6 000+ utilisateurs).
L'essentiel de l'IA — une fois par semaine
Sept actus qui ont vraiment compté, choisies à la main. Sans bruit ni communiqués.
C'est fait ! Vérifiez votre boîte mail pour la confirmation.