Cet article n'est pas encore traduit en français — l'original russe est affiché.
Habr AI→ original

Le skill Caveman, avec 75 000 étoiles, promet de réduire de 75 % la consommation de tokens dans Copilot

Copilot a changé sa tarification, et les développeurs ont commencé à se heurter aux limites dès la première semaine de travail. Dans les chats d'équipe, le…

Traité par IA depuis Habr AI ; édité par Hamidun News
Le skill Caveman, avec 75 000 étoiles, promet de réduire de 75 % la consommation de tokens dans Copilot
Source : Habr AI. Collage: Hamidun News.
◐ Écouter l'article

После смены тарификации в Copilot разработчики начали упираться в месячные лимиты токенов уже за первую рабочую неделю. В рабочих чатах все ищут способ сэкономить, и среди предложений настойчиво мелькает один скилл — Caveman. README репозитория обещает до 75% экономии без потери качества. Разбираем, как он устроен и работает ли это в реальности.

Что такое

Caveman Идея обезоруживающе проста: специальная инструкция для системного промпта велит языковой модели общаться в стиле пещерного человека — без артиклей, без вводных конструкций, предельно короткими предложениями. Принцип «говорить лаконично» снижает объём исходящих токенов на каждый ответ, а суммарный расход за день падает значительно. Авторы утверждают, что экономия может достигать 75% — и при этом без деградации качества. Репозиторий набрал более 75 000 звёзд на GitHub, что для инструмента с такой концептуально простой механикой выглядит впечатляюще. Именно вирусность скилла и породила волну обсуждений в командных чатах после смены ценовой политики Copilot.

Почему токенные лимиты стали проблемой

Copilot перешёл на новую тарификацию, и это ударило прежде всего по командам, которые используют ИИ-ассистентов активно — десятки и сотни запросов в день. Разработчики упираются в потолок быстрее, чем ожидали, а доплачивать за расширение пакетов готовы далеко не все. Стандартные способы экономии известны давно: Писать краткие и точные промпты Не передавать лишний контекст в каждый запрос Убирать повторяющиеся инструкции из диалога Ограничивать размер окна контекста * Не просить модель «думать вслух», если это не нужно Всё это работает, но требует осознанных усилий от каждого участника команды при каждом запросе. Caveman предлагает системное решение: один раз добавил инструкцию в системный промпт — и модель сама переходит в экономный режим без дополнительного контроля.

Как скилл технически экономит токены

По своей сути Caveman — набор инструкций, заставляющих модель максимально сжимать ответы. Ключевая механика: сокращение output-токенов, которые у большинства провайдеров стоят дороже input-токенов. Каждый лишний абзац, вводная фраза или повтор — это реальные деньги при интенсивной работе. Если модель переходит на телеграфный стиль при каждом запросе, суммарная экономия за сотни взаимодействий в день действительно может быть существенной. Цифра в 75% теоретически достижима при агрессивном сжатии — особенно если задачи не требуют развёрнутых объяснений или длинной документации.

«75 000 звёзд на репозитории не могут ошибаться?» — с этим вопросом

автор приступает к практическому тестированию.

Где скилл может подвести Скептицизм здесь оправдан.

Формулировка «говори как пещерный человек» нечёткая, и модели интерпретируют её по-разному. На практике мнимая экономия легко оборачивается лишними расходами: модель срезает важные пояснения — и пользователь задаёт три уточняющих вопроса вместо одного. Телеграфный стиль усложняет восприятие кода с комментариями. Для задач с документированием избыточное сжатие даёт нечитаемый результат. Отдельный вопрос — что считать «потерей качества». Если задача выполнена технически верно, но объяснение настолько сжато, что разработчик не понимает логику, — это экономия или деградация? Авторы скилла, судя по всему, подразумевают только токены, а не когнитивные усилия на расшифровку ответа. Реальная выгода зависит от типа задач. Для коротких вопросов и небольших фрагментов кода скилл работает хорошо. Для сложного рефакторинга или объяснения архитектурных решений — может навредить больше, чем сэкономить.

Что это значит

Вирусность Caveman — симптом более широкой тенденции: ИИ-инструменты дорожают, лимиты ужесточаются, и сообщество ищет системные способы остаться в рамках бюджета. Реальный тест покажет, стоит ли «пещерный» стиль своих 75 000 звёзд на практике — или это красивые цифры в README.

ZK
Hamidun News
Actualités IA sans bruit. Sélection éditoriale quotidienne de plus de 400 sources. Produit de Zhemal Khamidun, Head of AI chez Alpina Digital.

Besoin d'une IA qui travaille dans votre entreprise — pas seulement dans votre fil d'actualité?

Je construis de l'IA en production pour les entreprises — CRM sur mesure, outils internes, agents autonomes, automatisation des processus. Vous en êtes propriétaire, adaptée à votre processus, sans coût par utilisateur. Réalisé par Zhemal Khamidun, CPO d'AlpinaGPT (plateforme IA, 6 000+ utilisateurs).

Qu'en pensez-vous ?
Chargement des commentaires…