Куда утекают токены в Cursor и как с этим бороться
Разработчик с бюджетом $20 в месяц на Cursor провёл детальный аудит расхода токенов и обнаружил, что значительная часть бюджета уходит на неочевидные операции —

Двадцать долларов в месяц — именно столько стоит подписка на Cursor Pro, один из самых популярных AI-ассистентов для программирования. Сумма кажется скромной, почти символической на фоне зарплат разработчиков. Но за этой простотой скрывается сложная механика тарификации, которая способна превратить щедрый лимит в дефицит задолго до конца расчётного периода. Один из пользователей решил разобраться, куда именно утекают токены, и поделился результатами своего расследования на Habr.
Проблема расхода токенов в AI-ассистентах для кода — это не просто бухгалтерский вопрос. Это фундаментальная особенность архитектуры современных языковых моделей, которая напрямую влияет на продуктивность разработчиков. Каждый раз, когда Cursor обращается к модели, он отправляет не только ваш запрос, но и контекст — фрагменты открытых файлов, историю диалога, результаты индексации проекта. Всё это перемалывается в токены, и каждый токен стоит денег. Пользователь, который просто печатает вопросы в чат, может не замечать, что за кулисами ассистент пережёвывает тысячи строк кода при каждом обращении.
Автор материала провёл своеобразный аудит своего использования Cursor и выявил несколько ключевых «пожирателей» бюджета. Первый и самый очевидный — размер контекстного окна. Когда вы работаете с большим проектом и у вас открыто множество файлов, ассистент пытается учесть как можно больше информации, что приводит к раздуванию каждого запроса. Второй фактор — повторные и уточняющие запросы. Неточно сформулированный промпт приводит к неудовлетворительному ответу, за которым следует ещё один запрос, и ещё один — каждый с полным контекстом. Третий момент — автоматическая индексация и фоновые операции, которые пользователь может даже не замечать, но которые методично расходуют токены.
Эта ситуация характерна не только для Cursor. Весь рынок AI-ассистентов для программирования — от GitHub Copilot до Windsurf и Cline — сталкивается с одной и той же дилеммой: чем больше контекста получает модель, тем качественнее её ответы, но тем дороже каждое обращение. Разработчики инструментов балансируют между качеством и стоимостью, и пользователи оказываются заложниками этого компромисса. При фиксированной подписке в $20 лимит запросов может закончиться за первую неделю интенсивной работы, а при модели pay-as-you-go счёт способен неприятно удивить в конце месяца.
Осознав масштаб проблемы, автор не ограничился констатацией фактов и создал собственный фреймворк для оптимизации расхода токенов. Суть подхода — в осознанном управлении контекстом. Вместо того чтобы позволять ассистенту самостоятельно решать, какие файлы включать в запрос, фреймворк помогает структурировать обращения так, чтобы модель получала ровно столько информации, сколько необходимо для конкретной задачи. Это своего рода «диета» для AI-ассистента: меньше лишнего контекста, более точные промпты, минимум повторных обращений.
Подобные инициативы со стороны пользователей сигнализируют о важном сдвиге в восприятии AI-инструментов. Эпоха бездумного использования, когда разработчики просто «разговаривали» с ассистентом как с коллегой, постепенно уступает место более инженерному подходу. Программисты начинают относиться к токенам как к вычислительному ресурсу, который нужно оптимизировать — точно так же, как они оптимизируют память, процессорное время или сетевые запросы в своих приложениях. Появляется даже своеобразная дисциплина «prompt engineering для экономии», где цель — не просто получить хороший ответ, а получить его с минимальными затратами.
Для индустрии это означает, что ценообразование AI-ассистентов остаётся нерешённой проблемой. Фиксированные подписки создают иллюзию предсказуемости, но скрывают реальную стоимость использования. Модели с оплатой за токены честнее, но пугают непредсказуемостью счетов. Вероятно, следующее поколение тарифных планов будет включать более прозрачные метрики расхода и встроенные инструменты оптимизации — именно то, что сейчас энтузиасты вроде автора этого исследования строят вручную.
Двадцать долларов в месяц — это не мало и не много. Это ровно столько, сколько нужно, чтобы задуматься о том, как именно вы тратите каждый токен. И, возможно, именно такая осознанность в конечном счёте сделает из обычных пользователей AI-инструментов по-настоящему эффективных разработчиков.