Claude и AI-агенты сжигают токены быстрее прогнозов — бизнес учится «токеномике»
Компании, внедрившие AI-агентов для написания кода, столкнулись с «безумным» расходом токенов — в разы превышающим прогнозы. Silicon Valley–разработчик ПО и…
AI-обработка оригинала Wired; редакция Hamidun News
Компании, внедрившие ИИ-агентов для написания кода, столкнулись с неожиданной проблемой: реальные затраты на токены оказались значительно выше прогнозных — и теперь их руководители срочно осваивают новую дисциплину под названием «токеномика».
Что случилось с бюджетами
Wired поговорил с несколькими компаниями о том, как они управляют расходами на AI-агентов в реальных условиях. Один из собеседников — директор Silicon Valley–компании, разрабатывающей программное обеспечение, — описал происходящее словом «безумие»: его команда начала активно использовать Claude от Anthropic для кодинга, и расход токенов взлетел до уровней, которые никто не закладывал в бюджет. Схожая ситуация у e-commerce компании: AI-агенты, работающие в фоновом режиме, генерируют тысячи токенов на задачи, которые кажутся рутинными, — проверку кода, написание тестов, рефакторинг. Если разработчик тратит на такую задачу час, агент «думает» несколько минут, но при этом непрерывно генерирует токены — и счёт за месяц оказывается совсем другим.
Почему агенты сжигают токены так быстро Токен — единица расчёта с провайдерами ИИ.
Каждый запрос к модели и каждый ответ тарифицируется по количеству токенов. Для обычного чата это почти незаметно. Но AI-агенты для кодинга работают принципиально иначе: перед каждым действием они читают весь контекст репозитория в рамках одной задачи многократно обращаются к модели генерируют длинные цепочки внутренних рассуждений перед ответом пишут, тестируют и переписывают код до получения нужного результата В итоге задача, которую разработчик решает за час, может «стоить» десятки тысяч токенов. При высоких тарифах на мощные модели вроде Claude — это сотни долларов за один рабочий день на одного сотрудника.
Как компании перестраивают подход
Руководители начинают вводить понятие «токеномики» — управления потреблением токенов так же, как раньше управляли серверными ресурсами или расходами в облаке. Первые практики уже сформировались: ограничение контекстного окна агентов: агент видит только релевантную часть кодовой базы кеширование повторяющихся промптов, чтобы не пересчитывать токены заново маршрутизация задач: дешёвые модели — для рутины, мощные — для сложных запросов мониторинг и алерты при аномальном расходе * пересмотр ROI от AI-инструментов с учётом реальных, а не прогнозных затрат > «Мы привыкли думать об ИИ как о SaaS-подписке с фиксированной ценой. Теперь понимаем, что это скорее облачные вычисления: цена зависит от того, сколько ты используешь».
Anthropicи другие провайдеры предлагают инструменты для мониторинга расходов, но управление токенами пока остаётся головной болью на стороне клиента.
Что это значит
Ставка бизнеса на AI-кодинг как на способ сократить расходы на разработку может не окупиться, если не учитывать реальную стоимость токенов. Компании, которые первыми освоят «токеномику» — научатся оптимизировать потребление, не жертвуя результатом, — получат ощутимое преимущество перед теми, кто управляет AI-затратами вслепую.
Хотите не читать про ИИ, а внедрить его?
«AI News» — это полезные новости из мира ИИ. Системно научиться работать с нейросетями и применять их в работе — в Hamidun Academy.
Главное из мира ИИ — раз в неделю
7 ключевых событий недели, отобранных вручную. Без шума, репостов и пресс-релизов.
Готово! Проверьте почту — мы отправили подтверждение.