Anthropic и Claude Opus 4.7: реальный расход токенов оказался выше заявленного

Q: Источник материала?

Оригинальная публикация на Habr AI. Hamidun News обрабатывает и адаптирует материалы с помощью AI.

Q: Когда опубликовано?

2026-04-27. Время чтения: 3 мин.

У Claude Opus 4.7 обнаружили куда более прожорливый токенайзер, чем обещала Anthropic. В двух практических замерах рост составил 1.47x на техдокументации и 1.45

ЖХ

Редакция Hamidun News

AI‑мониторинг · Habr AI

2026-04-27· 2 мин

Anthropic и Claude Opus 4.7: реальный расход токенов оказался выше заявленного — Источник: Habr AI. Коллаж: Hamidun News.

Новый токенайзер Claude Opus 4.7 может заметно удорожить работу с моделью: в реальных тестах расход оказался ближе к 45–47%, а не к 0–35%, о которых пишет Anthropic в гайде по миграции. Для команд, которые работают с длинными промптами, большими системными инструкциями и кешируемыми префиксами, это не косметическое отличие, а прямой удар по квотам, скорости и стоимости каждой сессии.

Поводом для разбора стало расхождение между обещанием и практикой. В документации Anthropic сказано, что новый токенайзер использует примерно в 1.0–1.

35 раза больше токенов по сравнению с версией для Opus 4.6. Автор решил проверить это не на абстрактных примерах, а на материалах, которые действительно похожи на рабочую нагрузку разработчиков.

В первом замере он прогнал через токенайзер техническую документацию и получил рост до 1.47x. Во втором взял реальный файл CLAUDE.

md, то есть большой инструктивный контекст, и увидел почти тот же результат — 1.45x. Разница с верхней границей из гайда слишком велика, чтобы считать её обычным шумом измерений.

Проблема не в самом факте роста токенов: иногда более тяжёлый токенайзер действительно даёт выигрыш в качестве, стабильности или поддержке сложных текстов. Вопрос в том, что у Anthropic при этом не меняются цены и квоты. Если один и тот же текст теперь занимает больше токенов, то пользователь быстрее упирается в лимиты контекста, раньше ловит rate limit и тратит больше бюджета на каждую итерацию.

Особенно болезненно это для сценариев, где есть длинный системный промпт, набор правил, примеры ответов, куски документации и кешируемый префикс, который отправляется снова и снова. На бумаге тариф тот же, а полезной ёмкости у него фактически меньше. Именно поэтому автор пошёл дальше простого подсчёта и попытался понять, что именно модель получает взамен.

Судя по описанию эксперимента, проверялись заявленные преимущества нового токенайзера и его поведение на практических задачах. Ключевой вывод в том, что чудесной компенсации не произошло: по крайней мере в протестированных сценариях рост расхода оказался очень заметным, а выигрыш не выглядел настолько же очевидным и системным. Иначе говоря, если смотреть глазами человека, который платит за токены или живёт в рамках подписочных квот, обмен выглядит не в пользу пользователя.

Это не обязательно означает, что Opus 4.7 хуже как модель, но означает, что её экономика стала менее комфортной. Для рынка это важный сигнал.

Токенайзер редко обсуждают вне узкого круга инженеров, хотя именно он определяет, сколько реального текста помещается в окно контекста и сколько стоит каждая операция поверх API. Разница в 5–10% часто терпима и может потеряться на фоне обычной вариативности запросов. Но скачок примерно на 45% — уже не техническая мелочь, а фактор, который влияет на архитектуру агентов, длину системных инструкций, стратегию кеширования и даже на юнит-экономику продукта.

Если у команды есть пайплайн, где один и тот же большой префикс участвует в сотнях вызовов, лишние токены начинают съедать деньги и пропускную способность очень быстро. Практический вывод простой: переход на Claude Opus 4.7 нужно оценивать не по маркетинговой формулировке из migration guide, а по своим реальным корпусам текста.

Стоит отдельно прогнать системные промпты, файлы с инструкциями, документацию, шаблоны агентных задач и всё, что часто попадает в контекст. Если замеры покажут рост, близкий к 1.45x, то команде, возможно, придётся ужимать промпты, выносить часть логики из контекста, пересматривать кеширование или даже откладывать миграцию до более понятной выгоды.

Главный урок здесь в том, что качество модели нельзя оценивать только по демо и бенчмаркам: иногда решающим оказывается не интеллект ответа, а цена каждого лишнего токена.

ЖХ

Hamidun News

AI‑новости без шума. Ежедневный редакторский отбор из 400+ источников. Продукт Жемала Хамидуна, Head of AI в Alpina Digital.

Telegram-канал RSS hamidun.com