Vercel раскрыла топ AI моделей в production: Anthropic опережает по расходам
Vercel собрала данные о реальном использовании AI моделей в production. Anthropic тратят больше денег (61% расходов), Google обрабатывает больше токенов (38%),

Vercel проанализировала семь месяцев трафика своего AI Gateway — он обрабатывает триллионы токенов через сотни моделей в реальных приложениях и агентах. Результаты показывают, как на самом деле выглядит production-рынок AI, в отличие от синтетических бенчмарков, которые меняются еженедельно.
Кто тратит больше, кто обрабатывает больше
По расходам в апреле 2026 лидирует Anthropic: 61% всех трат на Claude. Это несмотря на более высокую цену за токен — разработчики платят больше, потому что результат ценнее. Google занимает 21%, OpenAI — 12%, остальное распределяется между xAI и открытыми моделями.
По объёму обработанных токенов картина противоположная. Google здесь первый: 38% всего трафика идёт через Gemini (прежде всего Flash — быструю и дешёвую версию). Anthropic обрабатывает 26%, OpenAI — 13%, xAI и остальные — 23%.
Такой разброс кажется странным, но логика простая. Разные модели конкурируют на разных слоях: Claude Opus идёт на сложные, дорогостоящие задачи — когда ошибка стоит денег Gemini Flash жрёт объёмы — на задачи, где скорость важнее точности * GPT-5.5 равномерно распределён между обоими слоями Это как два разных рынка в одном рынке.
Когда разработчик выбирает модель, он не думает о репутации — он думает о соотношении цены и риска.
Цена ошибки определяет выбор модели
За этой закономерностью стоит простой принцип: модель дорога, если ошибка дорога. Персональные ассистенты — 20% затрат на 40% токенов. Они могут работать на дешёвых моделях, потому что если ассистент ошибётся, пользователь быстро это заметит и исправит.
Ошибка локальна. Coding agents — 22% затрат на 20% токенов. Ошибка в коде стоит времени разработчика и отладки.
Дороже, чем ошибка в чате, но не критична. Back-office системы — 6% затрат на 15% токенов. Здесь экономят, потому что объёмы огромные, но всё равно выбирают не самое дешёвое.
Ошибка может затронуть финансы или операции. App generation — 7% затрат на 11% токенов. Генерированный код проходит код-ревью перед использованием, так что есть подстраховка.
Есть и более крупная закономерность: B2B приложения тратят на токены примерно в два раза больше, чем B2C. В B2B ошибка может привести к финансовым потерям, судебным разбирательствам или простоям. B2C ошибка обходится дешевле.
Кто выигрывает в каких задачах
Если нарезать данные по типам работ, видна фрагментированная картина рынка. Anthropic заметно впереди в software development — разработчики выбирают Claude для сложного кодирования и анализа кода. Это отражает репутацию модели в ML и систем-дизайне.
Google доминирует в потребительских приложениях — Gemini Flash захватил массовый слой благодаря низкой цене и приемлемому качеству. Это стратегия: дешево, достаточно хорошо, много. OpenAI самый равномерно распределённый по всем категориям — это значит, что GPT-5.
5 используют везде, от мобильных приложений до корпоративных систем. xAI и открытые модели собирают кейсы в специальных нишах — например, компании, которые хотят работать без облака или нужна полная кастомизация под себя. За полгода эта картина быстро меняется.
Выход новой версии GPT в апреле заметно увеличил долю OpenAI в расходах. Gemini Flash в марте был намного скромнее, но быстро завоевал объёмы. Это показывает, что рынок чутко реагирует на качество и цену, а не на инерцию.
Что это значит Рынок AI в 2026 — это не поиск одного лучшего выбора.
Разработчики выбирают моделей по задачам, не по престижу. Дорогие модели идут на high-stakes сценарии (когда ошибка дорога), дешёвые — на low-stakes (когда важна скорость и объём). Новые версии быстро набирают долю, если решают реальные проблемы лучше и дешевле конкурентов. И все модели одновременно выигрывают в своём сегменте.