Vercel раскрыла топ AI моделей в production: Anthropic опережает по расходам

Q: Источник материала?

Оригинальная публикация на Vercel Blog. Hamidun News обрабатывает и адаптирует материалы с помощью AI.

Q: Когда опубликовано?

2026-05-21. Время чтения: 3 мин.

Vercel собрала данные о реальном использовании AI моделей в production. Anthropic тратят больше денег (61% расходов), Google обрабатывает больше токенов (38%),

ЖХ

Редакция Hamidun News

AI‑мониторинг · Vercel Blog

2026-05-21· 3 мин

Vercel раскрыла топ AI моделей в production: Anthropic опережает по расходам — Источник: Vercel Blog. Коллаж: Hamidun News.

◐ Слушать статью

Vercel проанализировала семь месяцев трафика своего AI Gateway — он обрабатывает триллионы токенов через сотни моделей в реальных приложениях и агентах. Результаты показывают, как на самом деле выглядит production-рынок AI, в отличие от синтетических бенчмарков, которые меняются еженедельно.

Кто тратит больше, кто обрабатывает больше

По расходам в апреле 2026 лидирует Anthropic: 61% всех трат на Claude. Это несмотря на более высокую цену за токен — разработчики платят больше, потому что результат ценнее. Google занимает 21%, OpenAI — 12%, остальное распределяется между xAI и открытыми моделями.

По объёму обработанных токенов картина противоположная. Google здесь первый: 38% всего трафика идёт через Gemini (прежде всего Flash — быструю и дешёвую версию). Anthropic обрабатывает 26%, OpenAI — 13%, xAI и остальные — 23%.

Такой разброс кажется странным, но логика простая. Разные модели конкурируют на разных слоях: Claude Opus идёт на сложные, дорогостоящие задачи — когда ошибка стоит денег Gemini Flash жрёт объёмы — на задачи, где скорость важнее точности * GPT-5.5 равномерно распределён между обоими слоями Это как два разных рынка в одном рынке.

Когда разработчик выбирает модель, он не думает о репутации — он думает о соотношении цены и риска.

Цена ошибки определяет выбор модели

За этой закономерностью стоит простой принцип: модель дорога, если ошибка дорога. Персональные ассистенты — 20% затрат на 40% токенов. Они могут работать на дешёвых моделях, потому что если ассистент ошибётся, пользователь быстро это заметит и исправит.

Ошибка локальна. Coding agents — 22% затрат на 20% токенов. Ошибка в коде стоит времени разработчика и отладки.

Дороже, чем ошибка в чате, но не критична. Back-office системы — 6% затрат на 15% токенов. Здесь экономят, потому что объёмы огромные, но всё равно выбирают не самое дешёвое.

Ошибка может затронуть финансы или операции. App generation — 7% затрат на 11% токенов. Генерированный код проходит код-ревью перед использованием, так что есть подстраховка.

Есть и более крупная закономерность: B2B приложения тратят на токены примерно в два раза больше, чем B2C. В B2B ошибка может привести к финансовым потерям, судебным разбирательствам или простоям. B2C ошибка обходится дешевле.

Кто выигрывает в каких задачах

Если нарезать данные по типам работ, видна фрагментированная картина рынка. Anthropic заметно впереди в software development — разработчики выбирают Claude для сложного кодирования и анализа кода. Это отражает репутацию модели в ML и систем-дизайне.

Google доминирует в потребительских приложениях — Gemini Flash захватил массовый слой благодаря низкой цене и приемлемому качеству. Это стратегия: дешево, достаточно хорошо, много. OpenAI самый равномерно распределённый по всем категориям — это значит, что GPT-5.

5 используют везде, от мобильных приложений до корпоративных систем. xAI и открытые модели собирают кейсы в специальных нишах — например, компании, которые хотят работать без облака или нужна полная кастомизация под себя. За полгода эта картина быстро меняется.

Выход новой версии GPT в апреле заметно увеличил долю OpenAI в расходах. Gemini Flash в марте был намного скромнее, но быстро завоевал объёмы. Это показывает, что рынок чутко реагирует на качество и цену, а не на инерцию.

Что это значит Рынок AI в 2026 — это не поиск одного лучшего выбора.

Разработчики выбирают моделей по задачам, не по престижу. Дорогие модели идут на high-stakes сценарии (когда ошибка дорога), дешёвые — на low-stakes (когда важна скорость и объём). Новые версии быстро набирают долю, если решают реальные проблемы лучше и дешевле конкурентов. И все модели одновременно выигрывают в своём сегменте.

ЖХ

Hamidun News

AI‑новости без шума. Ежедневный редакторский отбор из 400+ источников. Продукт Жемала Хамидуна, Head of AI в Alpina Digital.

Telegram-канал RSS hamidun.com