Кража AI-вызовов стала масштабным бизнесом: как его останавливает Vercel
Хакеры крадут платные AI-вызовы, оборачивают в OpenAI-совместимый API и перепродают через прокси. Обычные rate limits не помогают. Vercel столкнулась с атаком н

Хакеры нашли новый способ монетизировать чужие AI-вызовы. Они крадут твои платные запросы к Claude, GPT или Gemini, оборачивают их в совместимый API и перепродают через прокси-сети — при нулевых затратах на саму инференцию.
Экономика кражи
Одна промт-вызов к фронтир-модели может стоить $2, а HTTP запрос на Vercel — $2 за миллион. AI инференция дороже в миллион раз, что делает её одним из самых прибыльных благ для воровства. Attacker платит ноль, потом перепродаёт токены со скидкой 10–20% от оригинальной цены — всё ещё огромный профит на нулевых издержках. Типичный сценарий: attacker создаёт OpenAI-compatible адаптер, который оборачивает твой AI-эндпоинт. Далее он fanout запросы через сотни residential proxy IP и бросает готовый SDK в открытый доступ или продаёт подписку.
- Примеры есть: Chipotlai Max оборачивает Chipotle чатбот Открыто просит помощь в портировании на Home Depot, Lowe's, Target Adapter — это session boundary для downstream пользователей attacker'а ## Почему rate limits не спасают Защиты типа rate limits и auth walls были спроектированы для атак с кардинально другой экономикой — когда стоимость обхода была выше профита. Тут профит колоссальный: attackers покупают жилые прокси тысячами и создают фейковые аккаунты в нужном количестве. Rate limit dilute across сотни IP. Классический баг: ты проверяешь юзера один раз на сессию, потом отправляешь все запросы в AI. Attacker перехватывает сессию и валит сквозь неё тысячи украденных вызовов. К тому моменту, как запрос попадёт на твой API, он уже пересёк границу твоей защиты. Проверка должна работать на каждый вызов, не на сессию.
Реальный атак на
Vercel 29 апреля 2026 трафик на AI чат документации Vercel взлетел в 10 раз — 1300 запросов в минуту на модель Claude Haiku 4.5. При текущих ценах это бы обошлось в $10k+ в день. Компания выявила массовое воровство через мониторинг паттернов и остановила атак благодаря глубокому анализу BotID на уровне каждого запроса.
«Если у тебя есть AI-эндпоинт в интернете, риск abuse огромный и может легко привести к счётам в десятки тысяч долларов», — говорит
Vercel.
Что это значит
Inference theft теперь настоящая угроза для любой компании, которая выставила AI-эндпоинт в интернет. Rate limits и basic auth недостаточны. Нужна проверка на глубокий анализ каждого запроса, не сессии. Для стартапов и SaaS это значит, что переходить на per-request verification нужно не потом, а сейчас.
Хотите не читать про ИИ, а внедрить его?
«AI News» — это полезные новости из мира ИИ. Системно научиться работать с нейросетями и применять их в работе — в Hamidun Academy.