Кража AI-вызовов стала масштабным бизнесом: как его останавливает Vercel

Q: Источник материала?

Оригинальная публикация на Vercel Blog. Hamidun News обрабатывает и адаптирует материалы с помощью AI.

Q: Когда опубликовано?

2026-05-31. Время чтения: 3 мин.

Хакеры крадут платные AI-вызовы, оборачивают в OpenAI-совместимый API и перепродают через прокси. Обычные rate limits не помогают. Vercel столкнулась с атаком н

ЖХ

Редакция Hamidun News

AI‑мониторинг · Vercel Blog

2026-05-31· 3 мин

Кража AI-вызовов стала масштабным бизнесом: как его останавливает Vercel — Источник: Vercel Blog. Коллаж: Hamidun News.

◐ Слушать статью

Хакеры нашли новый способ монетизировать чужие AI-вызовы. Они крадут твои платные запросы к Claude, GPT или Gemini, оборачивают их в совместимый API и перепродают через прокси-сети — при нулевых затратах на саму инференцию.

Экономика кражи

Одна промт-вызов к фронтир-модели может стоить $2, а HTTP запрос на Vercel — $2 за миллион. AI инференция дороже в миллион раз, что делает её одним из самых прибыльных благ для воровства. Attacker платит ноль, потом перепродаёт токены со скидкой 10–20% от оригинальной цены — всё ещё огромный профит на нулевых издержках. Типичный сценарий: attacker создаёт OpenAI-compatible адаптер, который оборачивает твой AI-эндпоинт. Далее он fanout запросы через сотни residential proxy IP и бросает готовый SDK в открытый доступ или продаёт подписку.

Примеры есть: Chipotlai Max оборачивает Chipotle чатбот Открыто просит помощь в портировании на Home Depot, Lowe's, Target Adapter — это session boundary для downstream пользователей attacker'а ## Почему rate limits не спасают Защиты типа rate limits и auth walls были спроектированы для атак с кардинально другой экономикой — когда стоимость обхода была выше профита. Тут профит колоссальный: attackers покупают жилые прокси тысячами и создают фейковые аккаунты в нужном количестве. Rate limit dilute across сотни IP. Классический баг: ты проверяешь юзера один раз на сессию, потом отправляешь все запросы в AI. Attacker перехватывает сессию и валит сквозь неё тысячи украденных вызовов. К тому моменту, как запрос попадёт на твой API, он уже пересёк границу твоей защиты. Проверка должна работать на каждый вызов, не на сессию.

Реальный атак на

Vercel 29 апреля 2026 трафик на AI чат документации Vercel взлетел в 10 раз — 1300 запросов в минуту на модель Claude Haiku 4.5. При текущих ценах это бы обошлось в $10k+ в день. Компания выявила массовое воровство через мониторинг паттернов и остановила атак благодаря глубокому анализу BotID на уровне каждого запроса.

«Если у тебя есть AI-эндпоинт в интернете, риск abuse огромный и может легко привести к счётам в десятки тысяч долларов», — говорит

Vercel.

Что это значит

Inference theft теперь настоящая угроза для любой компании, которая выставила AI-эндпоинт в интернет. Rate limits и basic auth недостаточны. Нужна проверка на глубокий анализ каждого запроса, не сессии. Для стартапов и SaaS это значит, что переходить на per-request verification нужно не потом, а сейчас.

ЖХ

Hamidun News

AI‑новости без шума. Ежедневный редакторский отбор из 400+ источников. Продукт Жемала Хамидуна, Head of AI в Alpina Digital.

Telegram-канал RSS hamidun.com

Хотите не читать про ИИ, а внедрить его?

«AI News» — это полезные новости из мира ИИ. Системно научиться работать с нейросетями и применять их в работе — в Hamidun Academy.

🎓 Academy — 7 дней бесплатно Бесплатная консультация