O roubo de chamadas de IA se tornou um grande negócio: como Vercel o está parando
Hackers roubam chamadas de IA pagas, as envolvem em uma API compatível com OpenAI e as revendem através de proxies. Os limites de taxa convencionais não ajudam.
Processado por IA de Vercel Blog; editado por Hamidun News
Hackers encontraram uma nova maneira de monetizar chamadas de IA alheias. Eles roubam suas solicitações pagas para Claude, GPT ou Gemini, as envolvem em uma API compatível e as revendem através de redes proxy — com custos zero para a própria inferência.
A economia do roubo
Uma chamada de prompt para um modelo de ponta pode custar $2, enquanto uma requisição HTTP no Vercel custa $2 por milhão. A inferência de IA é um milhão de vezes mais cara, o que a torna um dos bens mais lucrativos para roubo.
O atacante paga zero e depois revende os tokens com desconto de 10–20% do preço original — ainda assim um lucro enorme com custos zero.
Cenário típico: o atacante cria um adaptador compatível com OpenAI que envolve seu endpoint de IA. Em seguida, ele distribui requisições através de centenas de IPs de proxy residencial e disponibiliza o SDK pronto ou vende uma assinatura.
- Exemplos existem: Chipotlai Max envolve o chatbot do Chipotle
- Pede abertamente ajuda para portar para Home Depot, Lowe's, Target
- O adaptador é uma boundary de sessão para usuários downstream do atacante
Por que os limites de taxa não salvam
Defesas como limites de taxa e muros de autenticação foram projetadas para ataques com uma economia fundamentalmente diferente — quando o custo de contorno era maior que o lucro. Aqui o lucro é colossal: os atacantes compram proxies residenciais aos milhares e criam contas falsas em quantidade necessária.
O limite de taxa se dilui entre centenas de IPs.
Bug clássico: você verifica o usuário uma vez por sessão e depois envia todas as requisições para IA. O atacante intercepta a sessão e passa milhares de chamadas roubadas através dela.
Quando a requisição chega à sua API, ela já cruzou o limite de sua defesa. A verificação deve funcionar em cada chamada, não por sessão.
O ataque real à Vercel
Em 29 de abril de 2026, o tráfego no chat de IA da documentação Vercel disparou 10 vezes — 1.300 requisições por minuto para o modelo Claude Haiku 4.5. Pelos preços atuais, isso teria custado $10 mil+ por dia.
A empresa detectou o roubo em massa através do monitoramento de padrões e parou o ataque graças a uma análise profunda de BotID em nível de cada requisição.
«Se você tem um endpoint de IA na internet, o risco de abuso é enorme e pode facilmente levar a contas de dezenas de milhares de dólares», disse
Vercel.
O que isso significa
O roubo de inferência agora é uma ameaça real para qualquer empresa que expôs um endpoint de IA na internet. Limites de taxa e autenticação básica são insuficientes. É necessária uma verificação com análise profunda de cada requisição, não por sessão. Para startups e SaaS, isso significa que mudar para verificação por requisição precisa ser feito agora, não depois.
Quer parar de ler sobre IA e começar a usar?
AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.