O roubo de chamadas de IA se tornou um grande negócio: como Vercel o está parando

Q: Qual é a fonte?

Publicado originalmente em Vercel Blog. O Hamidun News processa e adapta os materiais com IA.

Q: Quando foi publicado?

2026-05-31. Tempo de leitura: 3 min.

Hackers roubam chamadas de IA pagas, as envolvem em uma API compatível com OpenAI e as revendem através de proxies. Os limites de taxa convencionais não ajudam.

Redação da Hamidun News

Monitoramento de AI · Vercel Blog

2026-05-31· 3 min

Processado por IA de Vercel Blog; editado por Hamidun News

O roubo de chamadas de IA se tornou um grande negócio: como Vercel o está parando — Fonte: Vercel Blog. Colagem: Hamidun News.

◐ Ouvir artigo

Hackers encontraram uma nova maneira de monetizar chamadas de IA alheias. Eles roubam suas solicitações pagas para Claude, GPT ou Gemini, as envolvem em uma API compatível e as revendem através de redes proxy — com custos zero para a própria inferência.

A economia do roubo

Uma chamada de prompt para um modelo de ponta pode custar $2, enquanto uma requisição HTTP no Vercel custa $2 por milhão. A inferência de IA é um milhão de vezes mais cara, o que a torna um dos bens mais lucrativos para roubo.

O atacante paga zero e depois revende os tokens com desconto de 10–20% do preço original — ainda assim um lucro enorme com custos zero.

Cenário típico: o atacante cria um adaptador compatível com OpenAI que envolve seu endpoint de IA. Em seguida, ele distribui requisições através de centenas de IPs de proxy residencial e disponibiliza o SDK pronto ou vende uma assinatura.

Exemplos existem: Chipotlai Max envolve o chatbot do Chipotle
Pede abertamente ajuda para portar para Home Depot, Lowe's, Target
O adaptador é uma boundary de sessão para usuários downstream do atacante

Por que os limites de taxa não salvam

Defesas como limites de taxa e muros de autenticação foram projetadas para ataques com uma economia fundamentalmente diferente — quando o custo de contorno era maior que o lucro. Aqui o lucro é colossal: os atacantes compram proxies residenciais aos milhares e criam contas falsas em quantidade necessária.

O limite de taxa se dilui entre centenas de IPs.

Bug clássico: você verifica o usuário uma vez por sessão e depois envia todas as requisições para IA. O atacante intercepta a sessão e passa milhares de chamadas roubadas através dela.

Quando a requisição chega à sua API, ela já cruzou o limite de sua defesa. A verificação deve funcionar em cada chamada, não por sessão.

O ataque real à Vercel

Em 29 de abril de 2026, o tráfego no chat de IA da documentação Vercel disparou 10 vezes — 1.300 requisições por minuto para o modelo Claude Haiku 4.5. Pelos preços atuais, isso teria custado $10 mil+ por dia.

A empresa detectou o roubo em massa através do monitoramento de padrões e parou o ataque graças a uma análise profunda de BotID em nível de cada requisição.

«Se você tem um endpoint de IA na internet, o risco de abuso é enorme e pode facilmente levar a contas de dezenas de milhares de dólares», disse

Vercel.

O que isso significa

O roubo de inferência agora é uma ameaça real para qualquer empresa que expôs um endpoint de IA na internet. Limites de taxa e autenticação básica são insuficientes. É necessária uma verificação com análise profunda de cada requisição, não por sessão. Para startups e SaaS, isso significa que mudar para verificação por requisição precisa ser feito agora, não depois.

Hamidun News

Notícias de AI sem ruído. Seleção editorial diária de mais de 400 fontes. Produto de Zhemal Khamidun, Head of AI na Alpina Digital.

Canal do Telegram RSS hamidun.com

Quer parar de ler sobre IA e começar a usar?

AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.

🎓 Academy — 7 dias grátis Consultoria grátis