El robo de llamadas de IA se convirtió en un negocio a gran escala: cómo Vercel lo detiene

Q: ¿Cuál es la fuente?

Publicado originalmente en Vercel Blog. Hamidun News procesa y adapta los materiales con IA.

Q: ¿Cuándo se publicó?

31 may 2026. Tiempo de lectura: 3 min.

Los hackers roban llamadas de IA de pago, las envuelven en una API compatible con OpenAI y las revenden a través de proxies. Los límites de velocidad…

Redacción de Hamidun News

Monitoreo de AI · Vercel Blog

31 may 2026· 3 min

Procesado por IA desde Vercel Blog; editado por Hamidun News

El robo de llamadas de IA se convirtió en un negocio a gran escala: cómo Vercel lo detiene — Fuente: Vercel Blog. Collage: Hamidun News.

◐ Escuchar artículo

Los hackers encontraron una nueva forma de monetizar las llamadas de IA ajenas. Roban tus solicitudes de pago a Claude, GPT o Gemini, las envuelven en una API compatible y las revenden a través de redes proxy — sin costo alguno para la inferencia misma.

Economía del robo

Una llamada de prompt a un modelo frontier puede costar $2, mientras que una solicitud HTTP en Vercel cuesta $2 por millón. La inferencia de IA es un millón de veces más cara, lo que la convierte en uno de los bienes más rentables para robar. El atacante paga cero, luego revende los tokens con un descuento del 10-20% del precio original — sigue siendo una ganancia enorme con cero costos.

Un escenario típico: el atacante crea un adaptador compatible con OpenAI que envuelve tu endpoint de IA. Luego distribuye solicitudes a través de cientos de IPs proxy residenciales y pone el SDK listo en acceso público o vende suscripciones.

Hay ejemplos: Chipotlai Max envuelve el chatbot de Chipotle
Pide abiertamente ayuda para portarlo a Home Depot, Lowe's, Target
El adaptador es un límite de sesión para los usuarios posteriores del atacante

Por qué los límites de velocidad no salvan

Las defensas como límites de velocidad y muros de autenticación fueron diseñadas para ataques con una economía radicalmente diferente — cuando el costo de evasión era superior a la ganancia. Aquí la ganancia es colosal: los atacantes compran proxies residenciales por miles y crean cuentas falsas en la cantidad necesaria. El límite de velocidad se diluye entre cientos de IPs.

Un error clásico: verificas el usuario una sola vez por sesión, luego envías todas las solicitudes a la IA. El atacante intercepta la sesión y pasa miles de llamadas robadas a través de ella. Para cuando la solicitud llega a tu API, ya ha cruzado el límite de tu defensa. La verificación debe funcionar para cada llamada, no por sesión.

Ataque real a Vercel

El 29 de abril de 2026, el tráfico al chat de IA de documentación de Vercel se multiplicó por 10 — 1.300 solicitudes por minuto al modelo Claude Haiku 4.5. A los precios actuales, esto habría costado $10k+ por día. La empresa detectó el robo masivo a través del monitoreo de patrones y detuvo los ataques gracias al análisis profundo de BotID a nivel de cada solicitud.

«Si tienes un endpoint de IA en internet, el riesgo de abuso es enorme y fácilmente puede llevar a facturas de decenas de miles de dólares», dice

Vercel.

Qué significa esto

El robo de inferencia es ahora una amenaza real para cualquier empresa que haya expuesto un endpoint de IA en internet. Los límites de velocidad y la autenticación básica son insuficientes. Se necesita verificación con análisis profundo de cada solicitud, no por sesión. Para startups y SaaS, esto significa que el cambio a verificación por solicitud debe hacerse ahora, no después.

Hamidun News

Noticias de AI sin ruido. Selección editorial diaria de más de 400 fuentes. Producto de Zhemal Khamidun, Head of AI en Alpina Digital.

Canal de Telegram RSS hamidun.com

¿Quieres dejar de leer sobre IA y empezar a usarla?

AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.

🎓 Academy — 7 días gratis Consulta gratuita