Kled AI y otros servicios compran los datos personales de la gente para entrenar modelos
Ha surgido un nuevo mercado paralelo de datos para AI: la gente graba pasos en la calle, ruido urbano, voz e incluso llamadas privadas para ganar dólares…
Procesado por IA desde Guardian; editado por Hamidun News
En torno al entrenamiento de IA, un nuevo mercado está creciendo rápidamente: personas ordinarias están vendiendo a empresas fragmentos de su vida cotidiana — voz, videos de calles, conversaciones y llamadas telefónicas. Para algunos, es una forma de comprar alimentos o pagar facturas; para las plataformas, es una fuente de datos que es cada vez más escasa para nuevos modelos.
Cómo se ve
Los participantes en tales plataformas realizan tareas simples de la vida real. Jacobus Lowe, un joven de 27 años de Ciudad del Cabo, grabó un paseo por su barrio y ganó $14 — aproximadamente la mitad del presupuesto semanal de alimentos. En Ranchi, India, el estudiante Sahil Tigga gana más de $100 al mes grabando ruido callejero y su propia voz para Silencio. Y en Chicago, Ramelio Hill, de 18 años, vendió aproximadamente 11 horas de conversaciones personales a Neon Mobile y recibió aproximadamente $200.
- Videos de paseos y navegación por la ciudad
- Ruido de fondo de calles, cafés y transporte
- Grabaciones de voz y diálogos multilingües
- Llamadas personales y mensajes de texto
- Rostro y voz para clones de IA
Para muchos, esto no es una ganancia exótica, sino una respuesta directa a la escasez de dinero. En países con monedas débiles y alto desempleo, los pagos en dólares pueden ser más rentables que el trabajo local. El propio Lowe dijo abiertamente que los pagos en USD se sienten completamente diferentes a como parecen desde fuera. Los ingresos son inestables y no cubren todos los gastos, pero brindan la oportunidad de pagar por alimentos, educación o servicios públicos sin largas búsquedas de empleo formal.
Por qué la IA paga
Las empresas de IA se están quedando sin datos abiertos de calidad en los que puedan entrenar de forma segura sus modelos. Los grandes conjuntos de textos cada vez más restringen el uso para IA generativa, y los datos sintéticos no siempre ayudan: si un modelo aprende de sus propias respuestas, la calidad puede degradarse. Por eso, plataformas como Kled AI, Silencio, Luel AI y ElevenLabs compran lo que todavía es difícil de reemplazar — contexto humano: habla en vivo, sonidos únicos, comportamiento urbano, expresiones faciales e inflexión.
"Los datos humanos siguen siendo el estándar de oro por ahora".
Los economistas creen que este formato de empleo crecerá. Las empresas pagan a las personas no solo porque necesitan material realista, sino también porque es legalmente más limpio que discutir sin fin sobre web scraping y derechos de autor. Para los ejecutores, es un intercambio pragmático de privacidad por dinero rápido. Para las plataformas, es una forma de cerrar el déficit de datos en el que se construyen productos futuros, desde asistentes de voz hasta navegación, reconocimiento facial y bots conversacionales.
El precio del dinero rápido
El principal problema es que muchos acuerdos dan a las plataformas derechos casi máximos sobre los materiales cargados: uso perpetuo o difícil de revocar, transferencia a socios, creación de obras derivadas y ausencia de nuevos pagos, incluso si los datos generan ganancias durante años. En otras palabras, 20 minutos de grabación de voz hoy pueden convertirse más tarde en la voz de un operador de IA, y la persona no verá otro centavo ni podrá revocar efectivamente su consentimiento.
Los riesgos ya no son teóricos. Neon Mobile fue desactivado después del lanzamiento debido a una vulnerabilidad que daba acceso a números de teléfono, grabaciones de llamadas y transcripciones de usuarios. Otro ejemplo es un actor de Nueva York que vendió su rostro y voz a un servicio de video de IA por $1.000, luego vio videos con su propio clon digital generando millones de visualizaciones y publicitando suplementos médicos dudosos. Explicar a los conocidos que no era él en el video resultó ser un problema aparte.
El fundador de Kled AI afirma que su empresa restringe el uso de datos a tareas de entrenamiento e investigación y verifica a los compradores para evitar trabajar con la industria pornográfica y estructuras con objetivos cuestionables. Pero los abogados e investigadores de privacidad advierten: los usuarios casi nunca entienden exactamente dónde terminarán su rostro, voz o patrones de comportamiento. Incluso si se eliminan el nombre y la geolocalización, los datos biométricos son inherentemente difíciles de anonimizar verdaderamente.
Lo que esto significa
El mercado de datos para el entrenamiento de IA convierte la personalidad en materia prima: no solo textos e imágenes, sino voz, hábitos, rutas, conversaciones. Para los usuarios, es dinero rápido aquí y ahora; para las plataformas, es un activo a largo plazo que puede reutilizarse durante años. Cuanto más fuerte sea el déficit de datos de calidad, más a menudo las empresas de IA comprarán no contenido, sino a las personas mismas como fuente de ese contenido.
¿Quieres dejar de leer sobre IA y empezar a usarla?
AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.