Kled AI et d'autres services achètent les données personnelles des gens pour entraîner des modèles
Un nouveau marché parallèle des données pour l'AI a émergé : des gens enregistrent leurs pas dans la rue, le bruit de la ville, leur voix et même des appels…
Traité par IA depuis Guardian ; édité par Hamidun News
Autour de la formation de l'IA, un nouveau marché se développe rapidement : des gens ordinaires vendent aux entreprises des fragments de leur vie quotidienne — voix, vidéos de rues, conversations et appels téléphoniques. Pour certains, c'est un moyen d'acheter des aliments ou de payer des factures ; pour les plates-formes, c'est une source de données qui devient de plus en plus rare pour les nouveaux modèles.
Comment cela fonctionne
Les participants à ces plates-formes accomplissent des tâches simples de la vie réelle. Jacobus Lowe, un jeune de 27 ans du Cap, a enregistré une promenade dans son quartier et a gagné 14 $ — environ la moitié du budget alimentaire hebdomadaire. À Ranchi, en Inde, l'étudiant Sahil Tigga gagne plus de 100 $ par mois en enregistrant le bruit des rues et sa propre voix pour Silencio. Et à Chicago, Ramelio Hill, 18 ans, a vendu environ 11 heures de conversations personnelles à Neon Mobile et a reçu environ 200 $.
- Vidéos de promenades et de navigation en ville
- Bruits de fond des rues, cafés et transports
- Enregistrements de voix et dialogues multilingues
- Appels personnels et messages texte
- Visage et voix pour des clones d'IA
Pour beaucoup, ce n'est pas un gain exotique, mais une réponse directe au manque d'argent. Dans les pays avec des devises faibles et un chômage élevé, les paiements en dollars peuvent être plus rentables que le travail local. Lowe lui-même a dit ouvertement que les paiements en USD se ressentent complètement différemment de ce qu'ils semblent de l'extérieur. Le revenu est instable et ne couvre pas tous les frais, mais offre la possibilité de payer la nourriture, l'éducation ou les services publics sans longues recherches d'emploi formel.
Pourquoi l'IA paie
Les entreprises d'IA manquent de données ouvertes de qualité sur lesquelles elles peuvent former en toute sécurité leurs modèles. Les grands ensembles de textes restreignent de plus en plus l'utilisation pour l'IA générative, et les données synthétiques n'aident pas toujours : si un modèle apprend de ses propres réponses, la qualité peut se dégrader. C'est pourquoi des plates-formes comme Kled AI, Silencio, Luel AI et ElevenLabs achètent ce qui est encore difficile à remplacer — contexte humain : parole en direct, sons uniques, comportement urbain, expressions faciales et intonation.
« Les données humaines restent l'étalon-or pour l'instant ».
Les économistes estiment que ce format d'emploi se développera. Les entreprises paient les gens non seulement parce qu'elles ont besoin de matériel réaliste, mais aussi parce que c'est légalement plus propre que de discuter sans fin sur le web scraping et les droits d'auteur. Pour les exécutants, c'est un échange pragmatique de vie privée pour de l'argent rapide. Pour les plates-formes, c'est un moyen de combler le déficit de données sur lequel sont construits les produits futurs, des assistants vocaux à la navigation, la reconnaissance faciale et les bots conversationnels.
Le prix de l'argent rapide
Le principal problème est que de nombreux accords donnent aux plates-formes des droits quasi maximaux sur les matériaux téléchargés : utilisation perpétuelle ou difficile à révoquer, transfert aux partenaires, création d'œuvres dérivées et absence de nouveaux paiements, même si les données générent des bénéfices pendant des années. En d'autres termes, 20 minutes d'enregistrement vocal aujourd'hui peuvent plus tard devenir la voix d'un opérateur IA, et la personne ne verra plus un centime et ne pourra pas révoquer efficacement son consentement.
Les risques ne sont plus théoriques. Neon Mobile a été désactivé après son lancement en raison d'une vulnérabilité qui donnait accès aux numéros de téléphone, aux enregistrements d'appels et aux transcriptions des utilisateurs. Un autre exemple est un acteur de New York qui a vendu son visage et sa voix à un service vidéo IA pour 1 000 $ et a ensuite vu des vidéos avec son propre clone numérique générant des millions de vues et faisant la publicité de suppléments médicaux douteux. Expliquer aux connaissances que ce n'était pas lui dans la vidéo s'est avéré être un problème à part.
Le fondateur de Kled AI affirme que son entreprise restreint l'utilisation des données aux tâches de formation et de recherche et vérifie les acheteurs pour éviter de travailler avec l'industrie pornographique et les structures aux objectifs douteux. Mais les avocats et les chercheurs en matière de confidentialité avertissent : les utilisateurs ne comprennent presque jamais exactement où se retrouveront leur visage, leur voix ou leurs modèles de comportement. Même si le nom et la géolocalisation sont supprimés, les données biométriques sont intrinsèquement difficiles à vraiment anonymiser.
Ce que cela signifie
Le marché des données pour la formation de l'IA transforme la personnalité en matière première : pas seulement des textes et des images, mais une voix, des habitudes, des routes, des conversations. Pour les utilisateurs, c'est de l'argent rapide ici et maintenant ; pour les plates-formes, c'est un actif à long terme qui peut être réutilisé pendant des années. Plus le déficit de données de qualité est important, plus les entreprises d'IA achèteront fréquemment non pas du contenu, mais les gens eux-mêmes comme source de ce contenu.
Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?
AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.