Micro1 Collecte des Vidéos Domestiques du Monde Entier pour Entraîner des Robots Humanoides
L'entraînement des robots humanoides s'est inopinément transformé en un nouveau segment de l'économie des gig. Micro1 et d'autres entreprises paient des…
Traité par IA depuis MIT Technology Review ; édité par Hamidun News
L'entraînement des robots humanoïdes s'est heurté non seulement à des obstacles en mécanique et chips, mais à la pénurie de données réelles sur la façon dont les humains se déplacent et manipulent des objets à la maison. C'est pourquoi un nouveau marché se développe rapidement autour de l'industrie : des milliers de travailleurs en gig enregistrent le repassage, le nettoyage et la cuisine à la maison, puis ces vidéos deviennent des données d'entraînement pour les robots.
Comment fonctionne le marché
L'un de ces travailleurs est Zeus, un étudiant en médecine du Nigéria. Après son quart de travail à l'hôpital, il allume une lampe annulaire, fixe son iPhone sur son front et enregistre des actions quotidiennes à la première personne. Micro1, une entreprise de Palo Alto, collecte de telles vidéos auprès de contractants dans plus de 50 pays, dont l'Inde, le Nigéria et l'Argentine, puis les vend à des entreprises de robotique. Les candidats sont d'abord examinés par un assistant IA, et les vidéos elles-mêmes passent par une vérification automatique et manuelle avant l'étiquetage.
- plier les vêtements et repasser
- laver la vaisselle et nettoyer la cuisine
- cuisiner et manipuler des ustensiles
- déplacer des objets dans la pièce
- navigation simple dans des espaces domestiques étroits
En surface, cela ressemble à un travail parallèle très simple : vous devez vous déplacer naturellement, garder les mains dans le cadre et répéter des actions domestiques familières. Mais c'est précisément dans de telles vidéos que les modèles apprennent à comprendre la saisie d'objets, les changements de position du corps et les scénarios de base pour interagir avec les choses. Pour certains travailleurs, c'est un revenu décent : Zeus reçoit environ $15 par heure. En même temps, le travail devient rapidement monotone, et dans un petit appartement, il est difficile de trouver assez de nouvelles scènes et de variations.
Pourquoi les robots en ont besoin
Le dernier boom de la robotique a largement grandi du succès des grands modèles de langage. La logique de l'industrie est simple : si les chatbots ont appris d'énormes volumes de texte, alors les robots humanoïdes peuvent aussi être entraînés sur de grands volumes de données de mouvement. Le problème est que le monde physique est beaucoup plus complexe qu'Internet. Les simulations fonctionnent raisonnablement bien pour la marche ou les tours de démonstration, mais elles capturent mal la force de pression, les frictions, les mouvements imprécis et le chaos d'une vraie cuisine, chambre ou entrepôt.
Selon le PDG de Micro1, Ali Ansari, les entreprises de robotique dépensent déjà plus de $100 millions par an pour acheter des données réelles. En 2025, les investisseurs ont injecté plus de $6 milliards dans les robots humanoïdes, et ce n'est pas seulement Micro1 qui recherche de telles données : des programmes similaires sont développés par Scale AI et Encord, DoorDash paie les livreurs pour filmer des tâches domestiques, et en Chine les travailleurs sont entraînés aux mouvements via des casques VR et des exosquelettes dans des centres spécialisés. Même à cette échelle, le marché ne fait que construire l'infrastructure de collecte de données.
"Cela prendra plus de temps que beaucoup ne le pensent."
Cette évaluation, que les experts en robotique dans le matériau partagent également, décrit bien l'état actuel du marché et les attentes de l'industrie. Même des dizaines et des centaines de milliers d'heures de vidéo ne semblent pas encore un volume suffisant pour des robots véritablement universels. L'industrie doit encore déterminer quelles données sont vraiment utiles, combien de variations sont nécessaires pour une formation fiable et si un tel volume peut être collecté sans augmentations aiguës des coûts et baisses de qualité.
Où commencent les risques
Le problème le plus évident est la confidentialité. Les entreprises demandent de ne pas montrer les visages, les noms, les numéros de téléphone et autres identifiants évidents. Mais même sans cela, les vidéos capturent toujours l'intérieur d'un appartement, les biens personnels, les habitudes, les enfants, les voisins et les routines quotidiennes. Pour les travailleurs avec des familles, la tâche est particulièrement inconfortable : vous devez constamment surveiller pour vous assurer qu'un enfant ou un voisin n'apparaît pas dans le cadre. En résultat, les « données pour le robot » s'avèrent être un enregistrement très détaillé de la vie quotidienne de quelqu'un d'autre.
Il y a un deuxième problème aussi—la qualité et la transparence de toute la chaîne. Les travailleurs interrogés comprennent qu'ils aident à entraîner les robots, mais souvent ne savent pas comment les enregistrements seront stockés, à qui ils seront transmis et s'ils pourront ensuite obtenir leur suppression. Les roboticiens, en attendant, avertissent que les habitudes domestiques ne sont pas toujours sûres et ne sont pas toujours appropriées comme modèle pour une machine. Si un robot absorbe des modèles infructueux des vidéos domestiques, les erreurs apparaîtront dans le vrai travail, et contrôler cela avec un flux de vidéos de milliers de personnes est très difficile.
Ce que cela signifie
Le boom des robots humanoïdes aujourd'hui est soutenu non seulement par de nouveaux modèles et du matériel, mais par un marché caché du travail manuel qui fournit à l'industrie des données sur la vie quotidienne. Si les entreprises veulent amener les robots domestiques et industriels à l'adoption massive, elles devront résoudre non seulement le problème de la formation, mais aussi les questions de consentement, de confidentialité et de qualité des données. Sinon, le « dernier kilomètre » de l'automatisation s'avérera être beaucoup plus long que ce que promettent les présentations.
Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?
AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.