MIT Technology Review→ original

Micro1 embauche des gens dans le monde entier pour former des humanoides alors que le marché de l'IA demande de nouveaux tests

Alors que le marché des humanoides s'accélère, Micro1, Scale AI et DoorDash paient déjà des gens pour filmer des tâches ménagères ordinaires, du repassage au…

Traité par IA depuis MIT Technology Review ; édité par Hamidun News
Micro1 embauche des gens dans le monde entier pour former des humanoides alors que le marché de l'IA demande de nouveaux tests
Source : MIT Technology Review. Collage: Hamidun News.
◐ Écouter l'article

Le marché de l'IA incarnée se heurte non seulement à des limitations matérielles, mais aussi à la disponibilité de données humaines : des milliers de personnes dans le monde enregistrent des vidéos d'elles-mêmes faisant la lessive, repassant et nettoyant leurs maisons pour former des robots humanoïdes. Dans ce contexte, les chercheurs affirment de plus en plus que les tests d'IA traditionnels révèlent peu sur le fonctionnement réel de ces systèmes au travail.

Comment les robots humanoïdes sont formés

L'une des entreprises les plus importantes dans cette nouvelle couche du marché est Micro1. Elle embauche des prestataires dans plus de 50 pays, dont le Nigéria, l'Inde et l'Argentine, pour enregistrer des actions quotidiennes du point de vue à la première personne : plier des vêtements, laver la vaisselle, nettoyer des tables, verser de l'eau, ouvrir des réfrigérateurs. Pour ce faire, les gens attachent un iPhone à leur tête et enregistrent de courtes vidéos avec les mains dans le cadre. Les vidéos sont ensuite vérifiées, annotées et intégrées dans des ensembles de données que les entreprises de robotique achètent.

La logique est simple : les grands modèles de langage avaient internet, mais les robots humanoïdes ont besoin du monde physique réel. Les simulations aident à peaufiner les mouvements, mais captent mal le chaos d'un appartement typique : éclairage différent, cuisines exiguës, surfaces glissantes, des dizaines de types d'objets et de façons d'interagir avec eux. C'est pourquoi non seulement Micro1 et Scale AI, qui ont collecté plus de 100 000 heures de ce matériel, mais aussi de nouveaux canaux comme DoorDash Tasks font leur apparition sur le marché.

Le 19 mars 2026, DoorDash a officiellement lancé un projet pilote où les travailleurs sont rémunérés pour enregistrer des actions quotidiennes et des enregistrements vocaux pour l'IA et la robotique. Même des centaines de milliers d'heures de vidéo ne semblent pas encore être la limite du marché.

"Cela prendra plus de temps que beaucoup ne le pensent", — roboticien

Ken Goldberg.

Le coût de ces données

Pour de nombreux prestataires, il s'agit d'un travail d'appoint décent : les tarifs d'environ 15 dollars de l'heure dans plusieurs pays semblent compétitifs. Mais le travail devient rapidement monotone. Les participants doivent répéter l'enregistrement d'actions similaires, inventer de nouveaux scénarios dans un petit appartement et s'assurer que l'enregistrement correspond aux instructions. Un travailleur à Delhi a décrit qu'il fallait près d'une heure pour une vidéo utile de 15 minutes — simplement parce qu'il n'y a pas autant de tâches différentes à enregistrer chez lui.

  • Fixez un iPhone ou un autre smartphone compatible au niveau de la tête
  • Enregistrez des vidéos du point de vue à la première personne, généralement de 1–2 minutes chacune
  • Les mains et l'objet doivent rester dans le cadre presque tout le temps
  • Des variations d'éclairage, de pièces, de surfaces et d'objets sont nécessaires
  • Les visages, les noms et autres données personnelles sont évités si possible

La question principale ici n'est pas vraiment la routine, mais la vie privée. Même si un visage n'apparaît pas dans le cadre, la vidéo contient le design intérieur, les médicaments de cuisine, les affaires des enfants, les routines quotidiennes et les voisins capturés accidentellement en arrière-plan. Pendant ce temps, les prestataires eux-mêmes ne savent souvent pas exactement à qui leurs enregistrements sont vendus, combien de temps ils sont conservés ou s'ils peuvent demander une suppression.

La chercheuse Yasmin Kotturi affirme directement que les entreprises doivent expliquer à l'avance aux gens où cette technologie pourrait aboutir et comment elle les affectera à l'avenir.

Pourquoi les tests échouent

Parallèlement à la course aux données, un autre différend s'intensifie : comment mesurons-nous la qualité de l'IA au juste ? La chercheuse Angela Aristidou croit que l'industrie a vécu trop longtemps dans la logique d'un examen scolaire, où un modèle est comparé à un humain sur une tâche isolée avec une bonne ou une mauvaise réponse. Dans la vraie vie, cela se produit rarement.

L'IA est intégrée dans des équipes, des réglementations et des processus longs, où il importe non seulement à quel point le système est précis et rapide, mais aussi comment il affecte la coordination des personnes, la charge de travail, la confiance et les taux d'erreur aux étapes suivantes.

À la place, Aristidou propose l'approche HAIC — Human–AI, Context-Specific Evaluation. L'idée est de tester non pas un modèle dans le vide, mais comment le système fonctionne au sein d'une organisation sur un horizon long.

Dans ses exemples, les IA médicales pouvaient sembler bonnes dans les tests mais ralentir le travail dans les hôpitaux parce que les médecins devaient adapter leurs conclusions aux normes de rapport locales et aux exigences réglementaires.

Cette approche change le focus sur plusieurs axes :

  • de la tâche individuelle au travail en équipe et au flux de travail
  • du test unique à l'effet à long terme
  • de la précision brute à la qualité de la coordination et à la détection des erreurs
  • d'une réponse unique aux conséquences avant et après son utilisation

Pour l'entreprise, c'est une pensée inconfortable mais utile. Un score élevé à un benchmark ne signifie pas encore que l'outil accélérera un hôpital, un entrepôt, un service d'assistance ou une organisation humanitaire.

Dans un cas que décrit Aristidou, un système a été évalué pendant 18 mois au sein de processus réels, avec un suivi séparé de la facilité avec laquelle les gens remarquaient et corrigeaient ses erreurs. Seul cet test a révélé quels mécanismes de protection étaient nécessaires avant le déploiement à grande échelle.

Ce que cela signifie

Dans l'histoire des formateurs à domicile pour robots et dans le débat sur les nouveaux benchmarks, il y a une conclusion commune : l'industrie de l'IA dépend de moins en moins des démos spectaculaires et de plus en plus de la qualité de l'infrastructure cachée. Les gagnants ne seront pas seulement ceux qui ont les robots les plus impressionnants ou les scores de test les plus élevés, mais ceux qui peuvent collecter éthiquement des données réelles, expliquer clairement les règles pour y travailler et prouver la valeur du système au sein de processus réels, pas seulement sur scène.

ZK
Hamidun News
Actualités IA sans bruit. Sélection éditoriale quotidienne de plus de 400 sources. Produit de Zhemal Khamidun, Head of AI chez Alpina Digital.

Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?

AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.

Qu'en pensez-vous ?
Chargement des commentaires…