36Kr (36氪)→ original

Robots pris au piège des données : pourquoi les vidéos de sauts périlleux ne sont qu'un début

Les vidéos virales donnent l'illusion d'une percée technologique, mais les progrès réels sont freinés par une "crise des données". Contrairement à l'AI…

Traité par IA depuis 36Kr (36氪) ; édité par Hamidun News
Robots pris au piège des données : pourquoi les vidéos de sauts périlleux ne sont qu'un début
Source : 36Kr (36氪). Collage: Hamidun News.
◐ Écouter l'article

# Les Robots Piégés dans une Trappe de Données : Pourquoi les Vidéos de Saltos ne Sont que le Début

Au cours de la dernière année, Internet a été inondé de vidéos de tours impressionnants de robots : des robots qui sautent, dansent, frappent, écrasent des pastèques avec leurs pieds. Les investissements augmentent, les titres des médias débordent d'optimisme, et le public est convaincu que l'ère des robots assistants domestiques est sur le point de commencer. Mais si vous regardez derrière les rideaux de ce théâtre technologique, le tableau s'avère être beaucoup plus complexe et déprimant.

En ce moment même, dans des centres tranquilles de préparation de données répartis dans toute la Chine, des opérateurs humains gantés contrôlent lentement, presque douloureusement, des manipulateurs — ils enseignent aux machines à soulever des pièces, à plier des outils, à fermer des couvercles de boîtes. Ce spectacle manque de toute la qualité cinématographique des vidéos virales, mais c'est précisément cela qui détermine le véritable progrès en robotique. Le fait est que le chemin d'un tour impressionnant à un assistant domestique utile est bloqué par un problème fondamental : une pénurie catastrophique de données de qualité.

Les modèles de langage comme ChatGPT et DeepSeek sont construits sur le triomphe d'une logique simple — des milliers de milliards d'exemples de texte provenant d'Internet ont permis à l'IA de comprendre le langage et de commencer à générer du contenu significatif. Mais la robotique a fait face à une réalité complètement différente. Si les données textuelles vivent dans un espace numérique bidimensionnel, facile à copier et à distribuer, alors le monde physique est un flux multidimensionnel et continu d'informations.

Un robot doit percevoir le monde à travers plusieurs canaux simultanément : vidéo de plusieurs caméras, capteurs de force, capteurs tactiles, informations sur les positions des articulations. Chaque opération effectuée par le manipulateur génère des données structurées — 57 mesures dans certains systèmes. Et tous ces flux doivent être parfaitement synchronisés à la milliseconde près, sinon le modèle apprendra une pure hallucination au lieu de relations de cause à effet.

En Chine, plus de cinquante centres de collecte et de traitement de données robotiques fonctionnent déjà. Rien qu'à Pékin, l'un de ces centres produit environ six mille enregistrements d'exemples d'entraînement quotidiennement. Si nous extrapolons grossièrement, la production annuelle pourrait atteindre des dizaines de milliards d'exemples.

Cela semble impressionnant, mais en réalité, c'est une goutte dans l'océan des besoins. Des experts de la société PowerTech ont effectué un calcul conservateur : pour enseigner à un robot un mouvement, vous avez besoin d'environ mille à cinq mille exemples. Une tâche simple composée de plusieurs mouvements — dix à vingt mille.

Mais si nous parlons d'un robot universel capable de gérer quatre-vingts pour cent des travaux humains dans une industrie, un ensemble de données de centaines de millions serait nécessaire. Et si les ambitions s'étendent à des milliers d'industries — nous parlons de billions d'exemples. Le déficit est de quatre à cinq ordres de grandeur.

Mais ce n'est même pas le problème le plus grave. Bien plus insidieuse s'est avérée être l'incompatibilité de l'équipement. Différents fabricants créent des robots avec différentes configurations de capteurs, différents protocoles de contrôle, différents paramètres physiques. Les données collectées sur un modèle de manipulateur ne fonctionnent souvent tout simplement pas sur un autre — le langage d'une machine reste complètement étranger à une autre. Cela signifie que les connaissances ne s'accumulent pas, ne se construisent pas en un seul atout pour l'industrie. Chaque fabricant est obligé de collecter son propre ensemble de données à partir de zéro, répétant le même travail coûteux encore et encore.

Certains centres abordent ce dilemme en se concentrant sur les modèles populaires — essentiellement en ignorant la diversité. D'autres prennent une voie plus ambitieuse : collecter des données de robots de différents fabricants dans un espace unique, en essayant d'enseigner au modèle à généraliser les connaissances sur des équipements hétérogènes. Aucune approche n'a encore prouvé son universalité.

Tout cela nous rappelle les premiers jours du pilote automatique — une époque où il semblait que le problème était dans les algorithmes, pas dans les données. Près de vingt ans ont passé, des milliards d'investissements, et il s'avère que la vérité est quelque part à proximité, mais pas exactement où nous la cherchons. Avant que les robots entrent réellement dans nos maisons, il y aura un long et fastidieux travail à faire dans les centres de données, où les gens gantés enseigneront patiemment aux machines à comprendre le monde physique. Les vidéos virales, c'est du marketing. Le vrai progrès, c'est une histoire complètement différente.

ZK
Hamidun News
Actualités IA sans bruit. Sélection éditoriale quotidienne de plus de 400 sources. Produit de Zhemal Khamidun, Head of AI chez Alpina Digital.

Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?

AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.

Qu'en pensez-vous ?
Chargement des commentaires…