La main à la place de l'écran : comment Wetour Robotics a réinventé les interfaces
Wetour Robotics a rejeté les interfaces traditionnelles. Son système Orchestra traite simultanément trois flux : où se trouve le corps, où regardent les yeux…
Traité par IA depuis IEEE Spectrum AI ; édité par Hamidun News
Une asymétrie s'est produite en Physical AI. Les robots sautent, dansent et ramassent des objets fragiles, mais les contrôler nécessite toujours un écran, des boutons ou la voix — des méthodes inchangées depuis 40 ans. Wetour Robotics a résolu le problème différemment. Au lieu de rendre les robots plus intelligents, l'entreprise a repensé l'interface entre l'humain et la machine.
Pourquoi l'écran et la voix ne fonctionnent pas
En trois ans, Physical AI a réalisé des progrès incroyables du côté des robots. Boston Dynamics, Figure et Unitree ont développé des actionneurs et une dextérité des manipulateurs à un niveau qui semblait impossible il y a dix ans. Google DeepMind a montré que les modèles vision-language-action fonctionnent dans un environnement non structuré.
Mais le développement s'est arrêté aux interfaces. Depuis quarante ans, les ordinateurs attendent que l'humain s'arrête, regarde vers le bas et traduise son intention en commande. Sur une éolienne, sur un quai de chargement ou dans une rue animée, cette approche s'effondre silencieusement.
Le technicien ne peut pas lâcher la clé. L'ouvrier ne peut pas regarder l'écran. Le piéton ne peut pas crier ses commandes à haute voix.
Le goulot d'étranglement s'est déplacé de la partie machine à la partie humaine.
Spatial Intent Fusion : trois flux au lieu d'un
Wetour Robotics a appelé son approche Spatial Intent Fusion — le traitement simultané de trois flux d'information sur l'humain :
- Position du corps dans l'espace
- Direction du regard et contexte visuel
- Signaux musculaires via des capteurs électromyographiques
- Vitesse de traitement inférieure à 100 millisecondes
- Prédiction de l'intention 50–80 ms avant le mouvement visible
Chaque canal en isolation est ambigu. Mais ensemble, traités au niveau du système d'exploitation avec une très faible latence, ils dessinent un portrait sans équivoque de ce que vous vous apprêtez à faire.
Comment cela fonctionne : couches et moteurs d'Orchestra
Orchestra est un hub informatique portable avec trois couches perceptives. VisionLink traite la vidéo : les caméras suivent les objets, les distances, le contexte. Conductor lit les biosignaux d'un bracelet porté avec des capteurs électromyographiques de surface (sEMG). Orchestra OS fusionne ces flux dans quatre moteurs : perception des capteurs, inférence de l'intention, orchestration des commandes, vérification de la sécurité.
L'astuce clé : les potentiels d'action des unités motrices apparaissent sur la peau 50–80 millisecondes avant que le doigt ne complète le geste. Le système devine ce que vous allez faire avant que vous ne le fassiez. Tout fonctionne en périphérie — sur l'appareil local, sans cloud. NVIDIA Jetson Orin Nano Super fournit suffisamment d'inférence pour boucler le cycle de contrôle en 100 millisecondes.
«
Votre corps est l'interface », le slogan de Wetour Robotics qui cache une architecture complexe de vision par ordinateur, traitement des biosignaux et inférence d'intention en temps réel.
Ce que cela signifie
L'histoire des ordinateurs est une histoire de révolutions d'interfaces. La ligne de commande a remplacé la bande perforée, l'interface graphique a remplacé la ligne de commande, l'écran tactile a remplacé les boutons, la voix a remplacé l'écran tactile. Chaque transition a élargi qui peut participer au système et ce qu'il peut en faire.
La prochaine transition n'est pas un nouvel écran ni un nouveau microphone. C'est le corps humain en tant que nœud de première classe dans un réseau informatique, avec la vitesse et la précision de n'importe quel autre appareil connecté. Cela ne concurrence pas le développement des humanoïdes et des modèles fondamentaux — c'est un complément.
Les humanoïdes ont besoin de données pour apprendre. Quand les humains deviennent des nœuds de première classe dans la boucle, chaque interaction avec le monde est un signal potentiel pour la prochaine génération de Physical AI.
Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?
AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.