MTS a montré comment OpenClaw a été connecté à un robot et a amené un agent IA dans le monde physique
MWS a testé OpenClaw non seulement dans les navigateurs et les applications, mais aussi sur du matériel réel. L'équipe a connecté un agent au robot Unitree…
Traité par IA depuis Habr AI ; édité par Hamidun News
OpenClaw a démontré qu'un agent autonome peut être transféré du navigateur vers le monde physique beaucoup plus rapidement qu'on ne le croit généralement. L'équipe de MWS a pris un orchestrateur open-source qui gère généralement un ordinateur et des applications, et l'a connecté à un robot via une simple couche logicielle. En résultat, l'agent a commencé non seulement à exécuter des tâches numériques, mais aussi à émettre des commandes vers un appareil réel, s'orientant par le flux vidéo et les modèles multimodaux.
L'idée n'est pas de remplacer la robotique complète, mais plutôt d'assembler rapidement et économiquement un prototype fonctionnel d'IA Physique. OpenClaw lui-même est devenu un projet notable en novembre 2025, quand le développeur Peter Steinberger a présenté une couche d'orchestration pour le fonctionnement autonome d'ordinateurs. L'agent reçoit une instruction dans un messager, la divise en étapes, bascule entre les applications, maintient le contexte et utilise au besoin tout LLM compatible.
Cette indépendance vis-à-vis d'un modèle spécifique rend le système pratique pour les expériences : vous pouvez changer le moteur de raisonnement sans réécrire la couche d'automatisation. Pour les développeurs, c'est une combinaison rare : seuil d'entrée bas, flexibilité des modèles et logique déjà prête pour exécuter des tâches multicomposantes. Une telle approche présente un risque évident : si vous exécutez OpenClaw directement sur un ordinateur portable personnel, l'agent obtient effectivement un accès large à l'ensemble du système.
MWS a proposé une option plus sûre : l'exécuter dans une machine virtuelle isolée dans le cloud. Pour cela, ils utilisent une image Ubuntu préconfiguée avec OpenClaw, et pour un scénario basique, une configuration avec 2 vCPU et 8 GB de RAM suffit. Il reste alors à émettre un compte de service, configurer une clé API et connecter un LLM via un endpoint compatible OpenAI par le biais du GPT Model Hub.
En d'autres termes, au lieu de configurer manuellement l'environnement, un développeur obtient un démarrage presque en un clic. C'est important non seulement pour la commodité : dans un environnement séparé, il est plus sûr de tester des scénarios où l'agent peut ouvrir des processus, modifier l'état du système et maintenir le contexte des sessions de travail. Le moment le plus intéressant a commencé là où les articles sur les interfaces d'agents se terminent généralement : au niveau du matériel.
MWS a pris un robot humanoïde Unitree G1, capable de marcher, de maintenir l'équilibre et de réagir à l'environnement, mais qui n'est pas en lui-même un agent « intelligent ». Au lieu d'une architecture VLA complexe, l'équipe a simplement intercepté la logique de commande à distance : OpenClaw envoie des commandes à une couche intermédiaire, qui les convertit en signaux que le robot comprend. En utilisant le même schéma, vous pouvez connecter non seulement un robot humanoïde coûteux, mais n'importe quel appareil avec une API ou une télécommande radio — d'un chariot à un chien jouet.
L'idée clé ici est que la couche intellectuelle est séparée du mécanisme d'exécution, ce qui signifie que le même agent peut être transféré entre différents types d'appareils. Pour que l'agent n'agisse pas à l'aveugle, un flux vidéo de la caméra du robot a été alimenté dans OpenClaw, et l'interprétation de la scène a été confiée au modèle multimodal kimi-2.5.
Il reconnaît les objets, évalue la situation et aide à choisir la prochaine action : avancer, s'arrêter, contourner un obstacle ou exécuter une simple commande dans l'espace. Il est important de noter que la démonstration n'a pas eu besoin de serveurs MCP, de chaînes de raisonnement lourdes ni d'une plateforme de robotique séparée. Essentiellement, l'équipe a assemblé un pont minimal entre un agent LLM, la vision et un appareil d'exécution, montrant que le seuil d'entrée en IA Physique est maintenant notablement inférieur à ce que beaucoup attendaient.
Et c'est exactement la valeur de ce cas : il montre non un modèle académique de l'avenir, mais une recette d'ingénierie qui peut être reproduite avec des composants disponibles dès maintenant. La conclusion pratique est simple : OpenClaw peut déjà être utilisé non seulement pour les e-mails, les fichiers et les interfaces web, mais aussi comme une couche de contrôle universelle pour les appareils physiques. Ce n'est pas encore un remplacement pour les systèmes Vision-Language-Action complets et pas un chemin vers une autonomie industrielle fiable, mais une façon très rapide de tester un scénario, assembler une démo ou lancer un prototype appliqué.
Pour le marché, c'est un signal important : la combinaison d'un LLM basé sur le cloud, d'un flux vidéo et d'une API de contrôle simple transforme graduellement l'IA Physique d'une exoticité de recherche en un outil d'ingénierie.
Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?
AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.