Habr AI→ original

Les LLM et les systèmes agentiques évincent ROS du centre de la robotique — pourquoi c’est important

Un basculement se dessine dans la robotique : ROS reste au niveau du contrôle bas niveau, tandis que la prise de décision passe aux LLM et aux frameworks…

Traité par IA depuis Habr AI ; édité par Hamidun News
Les LLM et les systèmes agentiques évincent ROS du centre de la robotique — pourquoi c’est important
Source : Habr AI. Collage: Hamidun News.
◐ Écouter l'article

En robotique, un changement majeur est en cours : ROS reste une couche fondamentale pour le matériel, mais la prise de décision se déplace de plus en plus vers les LLMs et les frameworks d'agents. L'auteur estime que cette combinaison pourrait réécrire les règles de l'industrie et rendre la création de robots moins chère et plus rapide.

Pourquoi ROS Stagne

ROS a été la norme de la robotique académique et industrielle pendant des décennies, mais sa logique est construite autour de nœuds, de messages et de scénarios rigidement définis. Pour enseigner à une machine une nouvelle action, un développeur doit écrire un module, le connecter au reste du système, exécuter des simulations et ensuite tout tester sur un vrai appareil. Dans les environnements contrôlés comme les lignes d'assemblage, cela fonctionne bien.

Mais à la maison, dans la rue ou sur un chantier, le monde est trop variable : les hauteurs de marches, l'éclairage, les gens et les obstacles changent constamment, ce qui signifie que les mises à jour manuelles du firmware pour chaque scénario heurtent rapidement un plafond. Sur ce fond, le contraste entre ASIMO et les projets de garage actuels est révélateur. Les grandes entreprises ont passé des années à perfectionner des démonstrations individuelles, tandis que de petites équipes construisent de plus en plus de robots qui apprennent en simulation, se relèvent après des chutes et s'adaptent plus vite à de nouveaux environnements.

La différence clé n'est pas seulement le matériel, mais l'approche : l'industrie s'éloigne graduellement de l'idée que chaque mouvement et réaction doit être codés à l'avance.

La Nouvelle Pile de Robots

Au lieu d'une logique monolithique, l'auteur propose une architecture multicouche où la pensée est séparée de l'exécution. Au niveau le plus bas se trouvent les réflexes rapides et les protections : arrêt des moteurs, réactions aux obstacles, contrôles de sécurité basiques. Au-dessus fonctionnent des modèles sensoriels, transformant les flux des caméras, microphones et capteurs en entités compréhensibles. Ensuite, un LLM reçoit l'objectif, évalue le contexte et construit un plan, tandis qu'une couche d'agent invoque des outils spécifiques et traduit les commandes abstraites en actions matérielles.

  • La couche réflexe gère les réactions sûres instantanées
  • La couche sensorielle reconnaît les objets, la parole et la scène environnante
  • Le planificateur LLM décide ce qu'il faut faire ensuite
  • La couche agent appelle les moteurs, les fichiers, les APIs et les programmes externes

Cette architecture rend un robot moins lié à une plateforme spécifique. Les modèles n'ont pas besoin de savoir comment fonctionne chaque moteur ou capteur : ils opèrent sur des tâches comme « contourner un obstacle », « ouvrir une config », « ajuster la vitesse » ou « tester une nouvelle trajectoire ». À l'extrême, cela conduit à un scénario encore plus radical : le LLM remarque que le système manque d'un outil, génère un nouveau module, le teste en simulation et ne le déploie en production que ensuite. Pour l'approche ROS classique, une telle flexibilité est atypique.

Avantages et Risques

Le principal avantage ici est l'évolutivité. Pour donner à un robot un nouveau comportement, vous ne devez pas nécessairement exécuter un cycle de développement séparé en C++ ou Python à chaque fois. Il suffit de décrire la tâche en langage naturel, et le système la décompose en étapes. Cela ouvre la porte non seulement aux robots de service et domestiques, mais à une classe plus large de dispositifs « intelligents » : des assistants d'appartements aux équipements qui s'adaptent aux habitudes de l'utilisateur sans scénarios d'automatisation codés en dur.

"Parce que maintenant il a non seulement une tête, mais aussi des mains."

Mais avec la flexibilité viennent aussi les risques. Si un LLM peut modifier la configuration, exécuter du code et prendre des décisions dans le monde physique, il faut des bacs à sable, des restrictions sur les actions dangereuses, des tests en simulation et un mécanisme de roulement clair. Des questions subsistent sur la consommation d'énergie, la fiabilité et la responsabilité juridique : qui est responsable si un robot a fait une erreur en suivant les conseils du modèle. Ce n'est donc pas que ROS disparaisse du jour au lendemain, mais que son rôle se déplace vers le bas de la pile—plus proche des drivers et des niveaux temps réel.

Ce Que Cela Signifie

L'idée de la « fin de l'ère ROS » n'est pas que le middleware disparaîtra demain, mais que le centre de l'architecture de robotique se déplace graduellement des règles rigides vers une couche de planification et d'exécution d'agents. Si cette transition s'affirme, les robots deviendront plus faciles à enseigner de nouvelles tâches, moins chers à adapter à différents matériels et plus rapides à passer des laboratoires au monde réel.

ZK
Hamidun News
Actualités IA sans bruit. Sélection éditoriale quotidienne de plus de 400 sources. Produit de Zhemal Khamidun, Head of AI chez Alpina Digital.

Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?

AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.

Qu'en pensez-vous ?
Chargement des commentaires…