Habr AI→ оригинал

Les LLM et les systèmes agentiques évincent ROS du centre de la robotique — pourquoi c’est important

Un basculement se dessine dans la robotique : ROS reste au niveau du contrôle bas niveau, tandis que la prise de décision passe aux LLM et aux frameworks agenti

Les LLM et les systèmes agentiques évincent ROS du centre de la robotique — pourquoi c’est important
Источник: Habr AI. Коллаж: Hamidun News.

В робототехнике усиливается сдвиг: ROS остаётся базовым слоем для железа, а принятие решений всё чаще переносят в LLM и агентные фреймворки. Автор материала считает, что именно эта связка может переписать правила отрасли и сделать создание роботов дешевле и быстрее.

Почему ROS буксует ROS десятилетиями был стандартом для академической

и промышленной робототехники, но его логика строится вокруг жёстко заданных узлов, сообщений и сценариев. Чтобы научить машину новому действию, разработчику нужно написать модуль, связать его с остальной системой, прогнать симуляцию и затем проверить всё на реальном устройстве. В контролируемой среде вроде конвейера это работает хорошо.

Но дома, на улице или на стройке мир слишком изменчив: высота ступеней, освещение, люди и препятствия постоянно меняются, а значит, ручная прошивка каждого сценария быстро упирается в потолок. На этом фоне показателен контраст между ASIMO и нынешними гаражными проектами. Большие корпорации годами доводили до блеска отдельные демонстрации, тогда как небольшие команды всё чаще делают роботов, которые учатся в симуляции, встают после падений и быстрее адаптируются к новой обстановке.

Ключевая разница не только в железе, а в подходе: индустрия постепенно уходит от идеи, что каждое движение и каждую реакцию нужно заранее описать в коде.

Новый стек роботов

Вместо монолитной логики автор предлагает многослойную схему, где мышление отделено от исполнения. На нижнем уровне остаются быстрые рефлексы и защита: остановка моторов, реакция на препятствие, базовый контроль безопасности. Выше работают сенсорные модели, которые превращают поток с камер, микрофонов и датчиков в понятные сущности. Затем LLM получает цель, оценивает контекст и строит план, а агентный слой вызывает конкретные инструменты и переводит абстрактные команды в действия железа.

  • Рефлекторный слой отвечает за мгновенную безопасную реакцию Сенсорный слой распознаёт объекты, речь и сцену вокруг LLM-планировщик решает, что делать дальше * Агентный слой вызывает моторы, файлы, API и внешние программы Такая схема делает робота менее привязанным к конкретной платформе. Модели не нужно знать, как устроен каждый мотор или датчик: она оперирует задачами вроде «объехать препятствие», «открыть конфиг», «подкрутить скорость» или «проверить новую траекторию». В пределе это ведёт к ещё более радикальному сценарию: LLM замечает, что в системе не хватает инструмента, генерирует новый модуль, тестирует его в симуляции и только потом разворачивает в рабочем контуре. Для классического ROS-подхода такая гибкость нетипична.

Выгоды и риски Главный выигрыш здесь — масштабируемость.

Чтобы добавить роботу новое поведение, не обязательно каждый раз собирать отдельный цикл разработки на C++ или Python. Достаточно описать задачу на естественном языке, а система сама разложит её на шаги. Это открывает дорогу не только сервисным и домашним роботам, но и более широкому классу «умных» устройств: от помощников в квартире до техники, которая подстраивается под привычки пользователя без жёстко прописанных сценариев автоматизации.

«Потому что теперь у него есть не только голова, но и руки».

Но вместе с гибкостью растут и риски. Если LLM может менять конфигурацию, запускать код и принимать решения в физическом мире, нужны песочницы, ограничения на опасные действия, симуляционное тестирование и понятный механизм отката. Остаются вопросы к энергопотреблению, надёжности и юридической ответственности: кто отвечает, если робот ошибся после совета модели. Поэтому речь идёт не о мгновенной смерти ROS, а о смещении его роли вниз по стеку — ближе к драйверам и real-time-уровню.

Что это значит

Идея «конца эпохи ROS» не в том, что middleware исчезнет завтра, а в том, что центр робототехнической архитектуры постепенно переезжает из жёстких правил в слой планирования и агентного исполнения. Если этот переход закрепится, роботов станет проще обучать новым задачам, дешевле адаптировать под разное железо и быстрее выводить из лабораторий в реальную среду.

ЖХ
Hamidun News
AI‑новости без шума. Ежедневный редакторский отбор из 400+ источников. Продукт Жемала Хамидуна, Head of AI в Alpina Digital.
Загружаем комментарии…