Habr AI→ оригинал

LLMs and agent systems are displacing ROS from the center of robotics — why this matters

A shift is taking shape in robotics: ROS remains at the low-level control layer, while decision-making moves to LLMs and agent frameworks. Instead of manually h

LLMs and agent systems are displacing ROS from the center of robotics — why this matters
Источник: Habr AI. Коллаж: Hamidun News.

В робототехнике усиливается сдвиг: ROS остаётся базовым слоем для железа, а принятие решений всё чаще переносят в LLM и агентные фреймворки. Автор материала считает, что именно эта связка может переписать правила отрасли и сделать создание роботов дешевле и быстрее.

Почему ROS буксует ROS десятилетиями был стандартом для академической

и промышленной робототехники, но его логика строится вокруг жёстко заданных узлов, сообщений и сценариев. Чтобы научить машину новому действию, разработчику нужно написать модуль, связать его с остальной системой, прогнать симуляцию и затем проверить всё на реальном устройстве. В контролируемой среде вроде конвейера это работает хорошо.

Но дома, на улице или на стройке мир слишком изменчив: высота ступеней, освещение, люди и препятствия постоянно меняются, а значит, ручная прошивка каждого сценария быстро упирается в потолок. На этом фоне показателен контраст между ASIMO и нынешними гаражными проектами. Большие корпорации годами доводили до блеска отдельные демонстрации, тогда как небольшие команды всё чаще делают роботов, которые учатся в симуляции, встают после падений и быстрее адаптируются к новой обстановке.

Ключевая разница не только в железе, а в подходе: индустрия постепенно уходит от идеи, что каждое движение и каждую реакцию нужно заранее описать в коде.

Новый стек роботов

Вместо монолитной логики автор предлагает многослойную схему, где мышление отделено от исполнения. На нижнем уровне остаются быстрые рефлексы и защита: остановка моторов, реакция на препятствие, базовый контроль безопасности. Выше работают сенсорные модели, которые превращают поток с камер, микрофонов и датчиков в понятные сущности. Затем LLM получает цель, оценивает контекст и строит план, а агентный слой вызывает конкретные инструменты и переводит абстрактные команды в действия железа.

  • Рефлекторный слой отвечает за мгновенную безопасную реакцию Сенсорный слой распознаёт объекты, речь и сцену вокруг LLM-планировщик решает, что делать дальше * Агентный слой вызывает моторы, файлы, API и внешние программы Такая схема делает робота менее привязанным к конкретной платформе. Модели не нужно знать, как устроен каждый мотор или датчик: она оперирует задачами вроде «объехать препятствие», «открыть конфиг», «подкрутить скорость» или «проверить новую траекторию». В пределе это ведёт к ещё более радикальному сценарию: LLM замечает, что в системе не хватает инструмента, генерирует новый модуль, тестирует его в симуляции и только потом разворачивает в рабочем контуре. Для классического ROS-подхода такая гибкость нетипична.

Выгоды и риски Главный выигрыш здесь — масштабируемость.

Чтобы добавить роботу новое поведение, не обязательно каждый раз собирать отдельный цикл разработки на C++ или Python. Достаточно описать задачу на естественном языке, а система сама разложит её на шаги. Это открывает дорогу не только сервисным и домашним роботам, но и более широкому классу «умных» устройств: от помощников в квартире до техники, которая подстраивается под привычки пользователя без жёстко прописанных сценариев автоматизации.

«Потому что теперь у него есть не только голова, но и руки».

Но вместе с гибкостью растут и риски. Если LLM может менять конфигурацию, запускать код и принимать решения в физическом мире, нужны песочницы, ограничения на опасные действия, симуляционное тестирование и понятный механизм отката. Остаются вопросы к энергопотреблению, надёжности и юридической ответственности: кто отвечает, если робот ошибся после совета модели. Поэтому речь идёт не о мгновенной смерти ROS, а о смещении его роли вниз по стеку — ближе к драйверам и real-time-уровню.

Что это значит

Идея «конца эпохи ROS» не в том, что middleware исчезнет завтра, а в том, что центр робототехнической архитектуры постепенно переезжает из жёстких правил в слой планирования и агентного исполнения. Если этот переход закрепится, роботов станет проще обучать новым задачам, дешевле адаптировать под разное железо и быстрее выводить из лабораторий в реальную среду.

ЖХ
Hamidun News
AI‑новости без шума. Ежедневный редакторский отбор из 400+ источников. Продукт Жемала Хамидуна, Head of AI в Alpina Digital.
Загружаем комментарии…