Los LLM y los sistemas agénticos están desplazando a ROS del centro de la robótica — por qué esto importa
En robótica se perfila un cambio: ROS sigue en la capa de control de bajo nivel, mientras que la toma de decisiones pasa a los LLM y a los frameworks…
Procesado por IA desde Habr AI; editado por Hamidun News
En robótica, está en marcha un cambio significativo: ROS permanece como una capa fundamental para el hardware, pero la toma de decisiones se está moviendo cada vez más a LLMs y marcos de agentes. El autor cree que esta combinación podría reescribir las reglas de la industria y hacer que la creación de robots sea más barata y rápida.
Por Qué ROS Se Estanca
ROS ha sido el estándar para la robótica académica e industrial durante décadas, pero su lógica se construye alrededor de nodos, mensajes y escenarios rígidamente definidos. Para enseñar a una máquina una nueva acción, un desarrollador debe escribir un módulo, conectarlo con el resto del sistema, ejecutar simulaciones y luego probar todo en un dispositivo real. En entornos controlados como líneas de montaje, esto funciona bien.
Pero en casa, en la calle o en una obra de construcción, el mundo es demasiado variable: las alturas de escalones, la iluminación, las personas y los obstáculos cambian constantemente, lo que significa que las actualizaciones manuales de firmware para cada escenario rápidamente topan con un límite. Ante esto, el contraste entre ASIMO y los proyectos de garaje actuales es revelador. Las grandes corporaciones pasaron años perfeccionando demostraciones individuales, mientras que pequeños equipos construyen cada vez más robots que aprenden en simulación, se levantan después de caídas y se adaptan más rápido a nuevos entornos.
La diferencia clave no es solo el hardware, sino el enfoque: la industria se está alejando gradualmente de la idea de que cada movimiento y reacción debe estar codificado de antemano.
El Nuevo Stack de Robots
En lugar de lógica monolítica, el autor propone una arquitectura multicapa donde el pensamiento se separa de la ejecución. En el nivel más bajo están los reflejos rápidos y las salvaguardas: paradas de motores, reacciones a obstáculos, controles básicos de seguridad. Por encima funcionan modelos sensoriales, convirtiendo flujos de cámaras, micrófonos y sensores en entidades comprensibles. Luego un LLM recibe el objetivo, evalúa el contexto y construye un plan, mientras que una capa de agente invoca herramientas específicas y traduce comandos abstractos en acciones de hardware.
- La capa refleja maneja reacciones seguras instantáneas
- La capa sensorial reconoce objetos, habla y la escena circundante
- El planificador LLM decide qué hacer a continuación
- La capa de agente invoca motores, archivos, APIs y programas externos
Tal arquitectura hace que un robot esté menos vinculado a ninguna plataforma específica. Los modelos no necesitan saber cómo funciona cada motor o sensor: operan sobre tareas como "navegar alrededor de un obstáculo", "abrir una configuración", "ajustar velocidad" o "probar una nueva trayectoria". En el extremo, esto conduce a un escenario aún más radical: el LLM nota que al sistema le falta una herramienta, genera un nuevo módulo, lo prueba en simulación y solo entonces lo despliega en producción. Para el enfoque ROS clásico, tal flexibilidad es atípica.
Beneficios y Riesgos
La principal ganancia aquí es la escalabilidad. Para dar a un robot un nuevo comportamiento, no necesariamente tienes que ejecutar un ciclo de desarrollo separado en C++ o Python cada vez. Solo describes la tarea en lenguaje natural, y el sistema la desglosa en pasos. Esto abre la puerta no solo a robots de servicio y domésticos, sino a una clase más amplia de dispositivos "inteligentes": desde asistentes de apartamentos hasta equipos que se adaptan a los hábitos del usuario sin escenarios de automatización codificados.
"Porque ahora no solo tiene una cabeza, sino también manos."
Pero con la flexibilidad vienen los riesgos. Si un LLM puede cambiar configuración, ejecutar código y tomar decisiones en el mundo físico, necesitas sandboxes, restricciones sobre acciones peligrosas, pruebas en simulación y un mecanismo de reversión claro. Persisten preguntas sobre consumo de energía, confiabilidad y responsabilidad legal: quién es responsable si un robot cometió un error siguiendo el consejo del modelo. Así que no se trata de que ROS muera de la noche a la mañana, sino de que su rol se desplace hacia abajo en la pila, más cerca de drivers y niveles real-time.
Qué Significa Esto
La idea del "fin de la era ROS" no es que el middleware desaparecerá mañana, sino que el centro de la arquitectura de robótica se está moviendo gradualmente de reglas rígidas a una capa de planificación y ejecución de agentes. Si esta transición se consolida, los robots serán más fáciles de enseñar nuevas tareas, más baratos de adaptar a diferentes hardwares y más rápidos de pasar de laboratorios al mundo real.
¿Quieres dejar de leer sobre IA y empezar a usarla?
AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.