Habr AI→ original

MTS mostró cómo se conectó OpenClaw a un robot y se llevó un agente de IA al mundo físico

MWS probó OpenClaw no solo en navegadores y aplicaciones, sino también en hardware real. El equipo conectó un agente al robot Unitree G1 a través de una capa…

Procesado por IA desde Habr AI; editado por Hamidun News
MTS mostró cómo se conectó OpenClaw a un robot y se llevó un agente de IA al mundo físico
Fuente: Habr AI. Collage: Hamidun News.
◐ Escuchar artículo

OpenClaw ha demostrado que un agente autónomo puede trasladarse del navegador al mundo físico mucho más rápido de lo que comúnmente se cree. El equipo de MWS tomó un orquestrador de código abierto que normalmente gestiona una computadora y aplicaciones, y lo conectó a un robot a través de una capa de software simple. Como resultado, el agente comenzó no solo a ejecutar tareas digitales, sino también a emitir comandos a un dispositivo real, orientándose por el flujo de video y modelos multimodales.

La idea no es reemplazar la robótica completa, sino montar rápida y económicamente un prototipo funcional de IA Física. El propio OpenClaw se convirtió en un proyecto notable en noviembre de 2025, cuando el desarrollador Peter Steinberger presentó una capa de orquestación para la operación autónoma de computadoras. El agente recibe una instrucción en un mensajero, la divide en pasos, cambia entre aplicaciones, mantiene el contexto y, cuando es necesario, utiliza cualquier LLM compatible.

Esta independencia de un modelo específico hace que el sistema sea conveniente para experimentos: puedes cambiar el motor de razonamiento sin reescribir la capa de automatización. Para desarrolladores, esta es una combinación rara: bajo umbral de entrada, flexibilidad de modelos y lógica ya lista para ejecutar tareas multicomponente. Este enfoque tiene un riesgo obvio: si ejecutas OpenClaw directamente en una laptop personal, el agente efectivamente obtiene acceso amplio a todo el sistema.

MWS propuso una opción más segura: ejecutarlo en una máquina virtual aislada en la nube. Para esto, utilizan una imagen Ubuntu preconfigurada con OpenClaw, y para un escenario básico, una configuración con 2 vCPU y 8 GB de RAM es suficiente. Lo que queda es emitir una cuenta de servicio, configurar una clave de API y conectar un LLM a través de un endpoint compatible con OpenAI mediante GPT Model Hub.

En otras palabras, en lugar de configurar manualmente el entorno, un desarrollador obtiene un inicio casi con un clic. Esto es importante no solo por conveniencia: en un entorno separado es más seguro probar escenarios donde el agente puede abrir procesos, cambiar el estado del sistema y mantener el contexto de las sesiones de trabajo. El momento más interesante comenzó donde los artículos sobre interfaces de agentes normalmente terminan: a nivel de hardware.

MWS tomó un robot humanoide Unitree G1, que puede caminar, mantener el equilibrio y reaccionar al entorno, pero en sí mismo no es un agente "inteligente". En lugar de una arquitectura VLA compleja, el equipo simplemente interceptó la lógica de control remoto: OpenClaw envía comandos a una capa intermedia, que los convierte en señales que el robot entiende. Usando el mismo esquema, puedes conectar no solo un robot humanoide costoso, sino cualquier dispositivo con una API o control remoto por radio, desde un carrito hasta un perro de juguete.

La idea clave aquí es que la capa intelectual está separada del mecanismo de ejecución, lo que significa que el mismo agente se puede transferir entre diferentes tipos de dispositivos. Para que el agente no actúe a ciegas, un flujo de video de la cámara del robot se alimentó en OpenClaw, e la interpretación de la escena se encargó al modelo multimodal kimi-2.5.

Reconoce objetos, evalúa la situación y ayuda a elegir la siguiente acción: avanzar, detenerse, evitar un obstáculo o ejecutar un comando simple en el espacio. Es importante notar que la demostración no requirió servidores MCP, cadenas de razonamiento pesadas ni una plataforma de robótica separada. Esencialmente, el equipo armó un puente mínimo entre un agente LLM, visión y un dispositivo de ejecución, demostrando que el umbral de entrada en IA Física ahora es notablemente menor de lo que muchos esperaban.

Y exactamente en eso radica el valor de este caso: muestra no un modelo académico del futuro, sino una receta de ingeniería que se puede replicar con componentes disponibles ahora mismo. La conclusión práctica es simple: OpenClaw ya se puede usar no solo para correos, archivos e interfaces web, sino también como una capa de control universal para dispositivos físicos. Esto aún no es un reemplazo para sistemas Vision-Language-Action completos ni un camino hacia una autonomía industrial confiable, pero sí una forma muy rápida de probar un escenario, montar una demo o lanzar un prototipo aplicado.

Para el mercado, esta es una señal importante: la combinación de LLM basado en nube, flujo de video y API de control simple está transformando gradualmente la IA Física de una exoticidad investigativa en una herramienta de ingeniería.

ZK
Hamidun News
Noticias de AI sin ruido. Selección editorial diaria de más de 400 fuentes. Producto de Zhemal Khamidun, Head of AI en Alpina Digital.

¿Quieres dejar de leer sobre IA y empezar a usarla?

AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.

¿Qué te parece?
Cargando comentarios…