Cómo OpenAI, Google y Figure Están Cambiando el Entrenamiento de Robots: Una Breve Historia del Enfoque
Hasta hace poco, la robótica operaba en modo "soñamos con C-3PO, lanzamos Roomba". Ahora la lógica está cambiando: en lugar de reglas codificadas, los robots…
Procesado por IA desde MIT Technology Review; editado por Hamidun News
La robótica no está experimentando simplemente otro ciclo de desarrollo de hardware, sino un cambio fundamental en la propia lógica del aprendizaje: las máquinas cada vez se entrenan más en datos, simulaciones y grandes modelos multimodales, en lugar de ser programadas manualmente. Durante mucho tiempo, la industria tuvo una brecha notable entre ambiciones y resultados. Los ingenieros soñaban con robots a nivel de ciencia ficción — asistentes universales capaces de moverse por el mundo ordinario, entender a las personas y realizar con seguridad docenas de tareas.
En la práctica, el mercado ha vivido durante décadas principalmente gracias a sistemas más estrechos: brazos robóticos para fábricas, manipuladores de almacén y dispositivos de consumidor como aspiradores robots. La razón no era la falta de mecánica, sino el hecho de que los robots se enfrentaban con dificultad a entornos impredecibles. Cualquier desviación del guión — un objeto nuevo, un ángulo de visualización diferente, iluminación cambiada — rápidamente rompía su comportamiento.
El primer gran cambio llegó con el aprendizaje mediante prueba y error. En los años 2010, los robóticos comenzaron a usar activamente aprendizaje por refuerzo y simuladores, donde las máquinas podrían entrenar millones de veces sin riesgo de dañar equipos costosos. Un ejemplo notable es la mano robótica Dactyl de OpenAI, que fue entrenada en simulación para manipular un cubo de Rubik y luego transfirió la habilidad al mundo real. La idea clave fue la randomización de dominio: durante el entrenamiento, cambios en los parámetros del entorno — fricción, masa de objetos, imágenes de cámara y otros detalles. De esta manera, el robot aprendió no un escenario perfecto, sino un comportamiento robusto en un amplio rango de condiciones.
Paralelamente, se desarrolló el aprendizaje por demostración: los robots comenzaron a ser enseñados mostrándoles acciones humanas en lugar de programar manualmente cada regla. Pero incluso eso no era suficiente. Las simulaciones aceleraron el aprendizaje, pero la brecha entre entornos virtuales y físicos no desapareció, y los datos reales permanecieron caros y escasos.
Entonces la siguiente etapa comenzó cuando la robótica adoptó enfoques del auge de los grandes modelos. En lugar de sistemas separados para tareas individuales, los investigadores comenzaron a reunir grandes conjuntos de datos de trayectorias, imágenes, instrucciones de texto y acciones. En Google, el modelo RT-1 fue entrenado en 130,000 episodios recogidos por una flota de 13 robots cubriendo más de 700 tareas.
Y RT-2 fue más lejos: combinó datos robóticos con datos web de modelos de visión-lenguaje, para que el robot no solo pudiera repetir movimientos familiares, sino también hacer inferencias más generales a partir de comandos en lenguaje natural.
Este mismo cambio es visible en proyectos que intentan escalar el aprendizaje en diferentes tipos de máquinas. En el conjunto Open X-Embodiment, los investigadores recogieron datos de 22 robots de 21 instituciones y describieron cientos de habilidades para que los modelos pudieran transferir experiencia entre plataformas, en lugar de comenzar de cero para cada nuevo manipulador. Sobre esto se construye la idea de modelos de fundación para el mundo físico: una inteligencia base única que se ajusta para un cuerpo, pinza o entorno de trabajo específico. Las startups como Figure, Apptronik, Covariant e Physical Intelligence están construyendo no solo investigación, sino también estrategias comerciales alrededor de esto.
En este contexto, el mercado se revitalizó. En 2025, las empresas e inversores invirtieron 6,1 mil millones de dólares en robots humanoides — cuatro veces más que el año anterior. El dinero fluye no porque los robots ya puedan hacer todo, sino porque surgió un camino más plausible para su entrenamiento en entornos reales.
Sin embargo, los robots universales aún están lejos. Las máquinas aún luchan con largas secuencias de acciones, manipulación fina de múltiples objetos simultáneamente, trabajo en espacios desordenados e interacción segura con humanos sin escenas pre-preparadas. A diferencia de los modelos de lenguaje, un robot no puede simplesmente cometer un error en el texto: su error significa un objeto cayendo, una avería, tiempo de inactividad o riesgo para los humanos.
Entonces la industria avanza por un camino híbrido: más simulaciones, más datos reales de flotas, más modelos generales, pero también más restricciones de seguridad y economía.
La conclusión principal es simple: el avance en robótica ahora está conectado no tanto a un nuevo tipo de cuerpo como a un nuevo modelo de aprendizaje. La industria está haciendo la transición de un mundo donde cada movimiento tenía que ser prescrito de antemano a uno donde el comportamiento puede primero ser aprendido, luego transferido a otro robot y mejorado continuamente en operación. Esto no es aún el androide prometido de la ficción, sino ya una trayectoria de ingeniería clara que ha hecho que los robots sean nuevamente una apuesta grande para investigadores e inversores.
¿Quieres dejar de leer sobre IA y empezar a usarla?
AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.