IEEE Spectrum AI→ original

Boston Dynamics y Google DeepMind enseñan a Spot a razonar durante inspecciones industriales

Boston Dynamics ha integrado el modelo Gemini Robotics-ER 1.6 de Google DeepMind en Spot y apuesta por la inspección industrial. El robot ahora puede…

Procesado por IA desde IEEE Spectrum AI; editado por Hamidun News
Boston Dynamics y Google DeepMind enseñan a Spot a razonar durante inspecciones industriales
Fuente: IEEE Spectrum AI. Collage: Hamidun News.
◐ Escuchar artículo

Boston Dynamics está transitando Spot de la categoría de demostraciones impresionantes hacia una clase más práctica de robots industriales: el aparato cuadrúpedo ha recibido el modelo Gemini Robotics-ER 1.6 de Google DeepMind y ahora debe no solo ejecutar comandos, sino interpretar el entorno, notar desviaciones y tomar decisiones durante inspecciones sin la participación constante del operador. Para la robótica, este es un cambio importante.

Durante mucho tiempo, los robots podían hacer muchas cosas, pero solo si un humano había descrito el escenario de antemano casi como un programa. Cuanto más compleja era la tarea, más difícil era hacer la interfaz conveniente. La idea de IA incorporada—es decir, IA con cuerpo físico y acceso al mundo real—es precisamente sobre cerrar esa brecha.

Boston Dynamics es una de las pocas empresas que ha logrado llevar robots caminantes a escala comercial: Spot ya está operando en miles de unidades. Por lo tanto, la integración del nuevo modelo no es un experimento académico, sino un intento de mejorar un producto que ya está siendo utilizado en el campo. El escenario principal no son tareas escolares de vídeos, sino inspección industrial.

En fábricas, instalaciones energéticas y otros sitios complejos, Spot debe recorrer el territorio y verificar si algo peligroso está sucediendo. Con Gemini Robotics-ER 1.6, el robot puede buscar autónomamente líquidos derramados y escombros extraños, leer sensores complejos, manómetros y ventanas de inspección, así como conectar modelos visual-lingüísticos si necesita entender mejor la situación a su alrededor.

En otras palabras, el objetivo no es enseñar al robot a traer cosas elegantemente, sino reducir el riesgo en lugares donde el costo de un problema perdido puede ser alto. Pero lo más interesante aquí es lo que los desarrolladores llaman comprensión y razonamiento. En el mundo de los robots, estas palabras suenan cada vez más, aunque en la práctica no significan filosofía, sino cercanía del comportamiento de la máquina a la lógica humana.

Si una persona le pide a un robot que limpie latas de una habitación, espera no solo el hecho de ejecutar el comando, sino también sentido común: agarrar la lata de manera que no derrame ningún líquido restante, no colocar un vaso de agua en el borde de la mesa, no crear un nuevo peligro en lugar de eliminar uno antiguo. En Google DeepMind, dicen que monitorean tales casos a través de escenarios internos de seguridad semántica. El objetivo es que el robot no solo entienda el verbo en el comando, sino que considere las consecuencias de la acción en el mundo físico.

Al mismo tiempo, las limitaciones del enfoque actual son bastante notables. La versión actual del modelo para Spot se basa principalmente en la visión. Por ejemplo, una de las nuevas funciones evalúa el éxito del agarre de un objeto a través de múltiples cámaras.

Esto es útil, pero en robótica, durante mucho tiempo ha habido otras formas de entender que un objeto ha sido agarrado de forma fiable: sensores de fuerza, sensores táctiles, retroalimentación de contacto. El problema está en los datos. Hay muchos ejemplos visuales en Internet de cómo agarrar un bolígrafo o abrir una puerta, pero casi no hay grandes conjuntos de datos con información táctil.

Por lo tanto, enseñar a los modelos la física del contacto es actualmente mucho más difícil que enseñar imágenes y texto. Para cerrar esta brecha, Boston Dynamics pretende obtener más datos de campo de clientes que utilizarán las nuevas funciones de inspección de Spot. También hay una segunda cuestión práctica: la confianza.

Boston Dynamics reconoce directamente que está lanzando nuevas capacidades a través de programas beta y solo anuncia aquello en lo que tiene confianza. Para la inspección comercial, los robots no necesitan perfección absoluta, pero hay un umbral de utilidad. Si el sistema comete errores con demasiada frecuencia y genera falsas alarmas, los operadores dejarán de escucharlo.

La empresa cree que el valor real comienza en algún lugar por encima del nivel del 80 por ciento, cuando el robot ya está ayudando en lugar de molestando. Esto es especialmente importante en instalaciones donde parte de la infraestructura crítica está equipada con sensores, y parte de los detalles potencialmente peligrosos aún solo pueden ser notados por el ojo durante los recorridos. La conclusión es simple: la unión de Boston Dynamics y Google DeepMind no es una historia sobre otro vídeo impresionante de un robot, sino un intento de convertir la IA incorporada en una herramienta práctica con beneficio mensurable.

Si Spot realmente aprende a detectar de forma fiable fugas, leer instrumentos y actuar más seguramente en entornos ambiguos, el mercado recibirá uno de los primeros ejemplos convincentes de cómo la IA que razona funciona no en una pantalla, sino en un taller. Y la experiencia acumulada luego puede transferirse a otras plataformas, incluidos robots humanoides más complejos.

ZK
Hamidun News
Noticias de AI sin ruido. Selección editorial diaria de más de 400 fuentes. Producto de Zhemal Khamidun, Head of AI en Alpina Digital.

¿Quieres dejar de leer sobre IA y empezar a usarla?

AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.

¿Qué te parece?
Cargando comentarios…