Jiqizhixin (机器之心)→ original

Techo de cristal roto: Ant Group enseñó a los robots a ver lo invisible

Imagina que compraste un robot asistente por decenas de miles de dólares y, en el primer día, se chocó contra una ventana panorámica o intentó coger aire en…

Procesado por IA desde Jiqizhixin (机器之心); editado por Hamidun News
Techo de cristal roto: Ant Group enseñó a los robots a ver lo invisible
Fuente: Jiqizhixin (机器之心). Collage: Hamidun News.
◐ Escuchar artículo

Imagina que compraste un robot asistente por decenas de miles de dólares y, en el primer día, se chocó contra una ventana panorámica o intentó coger aire en lugar de un vaso de caro Chardonnay. ¿Gracioso? Solo si no te está pasando en tu casa. El problema de los objetos transparentes ha sido durante años el "talón de Aquiles" de la robótica. Mientras discutimos si la IA logrará conciencia, los ingenieros luchan por hacer que deje de actuar estúpidamente frente a una puerta de cristal ordinaria. Recientemente, el gigante chino Ant Group decidió que era hora de cerrar esta brecha gestáltica y presentó su primera investigación seria en el campo de la IA Incorporada (Embodied AI).

¿Por qué es siquiera un problema? La mayoría de los robots modernos dependen de LIDARs y cámaras RGB-D. Los LIDARs funcionan según el principio de reflexión de rayos láser: si el rayo atraviesa vidrio o se refracta caóticamente, el robot cree que no hay nada frente a él. Las cámaras de profundidad también enloquecen intentando calcular la distancia hasta una superficie transparente. Como resultado, obtenemos máquinas avanzadas que se comportan en una sala de estar normal como gatitos desorientados.

Ant Group propuso un framework que combina datos visuales y aprendizaje profundo para restaurar correctamente la forma y posición de objetos transparentes en el espacio. La entrada de Ant Group en este nicho parece una continuación lógica de su estrategia. Después de que los reguladores enfriaron el ardor de su dirección fintech, la empresa comenzó a diversificar activamente su portafolio hacia tecnologías fundamentales.

La investigación en el campo de la IA Incorporada no es solo un intento de crear un robot camarero. Es una lucha por el liderazgo en el próximo paradigma tecnológico, donde la IA va más allá de los chatbots y comienza a manipular objetos físicos. El hecho de que hayan lanzado inmediatamente su trabajo como código abierto habla sobre el deseo de construir rápidamente una comunidad de desarrolladores a su alrededor y establecer estándares de la industria.

Analizando la solución propuesta, entiendes que el enfoque se ha desplazado del simple reconocimiento de patrones a la comprensión de la física de la luz. Los algoritmos de Ant Group enseñan a las redes neuronales a predecir cómo se refractará la luz a través de un medio transparente. Esto permite que el robot no solo "vea" vidrio, sino que comprenda su volumen y límites. Para la industria, esto significa un salto cualitativo: de robots de almacén que funcionan en condiciones estériles con cajas de cartón, estamos pasando a asistentes domésticos capaces de interactuar adecuadamente con el mundo frágil y complejo de la habitación humana.

¿Qué significa esto para nosotros? Probablemente, en los próximos años veremos una ola de nuevas startups usando este código abierto para crear aspiradoras más inteligentes, manipuladores e incluso carros sin conductor en centros comerciales. China una vez más prueba que su enfoque de la innovación no es solo sobre copiar, sino también sobre resolver problemas de ingeniería fundamental que las empresas occidentales a veces evitan, prefiriendo enfocarse en software. Ant Group está dejando claro: están aquí en serio y para quedarse, y sus ambiciones se extienden mucho más allá de billeteras digitales.

Lo esencial: Ant Group entró con éxito en el territorio de la IA física, resolviendo el problema de "invisibilidad" del vidrio. La investigación de código abierto acelerará el surgimiento de robots que finalmente dejarán de ser una amenaza para tus ventanas y platos. ¿Será este el comienzo del fin de los sensores especializados en favor de la pura visión de máquina?

ZK
Hamidun News
Noticias de AI sin ruido. Selección editorial diaria de más de 400 fuentes. Producto de Zhemal Khamidun, Head of AI en Alpina Digital.

¿Quieres dejar de leer sobre IA y empezar a usarla?

AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.

¿Qué te parece?
Cargando comentarios…