MIT Enseña a IA Generativa a Reconstruir Objetos Ocultos Usando Señales Inalámbricas
MIT mejoró la 'visión' inalámbrica para robots: un modelo generativo reconstruye partes ocultas de objetos a partir de reflexiones de señales mmWave…
Procesado por IA desde MIT News; editado por Hamidun News
MIT enseñó a la IA generativa a reconstruir objetos ocultos a partir de señales inalámbricas
Investigadores del MIT mejoraron un sistema de "visión" inalámbrica que reconoce objetos ocultos detrás de obstáculos analizando reflexiones de señales de ondas milimétricas. Un modelo generativo ahora reconstruye las partes faltantes de la forma y ayuda a los robots a comprender con mayor precisión qué hay detrás del cartón, plástico, yeso o tela.
Cómo funciona
Las versiones anteriores de tales sistemas ya sabían cómo utilizar señales mmWave para ensamblar un modelo 3D aproximado de un objeto oculto detrás de una barrera. El problema estaba en la física de la reflexión: las ondas frecuentemente viajan en una dirección y no regresan al sensor. Por esto, el sistema generalmente solo "veía" la parte superior de un objeto, mientras que las superfícies laterales e inferiores permanecían como zonas vacías. Para un robot, esto es crítico: si la forma se reconstruye de manera imprecisa, el manipulador tiene dificultades para determinar cómo agarrar el objeto de manera segura y cómo está posicionado en el espacio.
Para sortear esta limitación, el equipo del MIT añadió un modelo generativo que recibe una reconstrucción incompleta y reconstruye una forma completa plausible. Sin embargo, carecían de conjuntos de datos mmWave reales para el entrenamiento, así que los investigadores optaron por un enfoque diferente: tomaron grandes conjuntos de datos de imágenes de visión por computadora y los adaptaron a las propiedades de las reflexiones inalámbricas, incluyendo especularidad y ruido. Sobre esta base sintética, entrenaron el sistema Wave-Former. Primero sugiere posibles superficies de objetos basándose en reflexiones, luego el modelo llena los vacíos y finalmente refina la geometría para una reconstrucción 3D completa.
Precisión y escenas
En pruebas, Wave-Former reconstruyó las formas de aproximadamente 70 objetos cotidianos — desde latas y cajas hasta frutas y utensilios de cocina. Los objetos estaban ocultos detrás de cartón, madera, yeso, plástico y tela, o se colocaban bajo tales materiales. Según el MIT, el nuevo enfoque proporcionó una reconstrucción casi 20 por ciento más precisa en comparación con los mejores métodos anteriores. Para aplicaciones prácticas, este es un paso importante: el sistema no solo detecta la presencia de un objeto, sino que se acerca a comprender su forma real, volumen y límites.
"Utilizamos IA para finalmente desbloquear el potencial de la visión inalámbrica", dice
Fadel Adib, quien dirigió el trabajo.
El equipo no se detuvo allí y construyó un segundo sistema — RISE, que reconstruye no solo objetos individuales, sino una sala completa. Para esto, solo necesita un radar estacionario y movimiento humano dentro del espacio. Cuando una persona camina, parte de la señal se refleja en ella, luego en las paredes y muebles, y luego regresa al sensor. Tales reflexiones secundarias generalmente se consideran ruido y se descartan, pero el MIT enseñó al modelo a extraer el diseño de la escena de ellas. En experimentos con más de 100 trayectorias de movimiento humano, RISE fue en promedio aproximadamente el doble de preciso que los métodos existentes.
Dónde será útil
El valor práctico aquí no solo reside en la precisión, sino también en el formato de aplicación. El análisis de escena no requiere un robot móvil con un sensor que deba conducir y escanear el espacio desde diferentes puntos. Un único radar estacionario es suficiente. Además, el método no se basa en cámaras convencionales, por lo que es más adecuado para escenarios donde la privacidad de las personas en el fotograma es importante.
- Verificación del contenido de cajas y empaques antes del envío
- Búsqueda de artículos ocultos bajo otros objetos en un almacén o en casa
- Reconstrucción del diseño de una sala con un único sensor estacionario
- Determinación de la posición humana para movimiento más seguro del robot
- Escenarios donde el uso de cámaras es indeseable debido a preocupaciones de privacidad
Si la tecnología se vuelve más detallada y robusta, tendrá la oportunidad de salir del laboratorio. El equipo del MIT afirma directamente que el siguiente paso son modelos de base más grandes para señales inalámbricas, similar a cómo GPT, Claude y Gemini funcionan con texto e imágenes. Este enfoque podría transformar la detección inalámbrica de una herramienta de investigación especializada en una capa de percepción universal para robots y espacios inteligentes.
Lo que esto significa
El MIT demuestra un cambio interesante: en lugar de extraer manualmente el máximo valor de cada reflexión, los investigadores encargan al modelo generativo la tarea de inferir la geometría faltante a partir de datos parciales. Si este enfoque se escala, los robots podrán ver con mayor confianza detrás de barreras donde una cámara ordinaria es inútil o indeseable.
¿Quieres dejar de leer sobre IA y empezar a usarla?
AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.