MIT News→ original

Le MIT Enseigne à l'IA Générative à Reconstruire les Objets Cachés à Partir de Signaux sans Fil

Le MIT améliore la « vision » sans fil pour les robots : un modèle génératif reconstruit les parties cachées des objets à partir des réflexions de signaux…

Traité par IA depuis MIT News ; édité par Hamidun News
Le MIT Enseigne à l'IA Générative à Reconstruire les Objets Cachés à Partir de Signaux sans Fil
Source : MIT News. Collage: Hamidun News.
◐ Écouter l'article

Le MIT a appris à l'IA générative à reconstruire les objets cachés à partir de signaux sans fil

Les chercheurs du MIT ont amélioré un système de "vision" sans fil qui reconnaît les objets cachés derrière des obstacles en analysant les réflexions des signaux en ondes millimétriques. Un modèle génératif reconstruit maintenant les parties manquantes de la forme et aide les robots à mieux comprendre ce qui se cache derrière le carton, le plastique, le plâtre ou le tissu.

Comment cela fonctionne

Les versions précédentes de tels systèmes savaient déjà comment utiliser les signaux mmWave pour assembler un modèle 3D approximatif d'un objet caché derrière une barrière. Le problème résidait dans la physique de la réflexion : les ondes voyagent souvent dans une direction et ne reviennent pas au capteur. De ce fait, le système ne "voyait" généralement que la partie supérieure d'un objet, tandis que les surfaces latérales et inférieures restaient des zones vides. Pour un robot, c'est critique : si la forme est reconstruite de manière imprécise, le manipulateur a du mal à déterminer comment saisir l'objet en toute sécurité et comment il est positionné dans l'espace.

Pour contourner cette limitation, l'équipe du MIT a ajouté un modèle génératif qui reçoit une reconstruction incomplète et reconstruit une forme complète plausible. Cependant, ils manquaient d'ensembles de données mmWave réelles pour l'entraînement, donc les chercheurs ont opté pour une approche différente : ils ont pris de grands ensembles de données d'images de vision par ordinateur et les ont adaptés aux propriétés des réflexions sans fil, y compris la spécularité et le bruit. Sur cette base synthétique, ils ont entraîné le système Wave-Former. Il propose d'abord les surfaces possibles des objets en fonction des réflexions, puis le modèle comble les lacunes et enfin affine la géométrie pour une reconstruction 3D complète.

Précision et scènes

Dans les tests, Wave-Former a reconstruit les formes d'environ 70 objets quotidiens — des boîtes de conserve et des boîtes aux fruits et ustensiles de cuisine. Les objets étaient cachés derrière du carton, du bois, du plâtre, du plastique et du tissu, ou placés sous ces matériaux. Selon le MIT, la nouvelle approche a fourni une reconstruction presque 20 pour cent plus précise par rapport aux meilleures méthodes antérieures. Pour les applications pratiques, c'est une étape importante : le système ne détecte pas seulement la présence d'un objet, mais se rapproche de la compréhension de sa forme réelle, son volume et ses limites.

"Nous utilisons l'IA pour enfin libérer le potentiel de la vision sans fil", déclare

Fadel Adib, qui a dirigé ces travaux.

L'équipe ne s'est pas arrêtée là et a construit un deuxième système — RISE, qui reconstruit non seulement des objets individuels, mais une pièce entière. Pour cela, il ne faut qu'un radar stationnaire et le mouvement humain à l'intérieur de l'espace. Quand une personne marche, une partie du signal se réfléchit sur elle, puis sur les murs et les meubles, et revient ensuite au capteur. Ces réflexions secondaires sont généralement considérées comme du bruit et rejetées, mais le MIT a enseigné au modèle à en extraire la disposition de la scène. Dans les expériences sur plus de 100 trajectoires de mouvement humain, RISE était en moyenne environ deux fois plus précis que les méthodes existantes.

Où ce sera utile

La valeur pratique réside ici non seulement dans la précision, mais aussi dans le format d'application. L'analyse de scène ne nécessite pas un robot mobile avec un capteur qui doit circuler et scanner l'espace depuis différents points. Un seul radar stationnaire suffit. De plus, la méthode ne s'appuie pas sur des caméras conventionnelles, elle est donc mieux adaptée aux scénarios où la vie privée des personnes dans le cadre est importante.

  • Vérification du contenu des boîtes et des emballages avant l'expédition
  • Recherche d'articles cachés sous d'autres objets dans un entrepôt ou à la maison
  • Reconstruction de la disposition d'une pièce avec un seul capteur stationnaire
  • Détermination de la position humaine pour un mouvement plus sûr du robot
  • Scénarios où l'utilisation de caméras est indésirable en raison de préoccupations liées à la vie privée

Si la technologie devient plus détaillée et robuste, elle aura une chance de sortir du laboratoire. L'équipe du MIT déclare directement que l'étape suivante est celle de modèles de base plus importants pour les signaux sans fil, similaires à la façon dont GPT, Claude et Gemini fonctionnent avec le texte et les images. Cette approche pourrait transformer la détection sans fil d'un outil de recherche spécialisé en une couche de perception universelle pour les robots et les espaces intelligents.

Ce que cela signifie

Le MIT démontre un changement intéressant : au lieu d'extraire manuellement la valeur maximale de chaque réflexion, les chercheurs confient au modèle génératif la tâche de déduire la géométrie manquante à partir de données partielles. Si cette approche se généralise, les robots pourront voir avec plus de confiance derrière des barrières où une caméra ordinaire est inutile ou indésirable.

ZK
Hamidun News
Actualités IA sans bruit. Sélection éditoriale quotidienne de plus de 400 sources. Produit de Zhemal Khamidun, Head of AI chez Alpina Digital.

Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?

AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.

Qu'en pensez-vous ?
Chargement des commentaires…