MIT News→ оригинал

Le MIT Enseigne à l'IA Générative à Reconstruire les Objets Cachés à Partir de Signaux sans Fil

Le MIT améliore la « vision » sans fil pour les robots : un modèle génératif reconstruit les parties cachées des objets à partir des réflexions de signaux mmWav

Le MIT Enseigne à l'IA Générative à Reconstruire les Objets Cachés à Partir de Signaux sans Fil
Источник: MIT News. Коллаж: Hamidun News.

Исследователи MIT улучшили беспроводную систему «зрения», которая распознаёт скрытые за препятствиями объекты по отражениям сигналов миллиметрового диапазона. Генеративная модель теперь достраивает недостающие части формы и помогает роботам точнее понимать, что находится за картоном, пластиком, гипсокартоном или тканью.

Как это работает

Предыдущие версии таких систем уже умели использовать mmWave-сигналы, чтобы собирать грубую 3D-модель объекта, спрятанного за преградой. Проблема была в физике отражения: волны часто уходят в одну сторону, а не возвращаются обратно к сенсору. Из-за этого система обычно «видела» только верхнюю часть предмета, тогда как боковые и нижние поверхности оставались пустыми зонами.

Для робота это критично: если форма восстановлена неточно, манипулятор хуже определяет, как безопасно схватить вещь и как она лежит в пространстве. Чтобы обойти это ограничение, команда MIT добавила генеративную модель, которая получает неполную реконструкцию и достраивает правдоподобную форму целиком. Но для обучения не хватало реальных наборов mmWave-данных, поэтому исследователи пошли в обход: взяли большие компьютерные датасеты изображений и адаптировали их под свойства беспроводных отражений, включая зеркальность и шум.

На этой синтетической базе они обучили систему Wave-Former. Она сначала предлагает возможные поверхности объекта по отражениям, затем модель дополняет пропуски и после этого уточняет геометрию до полной 3D-реконструкции.

Точность и сцены В тестах

Wave-Former восстановил формы примерно 70 повседневных предметов — от банок и коробок до фруктов и кухонных принадлежностей. Объекты прятали за картоном, деревом, гипсокартоном, пластиком и тканью или помещали под такие материалы. По данным MIT, новая схема дала почти на 20 процентов более точную реконструкцию по сравнению с лучшими прежними подходами. Для практики это важный шаг: система не просто фиксирует наличие предмета, а ближе подходит к пониманию его реальной формы, объёма и границ.

«Мы используем ИИ, чтобы наконец раскрыть потенциал беспроводного зрения», — говорит руководитель работы Фадель Адиб.

На этом команда не остановилась и собрала вторую систему — RISE, которая восстанавливает уже не отдельный объект, а целую комнату. Для этого ей хватает одного стационарного радара и движения человека внутри помещения. Когда человек идёт, часть сигнала отражается от него, затем от стен и мебели, а потом возвращается к датчику. Такие вторичные отражения обычно считают шумом и отбрасывают, но MIT научил модель извлекать из них планировку сцены. В экспериментах на более чем 100 траекториях движения людей RISE в среднем оказался примерно вдвое точнее существующих методов.

Где это пригодится Практическая ценность здесь не только в точности, но и в формате применения.

Для сценового анализа не нужен мобильный робот с датчиком, который должен объезжать помещение и сканировать его с разных точек. Достаточно одного неподвижного радара. Плюс метод не строится на обычных камерах, а значит лучше подходит для сценариев, где важна приватность людей в кадре.

  • Проверка содержимого коробок и упаковок до отправки Поиск предметов, закрытых другими вещами на складе или дома Восстановление планировки комнаты одним стационарным датчиком Определение положения человека для более безопасного движения робота Сценарии, где нежелательно использовать камеры из-за приватности Если технология станет детальнее и устойчивее, у неё появится шанс выйти за рамки лаборатории. Команда MIT прямо говорит, что следующий шаг — более крупные базовые модели для беспроводных сигналов, по аналогии с тем, как GPT, Claude и Gemini работают с текстом и изображениями. Такой подход может превратить беспроводное зондирование из узкого исследовательского инструмента в универсальный слой восприятия для роботов и умных помещений.

Что это значит MIT показывает интересный сдвиг: вместо того чтобы

вручную выжимать максимум из каждого отражения, исследователи отдают генеративной модели задачу догадаться о недостающей геометрии по частичным данным. Если этот подход масштабируется, роботы смогут увереннее «видеть» за преградами там, где обычная камера бесполезна или нежелательна.

ЖХ
Hamidun News
AI‑новости без шума. Ежедневный редакторский отбор из 400+ источников. Продукт Жемала Хамидуна, Head of AI в Alpina Digital.
Загружаем комментарии…