Jiqizhixin (机器之心)→ оригинал

Le plafond de verre percé : Ant Group a appris aux robots à voir l'invisible

Ant Group впервые вышла на поле воплощенного интеллекта (Embodied AI) с решением одной из самых старых проблем индустрии — восприятия прозрачных объектов. Робот

Le plafond de verre percé : Ant Group a appris aux robots à voir l'invisible
Источник: Jiqizhixin (机器之心). Коллаж: Hamidun News.

Представьте, что вы купили робота-помощника за пару десятков тысяч долларов, а он в первый же день впечатался в панорамное окно или попытался схватить воздух вместо бокала дорогого шардоне. Смешно? Только если это происходит не у вас дома.

Проблема прозрачных объектов годами оставалась «ахиллесовой пятой» робототехники. Пока мы спорим о том, обретет ли ИИ сознание, инженеры бьются над тем, чтобы он просто перестал тупить перед обычной стеклянной дверью. На днях китайский гигант Ant Group решил, что пора закрыть этот гештальт, и представил свое первое серьезное исследование в области воплощенного интеллекта (Embodied AI).

Почему это вообще проблема? Большинство современных роботов полагается на лидары и RGB-D камеры. Лидары работают по принципу отражения лазерного луча: если луч проходит сквозь стекло или хаотично преломляется, робот думает, что перед ним пустота.

Глубинные камеры тоже сходят с ума, пытаясь вычислить расстояние до прозрачной поверхности. В итоге мы получаем продвинутые машины, которые ведут себя в обычной гостиной как дезориентированные котята. Ant Group предложила фреймворк, который объединяет визуальные данные и глубокое обучение для корректного восстановления формы и положения прозрачных предметов в пространстве.

Вход Ant Group в эту нишу выглядит логичным продолжением их стратегии. После того как регуляторы охладили пыл их финтех-направления, компания начала активно диверсифицировать портфель в сторону фундаментальных технологий. Исследование в области воплощенного интеллекта — это не просто попытка сделать робота-официанта.

Это борьба за лидерство в следующем технологическом укладе, где ИИ выходит за пределы чат-ботов и начинает манипулировать физическими объектами. Тот факт, что они сразу выложили наработки в open-source, говорит о желании быстро сформировать вокруг себя сообщество разработчиков и задать стандарты в индустрии. Анализируя предложенное решение, понимаешь, что фокус сместился с простого распознавания образов на понимание физики света.

Алгоритмы Ant Group учат нейросети предсказывать, как свет будет преломляться через прозрачную среду. Это позволяет роботу не просто «видеть» стекло, но и понимать его объем и границы. Для индустрии это означает качественный скачок: от складских роботов, работающих в стерильных условиях с картонными коробками, мы переходим к бытовым помощникам, которые способны адекватно взаимодействовать с хрупким и сложным миром человеческого жилья.

Что это значит для нас? Скорее всего, в ближайшие пару лет мы увидим волну новых стартапов, которые используют этот открытый код для создания более умных пылесосов, манипуляторов и даже беспилотных тележек в торговых центрах. Китай в очередной раз доказывает, что их подход к инновациям — это не только копирование, но и решение фундаментальных инженерных задач, которые западные компании иногда обходят стороной, предпочитая фокусироваться на софте.

Ant Group явно дает понять: они здесь всерьез и надолго, и их амбиции простираются далеко за пределы цифровых кошельков. Главное: Ant Group успешно зашла на территорию физического ИИ, решив проблему «невидимости» стекла. Открытый код исследования ускорит появление роботов, которые наконец-то перестанут быть угрозой для ваших окон и посуды.

Станет ли это началом конца для специализированных сенсоров в пользу чистого машинного зрения?

ЖХ
Hamidun News
AI‑новости без шума. Ежедневный редакторский отбор из 400+ источников. Продукт Жемала Хамидуна, Head of AI в Alpina Digital.
Загружаем комментарии…