MIT Technology Review→ оригинал

Micro1 собирает домашние видео по всему миру для обучения гуманоидных роботов

Обучение гуманоидных роботов неожиданно превратилось в новый сегмент гиг-экономики. Micro1 и другие компании платят людям в Нигерии, Индии и других странах за в

Micro1 собирает домашние видео по всему миру для обучения гуманоидных роботов
Источник: MIT Technology Review. Коллаж: Hamidun News.

Обучение гуманоидных роботов упёрлось не только в механику и чипы, но и в нехватку реальных данных о том, как человек двигается и обращается с предметами в быту. Поэтому вокруг отрасли быстро растёт новый рынок: тысячи gig-работников снимают дома глажку, уборку и готовку, а затем эти ролики превращаются в тренировочные данные для роботов.

Как устроен этот рынок Один из таких работников — Зевс, студент-медик из Нигерии.

После смены в больнице он включает кольцевую лампу, крепит iPhone ко лбу и записывает бытовые действия от первого лица. Компания Micro1 из Пало-Альто собирает такие ролики у подрядчиков более чем в 50 странах, включая Индию, Нигерию и Аргентину, а потом продаёт их робототехническим компаниям. Кандидатов сначала отбирает ИИ-ассистент, а сами видео проходят автоматическую и ручную проверку перед разметкой.

складывание белья и глажка одежды мытьё посуды и уборка кухни готовка и работа с утварью перенос предметов по комнате * простая навигация в тесном домашнем пространстве Снаружи это выглядит как очень простая подработка: нужно двигаться естественно, держать руки в кадре и повторять знакомые домашние действия. Но именно в таких роликах модели учатся понимать захват предмета, изменение положения тела и базовые сценарии взаимодействия с вещами. Для части исполнителей это неплохой доход: Зевсу платят около $15 в час.

При этом работа быстро становится монотонной, а в маленькой квартире трудно придумать достаточно новых сцен и вариаций.

Зачем это роботам Последний бум в робототехнике во многом вырос из успеха больших языковых моделей.

Логика отрасли простая: если чат-боты научились на огромных массивах текста, то гуманоидов тоже можно обучать на больших массивах данных о движении. Проблема в том, что физический мир куда сложнее интернета. Симуляции неплохо подходят для ходьбы или демонстрационных трюков, но хуже передают силу нажима, трение, неточные движения и хаос реальной кухни, спальни или склада.

По оценке главы Micro1 Али Ансари, робототехнические компании уже тратят на покупку реальных данных больше $100 млн в год. В 2025 году инвесторы вложили в гуманоидных роботов свыше $6 млрд, а за такие данные охотятся не только Micro1: похожие программы развивают Scale AI и Encord, DoorDash платит курьерам за съёмку бытовых задач, а в Китае работников учат движениям через VR-гарнитуры и экзоскелеты в специальных центрах. Даже при таком масштабе рынок пока только строит инфраструктуру сбора данных.

«Это займёт больше времени, чем многие думают».

Эта оценка, которую в материале разделяют и эксперты по робототехнике, хорошо описывает текущее состояние рынка и ожидания отрасли. Даже десятки и сотни тысяч часов видео пока не выглядят достаточным объёмом для по-настоящему универсальных роботов. Отрасли ещё только предстоит понять, какие данные реально полезны, сколько вариаций нужно для надёжного обучения и можно ли собрать такой массив без резкого роста затрат и падения качества.

Где начинаются риски Самая очевидная проблема — приватность.

Компании просят не показывать лица, имена, номера телефонов и другие явные идентификаторы. Но даже без этого ролики всё равно фиксируют интерьер квартиры, личные вещи, привычки, детей, соседей и распорядок дня. Для семейных исполнителей задача особенно неудобная: нужно постоянно следить, чтобы в кадр не попал ребёнок или кто-то из соседей.

В итоге «данные для робота» оказываются очень подробной записью чужой повседневной жизни. Есть и вторая проблема — качество и прозрачность всей цепочки. Опрошенные работники понимают, что помогают обучать роботов, но часто не знают, как именно записи будут храниться, кому их передадут и можно ли потом добиться удаления.

Робототехники при этом предупреждают, что домашние привычки не всегда безопасны и не всегда годятся как образец для машины. Если робот усвоит неудачные паттерны из бытовых видео, ошибки проявятся уже в реальной работе, а проконтролировать это при потоке роликов от тысяч людей очень сложно.

Что это значит

Бум гуманоидных роботов сегодня держится не только на новых моделях и железе, но и на скрытом рынке ручного труда, который поставляет отрасли данные о повседневной жизни. Если компании хотят довести домашних и промышленных роботов до массового применения, им придётся решать не только задачу обучения, но и вопросы согласия, приватности и качества данных. Иначе «последняя миля» автоматизации окажется намного длиннее, чем обещают презентации.

ЖХ
Hamidun News
AI‑новости без шума. Ежедневный редакторский отбор из 400+ источников. Продукт Жемала Хамидуна, Head of AI в Alpina Digital.
Загружаем комментарии…