36Kr (36氪)→ оригинал

Robots en la trampa de los datos: por qué los videos de saltos mortales son solo el comienzo

Los videos virales crean la ilusión de un avance tecnológico, pero el progreso real se ve frenado por una "crisis de datos". A diferencia de la AI basada en tex

Robots en la trampa de los datos: por qué los videos de saltos mortales son solo el comienzo
Источник: 36Kr (36氪). Коллаж: Hamidun News.
◐ Слушать статью

# Роботы в ловушке данных: почему видео с сальто — это только начало

За последний год интернет наводнили видео с впечатляющими трюками: роботы прыгают, танцуют, кидают удары, разбивают ногой арбузы. Инвестиции растут, СМИ пестрят оптимистичными заголовками, публика уверена — эра домашних роботов-помощников вот-вот начнётся. Но если заглянуть за кулисы этого технологического театра, картина оказывается намного сложнее и печальнее. Прямо сейчас, в тихих центрах подготовки данных по всему Китаю, человеческие операторы в перчатках медленно, почти мучительно управляют манипуляторами — учат машины поднимать детали, складывать инструменты, закрывать крышки коробок. Это зрелище лишено всей кинематографичности вирусных видео, но именно оно определяет реальный прогресс в области робототехники. Дело в том, что путь от впечатляющего трюка к полезному домашнему помощнику преграждает одна фундаментальная проблема: катастрофический дефицит качественных данных.

Языковые модели вроде ChatGPT и DeepSeek построены на триумфе простой логики — тысячи миллиардов текстовых примеров из интернета позволили AI понять язык и начать генерировать осмысленный контент. Но робототехника столкнулась с совсем другой реальностью. Если текстовые данные живут в двумерном цифровом пространстве, их легко копировать и распространять, то физический мир — это многомерный, непрерывный поток информации. Робот должен воспринимать мир через множество каналов одновременно: видео с нескольких камер, силовые датчики, датчики касания, информация о положении суставов. Каждая совершённая манипулятором операция генерирует структурированные данные — 57 измерений в некоторых системах. И все эти потоки должны быть идеально синхронизированы вплоть до миллисекунды, иначе модель обучится чистой галлюцинации вместо причинно-следственной связи.

В Китае уже действуют более пятидесяти центров сбора и обработки робототехнических данных. Только в Пекине один такой центр производит около шести тысяч записей тренировочных примеров ежедневно. Если грубо экстраполировать, годовое производство может достичь десятков миллиардов примеров. Звучит внушительно, но на самом деле это капля в океане потребностей. Эксперты из компании PowerTech провели консервативный расчёт: чтобы робот научился одному движению, нужно примерно одна-пять тысяч примеров. Простая задача, состоящая из нескольких движений — десять-двадцать тысяч. Но если говорить об универсальном роботе, способном справляться с восьмьюдесятью процентами человеческих работ в одной отрасли, потребуется стомиллионный датасет. А если амбиции простираются на тысячи отраслей — говорим о триллионах примеров. Дефицит составляет четыре-пять порядков величины.

Но это ещё не самая серьёзная проблема. Куда более коварной оказалась несовместимость оборудования. Разные производители создают роботов с разными конфигурациями датчиков, разными протоколами управления, разными физическими параметрами. Данные, собранные на одной модели манипулятора, зачастую просто не работают на другой — язык одной машины остаётся совершенно чужим для другой. Это значит, что знания не складываются, не накапливаются в единый актив индустрии. Каждый производитель вынужден собирать свой датасет с нуля, раз за разом повторяя одну и ту же дорогостоящую работу.

Некоторые центры справляются с этой дилеммой, сосредоточиваясь на популярных моделях — фактически игнорируя разнообразие. Другие идут более амбициозным путём: собирают данные с роботов разных производителей в едином пространстве, пытаясь научить модель обобщать знания на разнородное оборудование. Ни один подход ещё не доказал свою универсальность.

Всё это напоминает ранние дни автопилота — эпоху, когда казалось, что проблема в алгоритмах, а не в данных. Прошло почти двадцать лет, миллиарды инвестиций, и оказалось, что истина где-то рядом, но не совсем там, где её ищут. До того, как роботы действительно войдут в наши дома, должна пройти ещё долгая и скучная работа в центрах данных, где люди в перчатках будут терпеливо учить машины понимать физический мир. Вирусные видео — это маркетинг. Реальный прогресс — это совсем другая история.

ЖХ
Hamidun News
AI‑новости без шума. Ежедневный редакторский отбор из 400+ источников. Продукт Жемала Хамидуна, Head of AI в Alpina Digital.
Загружаем комментарии…