How OpenAI, Google, and Figure Are Changing Robot Training: A Brief History of the Approach
Until recently, robotics operated in "dream of C-3PO, release Roomba" mode. Now the logic is shifting: instead of hard-coded rules, robots are trained on simula

Робототехника переживает не просто очередной виток развития железа, а смену самой логики обучения: машины все реже программируют вручную и все чаще тренируют на данных, симуляциях и больших мультимодальных моделях. Долгое время у отрасли был заметный разрыв между амбициями и результатом. Инженеры мечтали о роботах уровня научной фантастики — универсальных помощниках, которые могут перемещаться по обычному миру, понимать людей и безопасно выполнять десятки задач.
На практике рынок десятилетиями жил в основном за счет более узких систем: роботизированных рук для фабрик, складских манипуляторов и бытовых устройств вроде роботов-пылесосов. Причина была не в недостатке механики, а в том, что роботы плохо справлялись с непредсказуемой средой. Любое отклонение от сценария — новый предмет, другой угол обзора, изменившееся освещение — быстро ломало их поведение.
Первый большой сдвиг пришел вместе с обучением через пробу и ошибку. В 2010-х робототехники начали активно использовать reinforcement learning и симуляторы, где машина может тренироваться миллионы раз без риска разбить дорогое оборудование. Один из показательных примеров — роботизированная рука OpenAI Dactyl, которую обучали в симуляции манипулировать кубиком Рубика, а затем переносили навык в реальный мир.
Ключевой идеей стала domain randomization: во время тренировки менялись параметры среды, трение, масса объектов, картинка с камер и другие детали. Так робот учился не одному идеальному сценарию, а устойчивому поведению в широком диапазоне условий. Параллельно развивалось и обучение по демонстрациям: роботов стали учить, показывая им человеческие действия, а не прописывая каждое правило вручную.
Но и этого было мало. Симуляции ускоряли обучение, однако разрыв между виртуальной и физической средой никуда не исчезал, а реальные данные оставались дорогими и редкими. Поэтому следующий этап начался тогда, когда робототехника подхватила подходы из бума больших моделей.
Вместо отдельных систем под одну задачу исследователи начали собирать большие наборы траекторий, изображений, текстовых инструкций и действий. У Google модель RT-1 обучали на 130 тысячах эпизодов, собранных флотом из 13 роботов, охватывающих более 700 задач. А RT-2 пошла дальше: она объединила робототехнические данные с веб-данными vision-language моделей, чтобы робот мог не только повторять знакомое движение, но и делать более общие выводы из команды на естественном языке.
Этот же поворот виден в проектах, которые пытаются масштабировать обучение сразу на разные типы машин. В наборе Open X-Embodiment исследователи собрали данные с 22 роботов от 21 институции и описали сотни навыков, чтобы модели могли перенимать опыт между платформами, а не начинать с нуля для каждого нового манипулятора. Поверх этого строится идея foundation-моделей для физического мира: один базовый интеллект дообучается под конкретный корпус, хвататель или рабочую среду.
Стартапы вроде Figure, Apptronik, Covariant и Physical Intelligence строят вокруг этого уже не только исследовательскую, но и коммерческую стратегию. На этом фоне оживился и рынок. В 2025 году компании и инвесторы вложили в гуманоидных роботов 6,1 миллиарда долларов — в четыре раза больше, чем годом ранее.
Деньги идут не потому, что роботы уже все умеют, а потому, что появился более правдоподобный путь их дообучения в реальной среде. При этом до универсального робота по-прежнему далеко. Машинам все еще тяжело даются длинные последовательности действий, тонкая манипуляция несколькими объектами сразу, работа в захламленных пространствах и безопасное взаимодействие с человеком без заранее подготовленной сцены.
В отличие от языковых моделей, робот не может просто ошибиться в тексте: его промах означает падение предмета, поломку, простой или риск для человека. Поэтому отрасль движется через гибридный путь: больше симуляций, больше реальных данных с флотов, больше общих моделей, но и больше ограничений со стороны безопасности и экономики. Главный вывод простой: прорыв в робототехнике сейчас связан не столько с новым типом корпуса, сколько с новой моделью обучения.
Отрасль переходит от мира, где каждое движение нужно было заранее прописать, к миру, где поведение можно сначала выучить, потом перенести на другой робот и дальше улучшать в эксплуатации. Это еще не обещанный домашний андроид из фантастики, но уже понятная инженерная траектория, из-за которой роботы снова стали большой ставкой для исследователей и инвесторов.