MarkTechPost→ оригинал

Top 10 Physical AI Models Controlling Real Robots in 2026

A new class of physical AI models is already controlling robots in factories and warehouses — systems trained to act in the physical world rather than generate

Top 10 Physical AI Models Controlling Real Robots in 2026
Источник: MarkTechPost. Коллаж: Hamidun News.

Новый класс фундаментальных моделей — обученных не на тексте, а на физических действиях — уже работает на реальном железе в заводских цехах, логистических центрах и исследовательских лабораториях по всему миру. За 18 месяцев разрыв между возможностями языковых моделей и реальным роботизированным развёртыванием резко сократился.

Что такое

Physical AI Физические AI-модели (Policy Models) принципиально отличаются от обычных LLM: они принимают на вход потоки с камер, данные инерциальных датчиков и положение суставов — и выдают конкретные двигательные команды в реальном времени. Задача не «ответить на вопрос», а «взять предмет и переложить в нужное место» или «собрать компонент на конвейере». Три главных архитектурных направления в 2026 году: VLA (Vision-Language-Action) — понимают языковые инструкции и преобразуют их в физические действия Диффузионные политики — генеративный подход к планированию траекторий движения * Трансформеры для сенсоров — унифицированная обработка данных с камер, лидаров и тактильных датчиков ## Десять систем, которые работают сейчас Pi0 (Physical Intelligence) — первая универсальная политика с предобучением на разнородном парке роботов.

Стартап собрал десятки тысяч часов телеоперационных данных на разных платформах. Итоговая модель дообучается под конкретную платформу за несколько часов — в отличие от традиционных систем управления, требующих месяцев разработки. RT-2 (Google DeepMind) показал, что VLA-подход переносит «здравый смысл» из интернет-данных в физические задачи: разбор стола, навигацию по незнакомым помещениям, манипуляции с объектами по словесным инструкциям.

Модель понимает абстрактные команды вроде «принеси что-нибудь для утоления жажды». Isaac GR00T (NVIDIA) — фундаментальная модель для гуманоидных роботов. Обучается в фотореалистичном симуляторе Omniverse с синтетическими данными, затем переносится на физические платформы через domain randomization.

OpenVLA — open-source VLA от консорциума академических лабораторий, ставший стандартной базой для исследований. Веса открыты, активное сообщество публикует дообученные версии для разных задач — от складских операций до медицинских манипуляторов. Octo — лёгкая дообучаемая архитектура для кастомных задач, достаточно компактная, чтобы работать на бортовых GPU без постоянного облачного подключения.

Замыкают список: модели Figure AI и 1X Technologies для гуманоидных платформ, RoboFlamingo (расширение OpenFlamingo для предметных манипуляций), CrossFormer (политика для роботов с разным числом степеней свободы) и UniSim — предобученная на синтетических данных без единой реальной демонстрации.

Данные стали главным узким местом

Все успешные физические модели объединяет одно: миллионы часов телеоперации в обучающей выборке. Pi0 и аналоги активно расширяют парки операторских роботов именно для сбора данных — каждая новая демонстрация повышает точность политики. Синтетические данные из симуляторов помогают, но пока не заменяют реальные записи полностью. В отличие от LLM, масштабирование вычислений здесь работает иначе: главный ресурс — разнообразие физических сценариев. Это открывает возможности для игроков с уникальным доступом к производственным данным.

Что это значит Физический AI вышел из стадии proof-of-concept в реальное производство.

Компании, занимающиеся промышленной автоматизацией, получили готовые базовые модели — примерно так же, как предобученные веса изменили компьютерное зрение десять лет назад. Вопрос больше не в том, будут ли роботы управляться фундаментальными моделями — вопрос в том, кто первым адаптирует их к своим задачам.

ЖХ
Hamidun News
AI‑новости без шума. Ежедневный редакторский отбор из 400+ источников. Продукт Жемала Хамидуна, Head of AI в Alpina Digital.
Загружаем комментарии…