MarkTechPost→ оригинал

Top 10 des modèles d'IA physique qui contrôlent les robots réels en 2026

Une nouvelle classe de modèles d'IA physique contrôle déjà les robots dans les usines et les entrepôts — des systèmes entraînés à agir dans le monde physique pl

Top 10 des modèles d'IA physique qui contrôlent les robots réels en 2026
Источник: MarkTechPost. Коллаж: Hamidun News.

Новый класс фундаментальных моделей — обученных не на тексте, а на физических действиях — уже работает на реальном железе в заводских цехах, логистических центрах и исследовательских лабораториях по всему миру. За 18 месяцев разрыв между возможностями языковых моделей и реальным роботизированным развёртыванием резко сократился.

Что такое

Physical AI Физические AI-модели (Policy Models) принципиально отличаются от обычных LLM: они принимают на вход потоки с камер, данные инерциальных датчиков и положение суставов — и выдают конкретные двигательные команды в реальном времени. Задача не «ответить на вопрос», а «взять предмет и переложить в нужное место» или «собрать компонент на конвейере». Три главных архитектурных направления в 2026 году: VLA (Vision-Language-Action) — понимают языковые инструкции и преобразуют их в физические действия Диффузионные политики — генеративный подход к планированию траекторий движения * Трансформеры для сенсоров — унифицированная обработка данных с камер, лидаров и тактильных датчиков ## Десять систем, которые работают сейчас Pi0 (Physical Intelligence) — первая универсальная политика с предобучением на разнородном парке роботов.

Стартап собрал десятки тысяч часов телеоперационных данных на разных платформах. Итоговая модель дообучается под конкретную платформу за несколько часов — в отличие от традиционных систем управления, требующих месяцев разработки. RT-2 (Google DeepMind) показал, что VLA-подход переносит «здравый смысл» из интернет-данных в физические задачи: разбор стола, навигацию по незнакомым помещениям, манипуляции с объектами по словесным инструкциям.

Модель понимает абстрактные команды вроде «принеси что-нибудь для утоления жажды». Isaac GR00T (NVIDIA) — фундаментальная модель для гуманоидных роботов. Обучается в фотореалистичном симуляторе Omniverse с синтетическими данными, затем переносится на физические платформы через domain randomization.

OpenVLA — open-source VLA от консорциума академических лабораторий, ставший стандартной базой для исследований. Веса открыты, активное сообщество публикует дообученные версии для разных задач — от складских операций до медицинских манипуляторов. Octo — лёгкая дообучаемая архитектура для кастомных задач, достаточно компактная, чтобы работать на бортовых GPU без постоянного облачного подключения.

Замыкают список: модели Figure AI и 1X Technologies для гуманоидных платформ, RoboFlamingo (расширение OpenFlamingo для предметных манипуляций), CrossFormer (политика для роботов с разным числом степеней свободы) и UniSim — предобученная на синтетических данных без единой реальной демонстрации.

Данные стали главным узким местом

Все успешные физические модели объединяет одно: миллионы часов телеоперации в обучающей выборке. Pi0 и аналоги активно расширяют парки операторских роботов именно для сбора данных — каждая новая демонстрация повышает точность политики. Синтетические данные из симуляторов помогают, но пока не заменяют реальные записи полностью. В отличие от LLM, масштабирование вычислений здесь работает иначе: главный ресурс — разнообразие физических сценариев. Это открывает возможности для игроков с уникальным доступом к производственным данным.

Что это значит Физический AI вышел из стадии proof-of-concept в реальное производство.

Компании, занимающиеся промышленной автоматизацией, получили готовые базовые модели — примерно так же, как предобученные веса изменили компьютерное зрение десять лет назад. Вопрос больше не в том, будут ли роботы управляться фундаментальными моделями — вопрос в том, кто первым адаптирует их к своим задачам.

ЖХ
Hamidun News
AI‑новости без шума. Ежедневный редакторский отбор из 400+ источников. Продукт Жемала Хамидуна, Head of AI в Alpina Digital.
Загружаем комментарии…