Jiqizhixin (机器之心)→ оригинал

Мировые модели: почему видеогенераторы — это не про кино, а про физику реальности

Пока все обсуждают красивые ролики, индустрия переключается на концепцию «мировых моделей». Это попытка создать ИИ, который понимает причинно-следственные связи

Мировые модели: почему видеогенераторы — это не про кино, а про физику реальности
Источник: Jiqizhixin (机器之心). Коллаж: Hamidun News.

Когда OpenAI выпустила Sora, все бросились обсуждать, как скоро Голливуд отправится на свалку истории. Но если отбросить восторги по поводу шерсти мамонтов и неоновых вывесок Токио, в сухом остатке останется нечто более фундаментальное. Мы наблюдаем переход от простого предсказания следующего пикселя к созданию полноценных мировых моделей.

Это не просто смена терминологии, а тектонический сдвиг в том, как машины воспринимают нашу реальность. Долгое время ИИ жил в мире текста и статических картинок, но теперь он пытается освоить концепцию времени и причинно-следственных связей. Зачем вообще нужно моделировать мир?

Представьте, что вы хотите научить робота варить кофе. Раньше вам приходилось либо прописывать тысячи строк кода, либо заставлять машину миллионы раз ошибаться в реальности, ломая чашки и заливая пол водой. Мировая модель позволяет ИИ «проигрывать» эти сценарии в голове, используя универсальный симулятор мира.

Это своего рода цифровое воображение, которое опирается не на фантазии, а на усвоенные законы физики. Ирония в том, что эти законы ИИ выводит сам, просто просматривая терабайты видео, без единой формулы из учебника Ньютона. Проблема в том, что нынешние модели всё еще склонны к «физическим галлюцинациям».

Вы наверняка видели видео, где люди проходят сквозь стены или объекты бесследно исчезают. Это происходит потому, что нейросети пока не понимают суть объектов, они лишь мастера вероятностей. Однако новые подходы в исследованиях направлены на то, чтобы внедрить в архитектуру моделей понимание пространства и времени через скрытые представления.

Это позволит ИИ не просто рисовать кадры, а понимать, что если мяч катится к краю стола, он неизбежно упадет вниз, а не превратится в бабочку. Для индустрии это означает конец эпохи «черных ящиков», которые просто выдают результат. Мы движемся к системам, которые могут обосновать свои действия через симуляцию последствий.

Компании вроде Wayve или Tesla уже используют подобия мировых моделей для автопилотов, но амбиции исследователей идут дальше. Они хотят создать единую среду, где ИИ сможет тестировать научные гипотезы или проектировать новые материалы, проверяя их прочность в виртуальном мире, который идентичен нашему. Что это значит для нас с вами?

Скорее всего, в ближайшие пару лет мы увидим взрывной рост в робототехнике. Роботы перестанут быть неуклюжими железками, потому что они придут в наш мир уже «опытными», прожив тысячи виртуальных жизней в симуляторах. Видеогенерация останется приятным бонусом для контент-мейкеров, но настоящий прорыв случится там, где ИИ начнет предсказывать поведение сложных систем — от климатических изменений до сворачивания белков.

Мы наконец-то учим машины не просто подражать нам, а понимать, как устроена сцена, на которой мы все играем. Главное: Станет ли ИИ полноценным «цифровым богом» или так и останется продвинутым видеоплеером с галлюцинациями? Ответ кроется в том, удастся ли нам научить его не просто смотреть, но и осознавать инерцию, трение и гравитацию.

ЖХ
Hamidun News
AI‑новости без шума. Ежедневный редакторский отбор из 400+ источников. Продукт Жемала Хамидуна, Head of AI в Alpina Digital.
Загружаем комментарии…