NVIDIA представила SANA-WM: модель для 60-секундных видео в 720p на одном GPU
NVIDIA представила SANA-WM — открытую модель для генерации видео с точным управлением камерой. Модель создаёт минутные видео в 720p и может запускаться на одном

NVIDIA представила SANA-WM — открытую модель мира для генерации видео с управлением камерой. Модель создаёт 60-секундные видео в 720p с точной 6-DoF контролем и может работать на одном RTX 5090.
Как устроена SANA-WM SANA-WM — это так называемый world model, модель-имитатор физического мира.
Вместо того чтобы просто соединять картинки в видео, модель учится тому, как физический мир реагирует на действия: если вы повернули камеру влево, объекты в кадре движутся правильно. Модель содержит 2.6 млрд параметров и тренировалась на 64 H100 GPUs.
Ключевые возможности SANA-WM: Генерация 60-секундных видео в 720p (1280×720) Точное управление камерой через 6-DoF контроль (позиция и ориентация) Работа на одном RTX 5090 без облачных сервисов Открытый исходный код для экспериментов и адаптации * Поддержка масштабирования: от научных исследований до production ## Почему это важно для видеотворцов До SANA-WM генераторы видео были либо облачными сервисами (дорогие), либо требовали специального оборудования. SANA-WM меняет это: работает локально, быстро и без подписок. Студия может генерировать видео-сценарии, покадровые визуализации и черновики за минуты, без привязки к облаку.
Для режиссёров и аниматоров это значит возможность быстро проверить идею визуального плана. Для 3D-художников — способ автоматизировать создание переходов камеры в сложных сценах. Для маркетологов — быстро сгенерировать проморолик с нужными динамикой движения и углами обзора.
Что это значит SANA-WM символизирует переход от облачных видеогенераторов к локальным инструментам.
Как когда-то GPU сделали 3D-рендеринг доступным на каждом компьютере, world models начинают делать видеогенерацию доступной. Для индустрии это ускорение внедрения AI в творческие процессы — не потому что модели резко стали умнее, а потому что они стали работать везде.