NVIDIA apresenta SANA-WM: modelo para vídeos de 60 segundos em 720p em uma única GPU
A NVIDIA apresentou o SANA-WM, um modelo aberto para geração de vídeo com controle preciso de câmera. O modelo cria vídeos de um minuto em 720p e pode rodar em

NVIDIA apresentou SANA-WM — um modelo de mundo aberto para geração de vídeo com controle de câmera. O modelo cria vídeos de 60 segundos em 720p com controle 6-DoF preciso e pode ser executado em um único RTX 5090.
Como funciona SANA-WM
SANA-WM é o que se chama modelo de mundo, um simulador do mundo físico. Em vez de simplesmente unir imagens em vídeo, o modelo aprende como o mundo físico responde às ações: se você girar a câmera para a esquerda, os objetos no quadro se movem corretamente. O modelo contém 2,6 bilhões de parâmetros e foi treinado em 64 GPUs H100.
Principais capacidades do SANA-WM:
- Geração de vídeos de 60 segundos em 720p (1280×720)
- Controle preciso de câmera através de controle 6-DoF (posição e orientação)
- Execução em um único RTX 5090 sem serviços na nuvem
- Código aberto para experimentação e adaptação
- Suporte para escalabilidade: de pesquisa científica a produção
Por que isso importa para criadores de vídeo
Antes do SANA-WM, geradores de vídeo eram ou serviços na nuvem (caros) ou exigiam equipamento especializado. SANA-WM muda isso: funciona localmente, rapidamente e sem assinaturas. Um estúdio pode gerar cenários de vídeo, visualizações quadro a quadro e rascunhos em minutos, sem dependência de nuvem.
Para diretores e animadores, isso significa a capacidade de testar rapidamente ideias de storyboard visual. Para artistas 3D — uma maneira de automatizar a criação de transições de câmera em cenas complexas. Para profissionais de marketing — gerar rapidamente um vídeo promocional com dinâmica de movimento necessária e ângulos de visualização.
O que isso significa
SANA-WM simboliza a transição de geradores de vídeo baseados em nuvem para ferramentas locais. Assim como a GPU tornou a renderização 3D acessível em cada computador, os modelos de mundo estão começando a tornar a geração de vídeo acessível. Para a indústria, isso é uma aceleração da adoção de AI em processos criativos — não porque os modelos de repente ficaram mais inteligentes, mas porque agora podem funcionar em todos os lugares.