MarkTechPost→ original

NVIDIA apresenta SANA-WM: modelo para vídeos de 60 segundos em 720p em uma única GPU

A NVIDIA apresentou o SANA-WM, um modelo aberto para geração de vídeo com controle preciso de câmera. O modelo cria vídeos de um minuto em 720p e pode rodar em

NVIDIA apresenta SANA-WM: modelo para vídeos de 60 segundos em 720p em uma única GPU
Fonte: MarkTechPost. Colagem: Hamidun News.
◐ Ouvir artigo

NVIDIA apresentou SANA-WM — um modelo de mundo aberto para geração de vídeo com controle de câmera. O modelo cria vídeos de 60 segundos em 720p com controle 6-DoF preciso e pode ser executado em um único RTX 5090.

Como funciona SANA-WM

SANA-WM é o que se chama modelo de mundo, um simulador do mundo físico. Em vez de simplesmente unir imagens em vídeo, o modelo aprende como o mundo físico responde às ações: se você girar a câmera para a esquerda, os objetos no quadro se movem corretamente. O modelo contém 2,6 bilhões de parâmetros e foi treinado em 64 GPUs H100.

Principais capacidades do SANA-WM:

  • Geração de vídeos de 60 segundos em 720p (1280×720)
  • Controle preciso de câmera através de controle 6-DoF (posição e orientação)
  • Execução em um único RTX 5090 sem serviços na nuvem
  • Código aberto para experimentação e adaptação
  • Suporte para escalabilidade: de pesquisa científica a produção

Por que isso importa para criadores de vídeo

Antes do SANA-WM, geradores de vídeo eram ou serviços na nuvem (caros) ou exigiam equipamento especializado. SANA-WM muda isso: funciona localmente, rapidamente e sem assinaturas. Um estúdio pode gerar cenários de vídeo, visualizações quadro a quadro e rascunhos em minutos, sem dependência de nuvem.

Para diretores e animadores, isso significa a capacidade de testar rapidamente ideias de storyboard visual. Para artistas 3D — uma maneira de automatizar a criação de transições de câmera em cenas complexas. Para profissionais de marketing — gerar rapidamente um vídeo promocional com dinâmica de movimento necessária e ângulos de visualização.

O que isso significa

SANA-WM simboliza a transição de geradores de vídeo baseados em nuvem para ferramentas locais. Assim como a GPU tornou a renderização 3D acessível em cada computador, os modelos de mundo estão começando a tornar a geração de vídeo acessível. Para a indústria, isso é uma aceleração da adoção de AI em processos criativos — não porque os modelos de repente ficaram mais inteligentes, mas porque agora podem funcionar em todos os lugares.

ZK
Hamidun News
Notícias de AI sem ruído. Seleção editorial diária de mais de 400 fontes. Produto de Zhemal Khamidun, Head of AI na Alpina Digital.
O que você acha?
Carregando comentários…