DeepMind Blog→ original

Project Genie do DeepMind aprendeu a simular lugares reais do Google Street View

A DeepMind expandiu o acesso ao modelo interativo Project Genie para todos os assinantes do Google AI Ultra em todo o mundo. A principal novidade é a integração

Processado por IA de DeepMind Blog; editado por Hamidun News
Project Genie do DeepMind aprendeu a simular lugares reais do Google Street View
Fonte: DeepMind Blog. Colagem: Hamidun News.
◐ Ouvir artigo

A DeepMind expandiu o acesso ao Project Genie para todos os assinantes do Google AI Ultra em todo o mundo e apresentou uma nova capacidade de integração com o Google Street View, que permite simular vídeos interativos de lugares geográficos reais.

O que é Project Genie

Project Genie é um modelo avançado de vídeo generativo da Google DeepMind que cria cenas de vídeo interativas com base em descrições de texto ou imagens. Diferentemente dos geradores de vídeo convencionais, que simplesmente reproduzem conteúdo pré-gravado, o Genie constrói um mundo virtual dinâmico que responde às ações do agente em tempo real. O modelo pode mostrar uma pessoa (ou robô) em uma cena realizando várias ações: caminhar em diferentes direções, manipular objetos, interagir com o ambiente.

A cada ação, o vídeo é atualizado, refletindo as leis físicas e as relações de causa e efeito entre os eventos. Isso torna a experiência semelhante a controlar um personagem de jogo de vídeo, mas baseada em previsões de redes neurais, não em material pré-gravado.

Nova integração com Street View

O novo recurso combina os recursos do Project Genie com o Google Street View — um vasto arquivo de fotografias panorâmicas de milhões de lugares no globo terrestre. Agora, em vez de cenas imaginadas ou sintéticas, o agente pode interagir com locais reais: centros históricos de cidades, parques, espaços públicos, pontos turísticos. Isso transforma o Street View de uma galeria de fotos estática em um mundo virtual interativo. O usuário não apenas pode ver a foto panorâmica da Praça de São Pedro, mas literalmente 'caminhar' por ela, explorando detalhes arquitetônicos, olhando vitrines de lojas, interagindo com objetos, vendo como a imagem muda de acordo com suas ações.

Onde isso pode ser útil

A simulação de vídeo interativo de lugares reais abre numerosas aplicações práticas:

  • Planejamento de viagens e turismo — os turistas poderão visitar virtualmente uma atração turística antes de uma visita
  • Reabilitação e acessibilidade — pessoas com limitações de mobilidade poderão explorar remotamente espaços públicos
  • Arquitetura e planejamento urbano — os projetistas poderão simular como novos edifícios se integram aos espaços existentes
  • Robótica — redes neurais para robôs autônomos poderão treinar em cenários urbanos reais
  • Educação e cultura — visitas guiadas virtuais a locais históricos se tornarão totalmente interativas

Cada uma dessas aplicações exige do Genie um alto nível de realismo na previsão de processos físicos e comportamento humano.

Desafios técnicos

Gerar vídeos interativos reais requer enormes recursos computacionais. O modelo não deve apenas prever os próximos quadros de vídeo com alta precisão, mas fazer isso com latência mínima para que a interação pareça suave e realista. Pequenos erros na previsão da física ou dos movimentos humanos podem se acumular rapidamente, destruindo a ilusão de realidade.

Expansão do acesso

Até agora, Project Genie estava disponível apenas para um número limitado de usuários. Agora, o Google expande o acesso para todos os assinantes do Google AI Ultra em todo o mundo. Isso permitirá que mais desenvolvedores, pesquisadores e entusiastas experimentem com a geração interativa de vídeos de lugares reais. A expansão do acesso a uma tecnologia tão avançada sinaliza que o modelo atingiu um certo nível de estabilidade e prontidão para uso em aplicações reais.

O que isso significa

A linha entre informação estática (fotos, vídeos, mapas) e simulações de IA interativas está gradualmente se desvanecendo. Project Genie em combinação com Street View é um passo significativo para criar uma 'realidade interativa alternativa' baseada em dados geográficos reais. No futuro, as pessoas não apenas poderão olhar para lugares, mas também explorá-los ativamente, interagir com objetos e ambientes, treinar sistemas de IA com base em simulações. Isso muda fundamentalmente como consumimos informações sobre o mundo e interagimos com o espaço geográfico.

ZK
Hamidun News
Notícias de AI sem ruído. Seleção editorial diária de mais de 400 fontes. Produto de Zhemal Khamidun, Head of AI na Alpina Digital.

Quer parar de ler sobre IA e começar a usar?

AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.

O que você acha?
Carregando comentários…