Habr AI→ original

Google combina Street View e IA para criar mundos virtuais de treinamento

Google revelou uma nova versão do Project Genie — uma IA que gera mundos 3D totalmente funcionais a partir de coordenadas do Google Street View. Robôs podem tre

Google combina Street View e IA para criar mundos virtuais de treinamento
Fonte: Habr AI. Colagem: Hamidun News.
◐ Ouvir artigo

Google apresentou uma atualização do Project Genie — um modelo generativo que cria mundos 3D totalmente funcionais vinculados às coordenadas reais do Google Street View. Pela primeira vez, a IA ganhou a capacidade não apenas de gerar vídeo, mas de criar ambientes virtuais interativos onde os robôs podem aprender sem contato com o mundo físico.

O que são world models

Os world models diferem da geração comum de vídeo porque não apenas desenham uma sequência de quadros — eles constroem compreensão da física, causalidade e estrutura tridimensional do mundo. O modelo aprende a partir de vídeos e exemplos de interação, e depois consegue prever o que acontecerá se um robô realizar uma ação específica. Um robô treinado em tal modelo pode planejar trajetórias, evitar obstáculos e praticar habilidades complexas de navegação em um ambiente virtual e depois aplicar esse conhecimento à realidade. Isso é significativamente diferente de modelos de vídeo como o Sora, que simplesmente geram sequências de vídeo plausíveis sem compreensão completa da física.

Genie 3 e Google Street View

Google integrou o Project Genie com seu próprio banco de dados Google Street View — milhões de fotografias de ruas de todo o mundo com coordenadas conhecidas e geometria tridimensional. Agora é possível selecionar um lugar real (por exemplo, uma praça em Londres ou uma rua em Nova York) e a IA gerará um mundo 3D completo desse lugar com proporções corretas. Os robôs podem treinar em rotas de cidades reais sem sair do data center. Isso é crítico para sistemas autônomos: em vez de milhões de horas de condução real, um veículo aprende em um ambiente virtual acelerado. A Waymo já está testando essa abordagem para seus veículos autônomos.

  • Vinculação às coordenadas reais do Google Street View
  • Geração de geometria 3D completa com física
  • Ambiente interativo onde um robô atua e vê resultados
  • Escalabilidade: mundos podem ser gerados para qualquer lugar da Terra

Pipeline de produção: Unity e Blender

O mais importante na nova versão é a integração com ferramentas que os desenvolvedores já usam. Google adicionou conectores MCP para Unity e Blender, permitindo que os mundos gerados sejam usados diretamente nos engines favoritos sem exportação e conversão. Um desenvolvedor pode selecionar um lugar no Google Street View, obter uma cena 3D pronta, importá-la para Unity ou Blender e adicionar lógica, personagens e interatividade. Anteriormente, esse processo exigia semanas de trabalho manual de artistas 3D. Agora a cena inicial é gerada automaticamente em minutos.

Por que isso muda gamedev e robótica

Para robótica, isso é uma aceleração de meses de desenvolvimento. Para gamedev — uma redução na barreira de entrada para desenvolvedores indie que antes ou contratavam artistas caros ou usavam assets prontos. Uma cidade baseada em um lugar real agora é gerada em segundos. A Waymo, Boston Dynamics e outras empresas provaram que a simulação de qualidade é crítica para IA prática. O Genie 3 torna a simulação escalável e vinculada à realidade.

O que isso significa

Os world models estão saindo dos laboratórios de pesquisa para uma ferramenta de trabalho. O próximo estágio da IA em robótica e gamedev não será sobre geração de vídeo, mas sobre criar um mundo interativo no qual um agente possa agir e aprender. Google já mostrou como isso funciona na prática.

ZK
Hamidun News
Notícias de AI sem ruído. Seleção editorial diária de mais de 400 fontes. Produto de Zhemal Khamidun, Head of AI na Alpina Digital.
O que você acha?
Carregando comentários…