Google combina Street View e IA para criar mundos virtuais de treinamento
Google revelou uma nova versão do Project Genie — uma IA que gera mundos 3D totalmente funcionais a partir de coordenadas do Google Street View. Robôs podem tre

Google apresentou uma atualização do Project Genie — um modelo generativo que cria mundos 3D totalmente funcionais vinculados às coordenadas reais do Google Street View. Pela primeira vez, a IA ganhou a capacidade não apenas de gerar vídeo, mas de criar ambientes virtuais interativos onde os robôs podem aprender sem contato com o mundo físico.
O que são world models
Os world models diferem da geração comum de vídeo porque não apenas desenham uma sequência de quadros — eles constroem compreensão da física, causalidade e estrutura tridimensional do mundo. O modelo aprende a partir de vídeos e exemplos de interação, e depois consegue prever o que acontecerá se um robô realizar uma ação específica. Um robô treinado em tal modelo pode planejar trajetórias, evitar obstáculos e praticar habilidades complexas de navegação em um ambiente virtual e depois aplicar esse conhecimento à realidade. Isso é significativamente diferente de modelos de vídeo como o Sora, que simplesmente geram sequências de vídeo plausíveis sem compreensão completa da física.
Genie 3 e Google Street View
Google integrou o Project Genie com seu próprio banco de dados Google Street View — milhões de fotografias de ruas de todo o mundo com coordenadas conhecidas e geometria tridimensional. Agora é possível selecionar um lugar real (por exemplo, uma praça em Londres ou uma rua em Nova York) e a IA gerará um mundo 3D completo desse lugar com proporções corretas. Os robôs podem treinar em rotas de cidades reais sem sair do data center. Isso é crítico para sistemas autônomos: em vez de milhões de horas de condução real, um veículo aprende em um ambiente virtual acelerado. A Waymo já está testando essa abordagem para seus veículos autônomos.
- Vinculação às coordenadas reais do Google Street View
- Geração de geometria 3D completa com física
- Ambiente interativo onde um robô atua e vê resultados
- Escalabilidade: mundos podem ser gerados para qualquer lugar da Terra
Pipeline de produção: Unity e Blender
O mais importante na nova versão é a integração com ferramentas que os desenvolvedores já usam. Google adicionou conectores MCP para Unity e Blender, permitindo que os mundos gerados sejam usados diretamente nos engines favoritos sem exportação e conversão. Um desenvolvedor pode selecionar um lugar no Google Street View, obter uma cena 3D pronta, importá-la para Unity ou Blender e adicionar lógica, personagens e interatividade. Anteriormente, esse processo exigia semanas de trabalho manual de artistas 3D. Agora a cena inicial é gerada automaticamente em minutos.
Por que isso muda gamedev e robótica
Para robótica, isso é uma aceleração de meses de desenvolvimento. Para gamedev — uma redução na barreira de entrada para desenvolvedores indie que antes ou contratavam artistas caros ou usavam assets prontos. Uma cidade baseada em um lugar real agora é gerada em segundos. A Waymo, Boston Dynamics e outras empresas provaram que a simulação de qualidade é crítica para IA prática. O Genie 3 torna a simulação escalável e vinculada à realidade.
O que isso significa
Os world models estão saindo dos laboratórios de pesquisa para uma ferramenta de trabalho. O próximo estágio da IA em robótica e gamedev não será sobre geração de vídeo, mas sobre criar um mundo interativo no qual um agente possa agir e aprender. Google já mostrou como isso funciona na prática.