Google combina Street View e IA para crear mundos virtuales de entrenamiento
Google presentó una nueva versión de Project Genie — una IA que genera mundos 3D completamente funcionales basados en coordenadas de Google Street View. Los rob

Google presentó una actualización de Project Genie — un modelo generativo que crea mundos 3D totalmente funcionales vinculados a las coordenadas reales de Google Street View. Por primera vez, la IA ganó la capacidad no solo de generar vídeo, sino de crear entornos virtuales interactivos donde los robots pueden aprender sin contacto con el mundo físico.
Qué son los world models
Los world models se diferencian de la generación común de vídeo en que no simplemente dibujan una secuencia de fotogramas — construyen comprensión de la física, causalidad y estructura tridimensional del mundo. El modelo aprende a partir de vídeos y ejemplos de interacción, y luego puede predecir qué sucederá si un robot realiza una acción específica. Un robot entrenado en tal modelo puede planificar trayectorias, evitar obstáculos y practicar habilidades complejas de navegación en un entorno virtual, y luego aplicar este conocimiento a la realidad. Esto es significativamente diferente de modelos de vídeo como Sora, que simplemente generan secuencias de vídeo plausibles sin comprensión completa de la física.
Genie 3 y Google Street View
Google integró Project Genie con su propia base de datos Google Street View — millones de fotografías de calles de todo el mundo con coordenadas conocidas y geometría tridimensional. Ahora es posible seleccionar un lugar real (por ejemplo, una plaza en Londres o una calle en Nueva York) y la IA generará un mundo 3D completo de ese lugar con proporciones correctas. Los robots pueden entrenar en rutas de ciudades reales sin abandonar el data center. Esto es crítico para los sistemas autónomos: en lugar de millones de horas de conducción real, un vehículo aprende en un entorno virtual acelerado. Waymo ya está probando este enfoque para sus vehículos autónomos.
- Vinculación a coordenadas reales de Google Street View
- Generación de geometría 3D completa con física
- Entorno interactivo donde un robot actúa y ve resultados
- Escalabilidad: se pueden generar mundos para cualquier lugar de la Tierra
Pipeline de producción: Unity y Blender
Lo más importante en la nueva versión es la integración con herramientas que los desarrolladores ya utilizan. Google agregó conectores MCP para Unity y Blender, permitiendo que los mundos generados se utilicen directamente en los motores favoritos sin exportación y conversión. Un desarrollador puede seleccionar un lugar en Google Street View, obtener una escena 3D lista, importarla en Unity o Blender y agregar lógica, personajes e interactividad. Anteriormente, este proceso requería semanas de trabajo manual de artistas 3D. Ahora la escena inicial se genera automáticamente en minutos.
Por qué esto cambia gamedev y robótica
Para robótica, esto es una aceleración de meses de desarrollo. Para gamedev — una reducción en la barrera de entrada para desarrolladores indie que antes contrataban artistas costosos o usaban assets listos. Una ciudad basada en un lugar real ahora se genera en segundos. Waymo, Boston Dynamics y otras empresas han demostrado que la simulación de calidad es crítica para la IA práctica. Genie 3 hace que la simulación sea escalable y vinculada a la realidad.
Qué significa esto
Los world models están transitando de los laboratorios de investigación a una herramienta de trabajo. La siguiente etapa de la IA en robótica y gamedev no será sobre generación de vídeo, sino sobre crear un mundo interactivo en el que un agente pueda actuar y aprender. Google ya ha demostrado cómo funciona esto en la práctica.