Habr AI→ original

Google combina Street View e IA para crear mundos virtuales de entrenamiento

Google presentó una nueva versión de Project Genie — una IA que genera mundos 3D completamente funcionales basados en coordenadas de Google Street View. Los rob

Google combina Street View e IA para crear mundos virtuales de entrenamiento
Fuente: Habr AI. Collage: Hamidun News.
◐ Escuchar artículo

Google presentó una actualización de Project Genie — un modelo generativo que crea mundos 3D totalmente funcionales vinculados a las coordenadas reales de Google Street View. Por primera vez, la IA ganó la capacidad no solo de generar vídeo, sino de crear entornos virtuales interactivos donde los robots pueden aprender sin contacto con el mundo físico.

Qué son los world models

Los world models se diferencian de la generación común de vídeo en que no simplemente dibujan una secuencia de fotogramas — construyen comprensión de la física, causalidad y estructura tridimensional del mundo. El modelo aprende a partir de vídeos y ejemplos de interacción, y luego puede predecir qué sucederá si un robot realiza una acción específica. Un robot entrenado en tal modelo puede planificar trayectorias, evitar obstáculos y practicar habilidades complejas de navegación en un entorno virtual, y luego aplicar este conocimiento a la realidad. Esto es significativamente diferente de modelos de vídeo como Sora, que simplemente generan secuencias de vídeo plausibles sin comprensión completa de la física.

Genie 3 y Google Street View

Google integró Project Genie con su propia base de datos Google Street View — millones de fotografías de calles de todo el mundo con coordenadas conocidas y geometría tridimensional. Ahora es posible seleccionar un lugar real (por ejemplo, una plaza en Londres o una calle en Nueva York) y la IA generará un mundo 3D completo de ese lugar con proporciones correctas. Los robots pueden entrenar en rutas de ciudades reales sin abandonar el data center. Esto es crítico para los sistemas autónomos: en lugar de millones de horas de conducción real, un vehículo aprende en un entorno virtual acelerado. Waymo ya está probando este enfoque para sus vehículos autónomos.

  • Vinculación a coordenadas reales de Google Street View
  • Generación de geometría 3D completa con física
  • Entorno interactivo donde un robot actúa y ve resultados
  • Escalabilidad: se pueden generar mundos para cualquier lugar de la Tierra

Pipeline de producción: Unity y Blender

Lo más importante en la nueva versión es la integración con herramientas que los desarrolladores ya utilizan. Google agregó conectores MCP para Unity y Blender, permitiendo que los mundos generados se utilicen directamente en los motores favoritos sin exportación y conversión. Un desarrollador puede seleccionar un lugar en Google Street View, obtener una escena 3D lista, importarla en Unity o Blender y agregar lógica, personajes e interactividad. Anteriormente, este proceso requería semanas de trabajo manual de artistas 3D. Ahora la escena inicial se genera automáticamente en minutos.

Por qué esto cambia gamedev y robótica

Para robótica, esto es una aceleración de meses de desarrollo. Para gamedev — una reducción en la barrera de entrada para desarrolladores indie que antes contrataban artistas costosos o usaban assets listos. Una ciudad basada en un lugar real ahora se genera en segundos. Waymo, Boston Dynamics y otras empresas han demostrado que la simulación de calidad es crítica para la IA práctica. Genie 3 hace que la simulación sea escalable y vinculada a la realidad.

Qué significa esto

Los world models están transitando de los laboratorios de investigación a una herramienta de trabajo. La siguiente etapa de la IA en robótica y gamedev no será sobre generación de vídeo, sino sobre crear un mundo interactivo en el que un agente pueda actuar y aprender. Google ya ha demostrado cómo funciona esto en la práctica.

ZK
Hamidun News
Noticias de AI sin ruido. Selección editorial diaria de más de 400 fuentes. Producto de Zhemal Khamidun, Head of AI en Alpina Digital.
¿Qué te parece?
Cargando comentarios…