Project Genie de DeepMind aprendió a simular lugares reales de Google Street View
DeepMind ha expandido el acceso a Project Genie para todos los suscriptores de Google AI Ultra en todo el mundo. La noticia principal es la integración con Goog
Procesado por IA desde DeepMind Blog; editado por Hamidun News
DeepMind ha expandido el acceso a Project Genie para todos los suscriptores de Google AI Ultra en todo el mundo y presentó una nueva capacidad de integración con Google Street View, que permite simular videos interactivos de lugares geográficos reales.
¿Qué es Project Genie?
Project Genie es un modelo avanzado de video generativo de Google DeepMind que crea escenas de video interactivas basadas en descripciones de texto o imágenes. A diferencia de los generadores de video ordinarios que simplemente reproducen contenido grabado previamente, Genie construye un mundo virtual dinámico que responde a las acciones del agente en tiempo real. El modelo puede mostrar a una persona (o robot) en una escena realizando varias acciones: caminar en diferentes direcciones, manipular objetos e interactuar con el entorno.
Con cada acción, el video se actualiza, reflejando las leyes físicas y las relaciones de causa y efecto entre eventos. Esto hace que la experiencia sea similar a controlar un personaje de juego en un videojuego, pero basada en predicciones de redes neuronales en lugar de material grabado previamente.
Nueva integración con Street View
La nueva función combina las capacidades de Project Genie con Google Street View, un enorme archivo de fotografías panorámicas de millones de lugares en el planeta. Ahora, en lugar de escenas imaginarias o sintéticas, el agente puede interactuar con ubicaciones reales: centros históricos de ciudades, parques, espacios públicos y monumentos. Esto transforma Street View de una galería de fotos estática a un mundo virtual interactivo. El usuario no solo puede ver una foto panorámica de la Plaza de San Pedro, sino que también puede literalmente 'caminar' por ella, explorando detalles arquitectónicos, mirando vidrieras de tiendas, interactuando con objetos y viendo cómo cambia la imagen de acuerdo con sus acciones.
Dónde puede ser útil
La simulación de video interactivo de lugares reales abre numerosas aplicaciones prácticas:
- Planificación de viajes y turismo — los turistas podrán inspeccionar virtualmente una atracción antes de visitarla
- Rehabilitación y accesibilidad — las personas con limitaciones de movilidad podrán explorar remotamente espacios públicos
- Arquitectura y planificación urbana — los diseñadores podrán simular cómo los nuevos edificios se integran en espacios existentes
- Robótica — las redes neuronales para robots autónomos podrán entrenar en escenarios urbanos reales
- Educación y cultura — los tours virtuales de lugares históricos se vuelven completamente interactivos
Cada una de estas aplicaciones requiere que Genie alcance un alto nivel de realismo en la predicción de procesos físicos y comportamiento humano.
Desafíos técnicos
Generar videos interactivos reales requiere recursos computacionales enormes. El modelo no solo debe predecir los fotogramas de video siguientes con alta precisión, sino hacerlo con latencia mínima para que la interacción sea fluida y realista. Los pequeños errores en la predicción de física o movimientos humanos pueden acumularse rápidamente, destruyendo la ilusión de realidad.
Expansión del acceso
Antes, Project Genie estaba disponible solo para un número limitado de usuarios. Ahora Google expande el acceso a todos los suscriptores de Google AI Ultra en todo el mundo. Esto permitirá que más desarrolladores, investigadores y entusiastas experimenten con la generación de video interactivo de lugares reales. La expansión del acceso a una tecnología tan avanzada señala que el modelo ha alcanzado un cierto nivel de estabilidad y disponibilidad para usar en aplicaciones reales.
Qué significa esto
El límite entre información estática (fotos, videos, mapas) y simulaciones interactivas de IA se desvanece gradualmente. Project Genie en combinación con Street View es un paso significativo hacia la creación de una 'realidad interactiva alternativa' basada en datos geográficos reales. En el futuro, las personas no solo podrán mirar lugares, sino explorarlos activamente, interactuar con objetos y el entorno, entrenar sistemas de IA basados en simulaciones. Esto cambia fundamentalmente cómo consumimos información sobre el mundo e interactuamos con el espacio geográfico.
¿Quieres dejar de leer sobre IA y empezar a usarla?
AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.