Habr AI→ оригинал

Google объединила Street View и AI для создания виртуальных тренировочных миров

Google показала новую версию Project Genie — AI, генерирующий полнофункциональные 3D-миры по координатам Google Street View. Робот может тренироваться в виртуал

Google объединила Street View и AI для создания виртуальных тренировочных миров
Источник: Habr AI. Коллаж: Hamidun News.
◐ Слушать статью

Google представила обновление Project Genie — генеративную модель, которая создаёт полнофункциональные 3D-миры, привязанные к реальным координатам Google Street View. Впервые AI получила возможность не просто генерировать видео, а создавать интерактивные виртуальные среды, в которых робот может учиться без контакта с физическим миром.

Что такое world models

World models отличаются от обычной видеогенерации тем, что они не просто рисуют последовательность кадров — они строят понимание физики, причинности и трёхмерной структуры мира. Модель учится на видео и примерах взаимодействия, а потом может предсказать, что произойдёт, если робот совершит конкретное действие. Робот, обученный на такой модели, может планировать траектории, избегать препятствий и тренировать сложные навыки навигации в виртуальной среде, а потом применять эти знания в реальности. Это существенно отличается от видеомоделей типа Sora, которые просто генерируют правдоподобный видеоряд без полного понимания физики.

Genie 3 и

Street View Google интегрировала Project Genie с собственной базой Street View — миллионами снимков улиц со всего мира с известными координатами и трёхмерной геометрией. Теперь можно выбрать реальное место (например, площадь в Лондоне или улицу в Нью-Йорке) и AI сгенерирует полный 3D-мир этого места с правильными пропорциями. Робот может тренироваться на маршрутах реальных городов, не выходя из дата-центра. Это критично для автономных систем: вместо миллионов часов реального вождения автомобиль учится в ускоренной виртуальной среде. Waymo уже тестирует такой подход для своих беспилотников.

  • Привязка к реальным координатам из Google Street View Генерация полной 3D-геометрии с физикой Интерактивная среда, где робот действует и видит результаты * Масштабируемость: можно генерировать миры для любых мест на Земле ## Production-пайплайн: Unity и Blender Самое важное в новой версии — интеграция с инструментами, которые уже используют разработчики. Google добавила MCP-коннекторы для Unity и Blender, позволяя использовать сгенерированные миры прямо в полюбившихся движках без экспорта и конвертации. Разработчик может выбрать место в Street View, получить готовую 3D-сцену, импортировать её в Unity или Blender и добавить логику, персонажей и интерактивность. Раньше этот процесс требовал недель ручной работы 3D-художников. Теперь первичная сцена генерируется автоматически за минуты.

Почему это меняет gamedev и робототехнику Для робототехники это ускорение на месяцы разработки.

Для gamedev — снижение входного барьера для инди-разработчиков, которые раньше либо нанимали дорогих художников, либо использовали готовые ассеты. Город по реальному месту теперь генерируется за секунды. Waymo, Boston Dynamics и другие компании доказали, что качественная симуляция критична для практического AI. Genie 3 делает симуляцию масштабируемой и привязанной к реальности.

Что это значит World models переходят из исследовательских лабораторий в рабочий инструмент.

Следующий этап AI в робототехнике и gamedev будет не про видеогенерацию, а про создание интерактивного мира, в котором агент может действовать и учиться. Google уже показала, как это работает на практике.

ЖХ
Hamidun News
AI‑новости без шума. Ежедневный редакторский отбор из 400+ источников. Продукт Жемала Хамидуна, Head of AI в Alpina Digital.
Что вы думаете?
Загружаем комментарии…