Google AI Blog→ оригинал

Project Genie: Google Turns Your Prompts into Infinite Video Games

Google DeepMind выпустила Project Genie для пользователей AI Ultra в США. Это не просто видеогенератор, а полноценная «модель мира», создающая интерактивные про

Project Genie: Google Turns Your Prompts into Infinite Video Games
Источник: Google AI Blog. Коллаж: Hamidun News.

Помните, как все ахали при виде первых роликов Sora? Красиво, кинематографично и... абсолютно статично в плане взаимодействия. Google решила, что просто смотреть на красивые картинки — это вчерашний день. Встречайте Project Genie. Это не просто очередная нейронка для генерации видео, а попытка создать интерактивный мир, который буквально достраивается под вашими пальцами. Пока это доступно только подписчикам AI Ultra в США, но масштаб затеи впечатляет уже сейчас.

В основе Genie лежит концепция «модели мира». Команда DeepMind скормила нейросети сотни тысяч часов геймплея обычных 2D-платформеров. Важный нюанс: ИИ не объясняли правила физики, не давали код игры и не рассказывали, что такое «прыжок» или «гравитация». Модель сама вывела эти закономерности, просто наблюдая за тем, как пиксели на экране реагируют на нажатия кнопок. В итоге получилась система, которая понимает причинно-следственные связи: если персонаж прыгнул на гриб, он должен отскочить. Если под ним пропасть — он упадет.

Как это работает на практике? Вы даете Genie картинку, фотографию или даже текстовое описание. Нейросеть превращает этот статичный кадр в игровую локацию. Вы нажимаете клавиши, и модель в реальном времени предсказывает, каким должен быть следующий кадр, учитывая ваше действие. Это не пререндеренное видео, а чистая галлюцинация нейросети, которая подчиняется логике игрового пространства. По сути, перед нами первый в истории игровой движок, который не написан программистами, а выращен на данных.

Конечно, пока не стоит ждать графики уровня Cyberpunk 2077. Сейчас Genie выдает нечто среднее между играми для Dendy и ранними инди-проектами: низкое разрешение, частота кадров в районе 11-15 FPS и периодические «поплывшие» текстуры. Но ирония в том, что для первого шага это невероятно круто. Мы видим рождение технологии, которая в будущем позволит создавать бесконечные процедурные миры для VR или мгновенно прототипировать игровые идеи без единой строчки кода.

Зачем это Google? Помимо очевидного развлечения, Genie — это идеальный полигон для обучения других нейросетей. Вместо того чтобы мучить реальных роботов в настоящих лабораториях, их можно запустить в бесконечные, физически корректные миры Genie. Там они могут совершать миллионы ошибок в секунду, не ломая дорогостоящее оборудование. Это мостик между чистым софтом и физическим воплощением ИИ в реальности.

Индустрия генеративного контента явно переходит в новую фазу. Мы научили нейросети рисовать, писать и говорить. Теперь мы учим их понимать законы пространства и времени. Project Genie — это первый, пусть и немного неуклюжий, шаг в сторону того, что скоро любой из нас сможет стать режиссером и игроком в собственной, созданной на лету вселенной. Пока OpenAI полирует видео, Google строит песочницу.

Главное: Станет ли Genie основой для YouTube Games или останется дорогим экспериментом для обучения роботов?

ЖХ
Hamidun News
AI‑новости без шума. Ежедневный редакторский отбор из 400+ источников. Продукт Жемала Хамидуна, Head of AI в Alpina Digital.
Загружаем комментарии…