Google AI Blog→ оригинал

Google Genie 3: когда нейросеть заменяет игровой движок (и реальность)

Google выпустила свежий подкаст о Genie 3 — своей самой амбициозной попытке создать «модель мира». В отличие от обычных видеогенераторов, Genie 3 позволяет взаи

Google Genie 3: когда нейросеть заменяет игровой движок (и реальность)
Источник: Google AI Blog. Коллаж: Hamidun News.

Помните то детское чувство, когда вы смотрели на картинку в книге и отчаянно хотели попасть внутрь? Google, кажется, всерьез решила превратить эту фантазию в рабочий код. В свежем выпуске подкаста Google AI: Release Notes Логан Килпатрик обсудил с инженерами DeepMind проект Genie 3. Это не очередная нейронка для генерации котиков в стиле Pixar. Это полноценная интерактивная модель мира, которая понимает, что произойдет, если вы нажмете на кнопку или толкнете предмет.

Давайте разберемся в контексте. Долгое время индустрия была одержима качеством пикселей. Мы восхищались Sora от OpenAI или Kling, потому что они выдают картинку, которую сложно отличить от реальности. Но у этих моделей есть одна фундаментальная проблема: они — просто очень продвинутые «заполнители пропусков». Они знают, как должен выглядеть следующий кадр, но они не понимают причинно-следственных связей. Если в видео от Sora человек откусывает кусок печенья, печенье может остаться целым. Genie 3 идет другим путем.

Команда DeepMind годами работала над тем, чтобы научить ИИ понимать физику через наблюдение за видео. Genie 3 — это кульминация идеи «модели мира» (World Model). Она не просто рисует кадры, она симулирует среду. Вы даете ей одно изображение или текстовое описание, и она создает пространство, по которому можно перемещаться. Это как если бы видеоигра создавалась в реальном времени под каждым вашим шагом, без участия программистов и 3D-дизайнеров.

Почему это критически важно именно сейчас? Потому что мы уперлись в потолок данных. Чтобы обучать более умных агентов или беспилотные автомобили, нам нужно больше данных, чем есть во всем интернете. Genie 3 позволяет создавать бесконечные, физически корректные симуляции для обучения других нейросетей. Это «песочница», где роботы могут ошибаться миллионы раз в секунду, не ломая дорогие манипуляторы в реальности. Google явно делает ставку на то, что будущее ИИ лежит не в чат-ботах, а в агентах, которые действуют в пространстве.

Конечно, здесь есть доля иронии. Пока OpenAI и Anthropic выпускают продукты, которыми люди пользуются каждый день, Google продолжает выпускать подкасты и научные статьи. Мы слышим о невероятных возможностях Genie 3, но когда мы сможем запустить её на своих устройствах? Вопрос открытый. Однако техническое превосходство DeepMind в архитектуре таких моделей неоспоримо. Они строят фундамент, на котором вырастет следующее поколение ИИ — активное, а не пассивное.

Переход от «посмотри, что я нарисовал» к «посмотри, во что я превратил эту картинку» — это тектонический сдвиг. Это меняет всё: от геймдева, где уровни будут генерироваться под игрока, до обучения ИИ-ассистентов в виртуальных копиях наших квартир. Google пытается доказать, что они все еще главные по инновациям, даже если их путь к релизу кажется бесконечным.

Главное: Genie 3 превращает ИИ из художника в архитектора реальностей. Сможет ли Google коммерциализировать это быстрее, чем конкуренты скопируют метод?

ЖХ
Hamidun News
AI‑новости без шума. Ежедневный редакторский отбор из 400+ источников. Продукт Жемала Хамидуна, Head of AI в Alpina Digital.
Загружаем комментарии…