Project Genie: Google transforma seus prompts em videogames infinitos
Lembra como todos se maravilharam com os primeiros vídeos da Sora? Lindo, cinematográfico e... absolutamente estático em termos de interação. Google decidiu…
Processado por IA de Google AI Blog; editado por Hamidun News
Lembra como todos se maravilharam com os primeiros vídeos da Sora? Lindo, cinematográfico e... absolutamente estático em termos de interação. Google decidiu que simplesmente assistir a imagens bonitas era coisa do passado. Conheça o Project Genie. Não é apenas outra rede neural para geração de vídeo, mas uma tentativa de criar um mundo interativo que literalmente se constrói sob seus dedos. Por enquanto, está disponível apenas para assinantes AI Ultra nos EUA, mas a escala da iniciativa já é impressionante.
Na base do Genie está o conceito de "modelo do mundo". A equipe do DeepMind alimentou a rede neural com centenas de milhares de horas de gameplay de plataformadores 2D comuns. Um detalhe importante: a IA não foi ensinada sobre as leis da física, não recebeu o código do jogo e não lhe disseram o que é um "salto" ou "gravidade". O modelo descobriu esses padrões por si só, simplesmente observando como os pixels na tela reagem aos pressionamentos de botões. O resultado é um sistema que entende causa e efeito: se um personagem pula em um cogumelo, ele deve ricochetear. Se há um abismo abaixo—ele cai.
Como funciona na prática? Você fornece ao Genie uma imagem, uma fotografia ou até uma descrição textual. A rede neural transforma esse quadro estático em uma localização de jogo. Você pressiona as teclas e o modelo prevê em tempo real como o próximo quadro deve ser, levando em conta sua ação. Não é vídeo pré-renderizado, mas pura alucinação de rede neural que obedece à lógica do espaço do jogo. Essencialmente, estamos vendo o primeiro motor de jogo da história que não foi escrito por programadores, mas cultivado a partir de dados.
Claro, não espere gráficos no nível de Cyberpunk 2077. Agora o Genie produz algo entre jogos Dendy e primeiros projetos indie: baixa resolução, taxa de quadros em torno de 11-15 FPS e texturas ocasionalmente glitch. Mas a ironia é que para um primeiro passo, isso é incrivelmente legal. Estamos testemunhando o nascimento de uma tecnologia que no futuro permitirá criar mundos procedurais infinitos para VR ou prototipar ideias de jogos instantaneamente sem uma única linha de código.
Por que Google precisa disso? Além do entretenimento óbvio, Genie é o terreno de testes perfeito para treinar outras redes neurais. Em vez de torturar robôs reais em laboratórios reais, eles podem ser lançados em mundos infinitos e fisicamente precisos do Genie. Lá eles podem cometer milhões de erros por segundo sem quebrar equipamentos caros. Essa é uma ponte entre software puro e a encarnação física da IA na realidade.
A indústria de conteúdo generativo está claramente entrando em uma nova fase. Ensinamos redes neurais a desenhar, escrever e falar. Agora estamos ensinando-as a entender as leis do espaço e do tempo. Project Genie é o primeiro passo, ainda que um pouco desajeitado, em direção a um futuro onde qualquer um de nós poderá ser um diretor e jogador em seu próprio universo, criado instantaneamente. Enquanto OpenAI aperfeiçoa vídeo, Google está construindo uma sandbox.
A pergunta-chave: O Genie se tornará a base para YouTube Games ou permanecerá um experimento caro para treinar robôs?
Quer parar de ler sobre IA e começar a usar?
AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.