Google AI Blog→ original

Google Genie 3: quando a rede neural substitui o motor de jogo (e realidade)

Lembra daquele sentimento da infância quando você olhava para uma figura em um livro e desesperadamente queria entrar dentro? Google parece ter decidido…

Processado por IA de Google AI Blog; editado por Hamidun News
Google Genie 3: quando a rede neural substitui o motor de jogo (e realidade)
Fonte: Google AI Blog. Colagem: Hamidun News.
◐ Ouvir artigo

Lembra daquele sentimento da infância quando você olhava para uma figura em um livro e desesperadamente queria entrar dentro? Google parece ter decidido seriamente transformar essa fantasia em código funcional. Em um episódio recente do podcast Google AI: Release Notes, Logan Kilpatrick discutiu o projeto Genie 3 com engenheiros do DeepMind. Não é apenas outra rede neural para gerar gatos no estilo Pixar. É um modelo de mundo interativo completo que entende o que acontecerá se você pressionar um botão ou empurrar um objeto.

Vamos colocar isso em contexto. Por muito tempo, a indústria esteve obcecada com a qualidade dos pixels. Nos maravilhávamos com Sora do OpenAI ou Kling porque produzem imagens que são difíceis de distinguir da realidade. Mas esses modelos têm um problema fundamental: eles são apenas "preenchedores de lacunas" muito avançados. Eles sabem como deve ser o próximo quadro, mas não entendem relações de causa e efeito. Se em um vídeo Sora uma pessoa morde um biscoito, o biscoito pode permanecer inteiro. Genie 3 segue um caminho diferente.

A equipe do DeepMind passou anos ensinando IA a entender física observando vídeos. Genie 3 é o ápice da ideia de "modelo de mundo" (World Model). Não apenas desenha quadros, simula um ambiente. Você oferece uma imagem única ou descrição textual, e ela cria um espaço pelo qual você pode navegar. É como se um videogame fosse criado em tempo real a cada passo que você dá, sem envolvimento de programadores ou designers 3D.

Por que isso é criticamente importante agora? Porque atingimos um teto de dados. Para treinar agentes mais inteligentes ou veículos autônomos, precisamos de mais dados do que existe na internet inteira. Genie 3 permite criar simulações infinitas e fisicamente precisas para treinar outras redes neurais. É uma "caixa de areia" onde robôs podem cometer erros milhões de vezes por segundo sem quebrar manipuladores caros na realidade. Google claramente está apostando que o futuro da IA não está em chatbots, mas em agentes que atuam no espaço.

É claro que há uma dose de ironia aqui. Enquanto OpenAI e Anthropic lançam produtos que as pessoas usam todos os dias, Google continua lançando podcasts e artigos de pesquisa. Ouvimos sobre as capacidades incríveis do Genie 3, mas quando poderemos executá-lo em nossos dispositivos? Essa pergunta permanece aberta. No entanto, a superioridade técnica do DeepMind na arquitetura de tais modelos é inegável. Eles estão construindo o alicerce sobre o qual a próxima geração de IA crescerá—ativa, não passiva.

A transição de "veja o que eu desenhei" para "veja em que transformei essa figura" é um deslocamento tectônico. Muda tudo: desde o desenvolvimento de jogos, onde níveis serão gerados para o jogador, até treinar assistentes de IA em cópias virtuais de nossos apartamentos. Google está tentando provar que ainda é o líder em inovação, mesmo que seu caminho para o lançamento pareça infinito.

O ponto-chave: Genie 3 transforma IA de um artista em um arquiteto de realidades. Google conseguirá comercializar isso mais rápido do que os concorrentes conseguirão copiar o método?

ZK
Hamidun News
Notícias de AI sem ruído. Seleção editorial diária de mais de 400 fontes. Produto de Zhemal Khamidun, Head of AI na Alpina Digital.

Quer parar de ler sobre IA e começar a usar?

AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.

O que você acha?
Carregando comentários…