Jiqizhixin (机器之心)→ original

Waymo e DeepMind constroem a 'Matriz': por que carros autônomos precisam imaginar acidentes

Imagine que você esteja ensinando uma criança a atravessar a rua. Em vez de esperar anos para que um motorista acelerado passe em disparada ou um piano caia…

Processado por IA de Jiqizhixin (机器之心); editado por Hamidun News
Waymo e DeepMind constroem a 'Matriz': por que carros autônomos precisam imaginar acidentes
Fonte: Jiqizhixin (机器之心). Colagem: Hamidun News.
◐ Ouvir artigo

Imagine que você esteja ensinando uma criança a atravessar a rua. Em vez de esperar anos para que um motorista acelerado passe em disparada ou um piano caia de um caminhão, você simplesmente coloca um capacete de realidade virtual que gera esses pesadelos sob demanda. É mais ou menos o que Waymo e Google DeepMind estão fazendo agora.

Eles decidiram que a realidade sozinha não é suficiente para treinar um veículo autônomo verdadeiramente seguro e criaram o Genie 3 — um modelo generativo de mundo capaz de "imaginar" situações de trânsito. O problema com todos os sistemas modernos de condução autônoma se reduz ao chamado "long tail". Veículos autônomos lidam bem com o tráfego típico em um dia ensolarado, mas tropeçam perante anomalias: um canguru correndo para a estrada ou laranjas espalhadas pelo asfalto.

É fisicamente impossível e perigoso coletar exemplos suficientes disso no mundo real. Anteriormente, engenheiros desenhavam manualmente essas cenas em simuladores semelhantes a videogames, mas sempre permaneciam muito estéreis e distantes da vida real. Genie 3 muda as regras do jogo.

Não é apenas um reprodutor de vídeo, mas um ambiente de rede neural totalmente desenvolvido. O modelo pega um fragmento curto de filmagem real das câmeras Waymo e o transforma em uma caixa de areia interativa. Os engenheiros podem dizer ao modelo: "Agora deixe este carro nos cortar de repente", e Genie 3 redesenhará o vídeo em tempo real, respeitando as leis da física e a autenticidade visual.

O veículo autônomo dentro dessa simulação pode reagir às mudanças, e o modelo gerará a resposta do ambiente em troca. Este é o "modelo de mundo" sobre o qual se fala tanto no contexto de GPT-5 e do futuro da IA. Tecnicamente, Genie 3 é baseado em uma arquitetura que entende relações causais.

Não apenas muda pixels; entende que se um carro pisa no freio, a distância até ele deve diminuir. Isso permite que Waymo treine seus algoritmos em condições de "alucinações controladas." Enquanto concorrentes acumulam milhões de milhas reais esperando encontrar algo incomum, Waymo simplesmente gera a experiência necessária nos servidores DeepMind.

A transição para modelos de mundo é uma mudança fundamental na robótica. Estamos nos afastando de simplesmente copiar o comportamento de motoristas humanos em direção ao treinamento do sistema para entender os fundamentos da realidade. Se uma IA entende como o mundo funciona, não precisa ver mil acidentes para perceber o perigo de um objeto voando pelo pára-brisa.

A ironia é que, por muito tempo, as alucinações eram consideradas o principal inimigo das redes neurais. Agora, a própria capacidade de "alucinar" sobre um tópico determinado está se tornando a chave para criar o motorista mais seguro da história. O principal ponto: Waymo está fazendo a transição da coleta de dados para sua síntese em escala industrial.

Se esta aposta em Genie 3 der certo, os testes físicos nas estradas se transformarão em apenas um exame formal para um sistema que já viveu milhões de vidas na "Matriz" digital. Alguém conseguirá acompanhar o Google sem acesso a tal poder computacional e experiência em modelos generativos?

ZK
Hamidun News
Notícias de AI sem ruído. Seleção editorial diária de mais de 400 fontes. Produto de Zhemal Khamidun, Head of AI na Alpina Digital.

Quer parar de ler sobre IA e começar a usar?

AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.

O que você acha?
Carregando comentários…