MIT Technology Review→ original

Como OpenAI, Google e Figure Estão Mudando o Treinamento de Robôs: Uma Breve História da Abordagem

Até recentemente, a robótica operava em modo "sonhamos com C-3PO, lançamos Roomba". Agora a lógica está mudando: em vez de regras codificadas, os robôs são…

Processado por IA de MIT Technology Review; editado por Hamidun News
Como OpenAI, Google e Figure Estão Mudando o Treinamento de Robôs: Uma Breve História da Abordagem
Fonte: MIT Technology Review. Colagem: Hamidun News.
◐ Ouvir artigo

A robótica está passando não apenas por outro ciclo de desenvolvimento de hardware, mas por uma mudança fundamental na própria lógica de aprendizado: máquinas são cada vez mais treinadas em dados, simulações e grandes modelos multimodais, em vez de serem programadas manualmente. Por muito tempo, a indústria teve uma lacuna notável entre ambições e resultados. Engenheiros sonhavam com robôs em nível de ficção científica — assistentes universais capazes de se mover pelo mundo ordinário, entender pessoas e executar com segurança dezenas de tarefas.

Na prática, o mercado viveu por décadas principalmente com base em sistemas mais estreitos: braços robóticos para fábricas, manipuladores de armazém e dispositivos de consumidor como aspiradores robôs. A razão não era falta de mecânica, mas o fato de que robôs lutavam com ambientes imprevisíveis. Qualquer desvio do roteiro — um novo objeto, um ângulo de visualização diferente, iluminação alterada — rapidamente quebrava seu comportamento.

O primeiro grande avanço veio com o aprendizado através de tentativa e erro. Nos anos 2010, roboticistas começaram a usar ativamente aprendizado por reforço e simuladores, onde máquinas poderiam treinar milhões de vezes sem risco de quebrar equipamentos caros. Um exemplo notável é a mão robótica Dactyl da OpenAI, que foi treinada em simulação para manipular um cubo de Rubik e depois transferiu a habilidade para o mundo real. A ideia-chave era randomização de domínio: durante o treinamento, os parâmetros do ambiente mudavam — fricção, massa de objetos, imagens de câmera e outros detalhes. Desta forma, o robô aprendeu não um cenário perfeito, mas comportamento robusto em uma ampla gama de condições.

Paralelamente, o aprendizado por demonstração se desenvolveu: robôs começaram a ser ensinados mostrando-lhes ações humanas em vez de programar manualmente cada regra. Mas até isso não era suficiente. Simulações aceleraram o aprendizado, mas a lacuna entre ambientes virtuais e físicos não desapareceu, e dados reais permaneceram caros e escassos.

Então o próximo estágio começou quando a robótica adotou abordagens do boom de modelos grandes. Em vez de sistemas separados para tarefas individuais, pesquisadores começaram a montar grandes conjuntos de dados de trajetórias, imagens, instruções de texto e ações. No Google, o modelo RT-1 foi treinado em 130 mil episódios coletados por uma frota de 13 robôs cobrindo mais de 700 tarefas.

E RT-2 foi além: combinava dados robóticos com dados da web de modelos de visão-linguagem, então o robô não apenas podia repetir movimentos familiares, mas também fazer inferências mais amplas de comandos em linguagem natural.

Este mesmo movimento é visível em projetos que tentam escalar o aprendizado em diferentes tipos de máquinas. No conjunto Open X-Embodiment, pesquisadores coletaram dados de 22 robôs de 21 instituições e descreveram centenas de habilidades para que modelos pudessem transferir experiência entre plataformas, em vez de começar do zero para cada novo manipulador. Em cima disso, repousa a ideia de modelos fundacionais para o mundo físico: uma inteligência base única que é ajustada para um corpo, garra ou ambiente de trabalho específico. Startups como Figure, Apptronik, Covariant e Physical Intelligence estão construindo não apenas pesquisa, mas também estratégias comerciais em torno disso.

Contra este pano de fundo, o mercado se revitalizou. Em 2025, empresas e investidores investiram 6,1 bilhões de dólares em robôs humanoides — quatro vezes mais do que no ano anterior. O dinheiro flui não porque os robôs já conseguem fazer tudo, mas porque surgiu um caminho mais plausível para seu treinamento em ambientes reais.

Ainda assim, robôs universais permanecem distantes. Máquinas ainda lutam com longas sequências de ações, manipulação fina de múltiplos objetos simultaneamente, trabalho em espaços desordenados e interação segura com humanos sem cenas pré-preparadas. Ao contrário de modelos de linguagem, um robô não pode simplesmente cometer um erro em texto: seu erro significa um objeto caindo, uma falha, tempo de inatividade ou risco aos humanos.

Então a indústria avança por um caminho híbrido: mais simulações, mais dados reais de frotas, mais modelos gerais, mas também mais restrições de segurança e economia.

A conclusão principal é simples: o avanço na robótica agora está conectado não tanto a um novo tipo de corpo quanto a um novo modelo de aprendizado. A indústria está fazendo a transição de um mundo onde cada movimento tinha que ser prescrito antecipadamente para um onde o comportamento pode primeiro ser aprendido, depois transferido para outro robô e continuamente melhorado na operação. Isto não é ainda o androide promissor da ficção, mas já é uma trajetória de engenharia clara que tornou robôs uma aposta grande novamente para pesquisadores e investidores.

ZK
Hamidun News
Notícias de AI sem ruído. Seleção editorial diária de mais de 400 fontes. Produto de Zhemal Khamidun, Head of AI na Alpina Digital.

Quer parar de ler sobre IA e começar a usar?

AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.

O que você acha?
Carregando comentários…