AWS e NVIDIA lançaram treinamento em larga escala para o robô Unitree H1 no SageMaker AI

AWS e NVIDIA mostraram como escalar o aprendizado por reforço para o robô humanoide Unitree H1 na nuvem. O simulador NVIDIA Isaac Lab agora roda sobre o…

Redação da Hamidun News

Monitoramento de AI · AWS Machine Learning Blog

30 de jun. de 2026· 2 min

Processado por IA de AWS Machine Learning Blog; editado por Hamidun News

AWS e NVIDIA lançaram treinamento em larga escala para o robô Unitree H1 no SageMaker AI — Fonte: AWS Machine Learning Blog. Colagem: Hamidun News.

◐ Ouvir artigo

AWS e NVIDIA lançaram treinamento em larga escala do robô humanoide Unitree H1 no SageMaker AI

AWS em conjunto com NVIDIA demonstrou um pipeline completo para treinar políticas de controle do robô humanoide Unitree H1 diretamente na nuvem — sem ter que possuir um cluster GPU próprio.

Por que a nuvem para robôs

Aprendizado por reforço para robôs físicos requer bilhões de etapas de simulação — isso não é exagero. Para que um humanoide aprenda a caminhar para frente sem cair, a rede neural deve passar por dezenas de bilhões de interações entre um agente virtual e o ambiente. Fazer isso no mundo real é caro e perigoso: um experimento fracassado significa possível reparo custando milhares de dólares, e o processo em si levaria anos em vez de horas.

É por isso que a indústria está apostando em simulação física. A corrida pela "Lei de Moore para robôs" já começou: Tesla, Figure, Boston Dynamics e dezenas de startups estão investindo centenas de milhões na criação de ambientes sintéticos para treinamento. NVIDIA Isaac Lab é um simulador acelerado por GPU capaz de executar milhares de cópias de um ambiente virtual em um único nó simultaneamente.

Anteriormente, era usado principalmente em grandes laboratórios corporativos e universitários com hardware caro. Agora Isaac Lab é integrado diretamente ao Amazon SageMaker AI. Isso significa que uma solicitação de centenas de GPUs é atendida em minutos, e um engenheiro não precisa pensar em infraestrutura — apenas sobre código de política e configuração da tarefa.

Duas opções de implementação

AWS oferece dois modos para diferentes cenários de uso:

SageMaker HyperPod — um cluster gerenciado persistente; a infraestrutura persiste entre execuções, o que é conveniente para pesquisas de múltiplas semanas e ajuste iterativo de hiperparâmetros
SageMaker Training Jobs — uma execução gerenciada única; recursos são alocados estritamente para a tarefa e automaticamente liberados após sua conclusão, o que simplifica o controle de orçamento
Instâncias das séries p4d e p5 com NVIDIA A100 e H100 respectivamente são suportadas
Isaac Lab é implantado em um contêiner Docker padrão; pesos do modelo e checkpoints são automaticamente salvos no Amazon S3
Métricas de treinamento — recompensa, comprimento do episódio, perda de entropia — são transmitidas para Amazon CloudWatch em tempo real

A principal vantagem de ambas as opções é a remoção da carga operacional. Não há necessidade de configurar manualmente Kubernetes, gerenciar rede InfiniBand entre nós ou balancear manualmente cargas de GPU.

Como funciona o treinamento do Unitree H1

Unitree H1 é um dos humanoides em série mais acessíveis: aproximadamente 180 cm de altura, pesando 47 kg, com 19 graus de liberdade. Isso o torna uma plataforma popular para pesquisa acadêmica em controle de movimento. Na simulação Isaac Lab, milhares de cópias virtuais deste robô aprendem a caminhar em paralelo usando o algoritmo de Otimização de Políticas Proximal (PPO): caem, levantam, ajustam equilíbrio e recebem recompensas por movimento para frente estável.

O quão precisa a função de recompensa descreve o comportamento desejado determina a qualidade da política treinada. Em um único nó H100, Isaac Lab pode executar até 4096 simulações paralelas simultaneamente. Ao escalar para múltiplos nós, o treinamento distribuído é empregado via PyTorch DDP — a sincronização de gradientes entre GPUs ocorre automaticamente.

"Escalar para centenas de GPUs através do

SageMaker reduz o tempo de treinamento de vários dias para várias horas", observam os autores da postagem no blog AWS.

Após a conclusão, a política treinada é exportada em formatos ONNX ou TorchScript e pode ser implantada em hardware real via NVIDIA Isaac ROS.

O que isso significa

Aprendizado por reforço baseado em nuvem para robôs está saindo dos laboratórios com orçamentos de equipamentos de milhões de dólares. Qualquer pequeno time com uma conta AWS agora pode executar um experimento sério de treinamento de humanoides sem grandes investimentos em infraestrutura. Isso muda a economia da robótica: a barreira de entrada diminui, o ritmo das iterações aumenta — e os próximos avanços no controle de robôs físicos podem muito bem vir de equipes surpreendentemente pequenas.

Hamidun News

Notícias de AI sem ruído. Seleção editorial diária de mais de 400 fontes. Produto de Zhemal Khamidun, Head of AI na Alpina Digital.

Canal do Telegram RSS hamidun.com

Precisa de IA funcionando dentro da sua empresa — não só no feed de notícias?

Eu construo IA em produção para empresas — CRM sob medida, ferramentas internas, agentes autônomos, automação de processos. Pertence a você, moldada ao seu processo, sem taxa por usuário. Feito por Zhemal Khamidun, CPO da AlpinaGPT (plataforma de IA, 6.000+ usuários).

Agendar consultoria grátis →