Habr AI→ original

Robô com Google LLM: como um modelo de 270M parâmetros foi treinado para controlar movimentos

Um engenheiro integrou com sucesso um modelo de linguagem compacto do Google (270 milhões de parâmetros) a um robô de esteiras com braço manipulador e o treinou

Robô com Google LLM: como um modelo de 270M parâmetros foi treinado para controlar movimentos
Fonte: Habr AI. Colagem: Hamidun News.
◐ Ouvir artigo

Um engenheiro integrou o modelo de linguagem aberto compacto da Google (270 milhões de parâmetros) em um robô com esteiras e manipulador, e treinou o modelo para controlar seus movimentos exclusivamente em simulação. O experimento demonstra que LLMs compactos são capazes de aprender a controlar sistemas físicos complexos sem enormes recursos computacionais.

Por que um LLM compacto

A Google lançou uma série de modelos compactos Gemini Nano projetados para dispositivos com recursos computacionais limitados. Um modelo com 270 milhões de parâmetros não é um monstruoso GPT-4, mas uma ferramenta elegante e bem-planejada que pode ser executada diretamente em sistemas embarcados do robô sem chamar servidores na nuvem. Essa arquitetura oferece várias vantagens críticas para a robótica.

Em primeiro lugar, o modelo funciona localmente e não requer conexão com a internet — o robô é completamente autônomo. Em segundo lugar, responde sem atrasos de latência de rede, o que é crítico quando milissegundos determinam o resultado de uma operação. Em terceiro lugar, o consumo de energia é baixo — a bateria do robô dura mais e a eletrônica não superaquece.

O autor escolheu esse modelo precisamente porque seu desempenho é totalmente suficiente para a tomada de decisões no controle de sistemas físicos. Modelos compactos aprendem mais rápido do que LLMs gigantes e requerem menos dados para treinamento.

Treinamento em um ambiente virtual

Todo o experimento foi conduzido em simulação — um ambiente virtual onde o comportamento da física e da dinâmica corresponde à realidade. O robô com esteiras e manipulador se moveu não em uma sala real, mas em um modelo de computador. Isso permitiu ao autor testar rapidamente milhares de variantes de comportamento sem risco de danificar equipamentos reais caros. O modelo de linguagem recebeu informações sobre o estado do robô — posição das esteiras, ângulo de rotação, coordenadas do manipulador, imagens da câmera virtual — e treinou a si mesmo para tomar decisões independentemente sobre como agir. O modelo treinou a si mesmo para realizar as seguintes habilidades:

  • Controle de esteiras: quando ativar, em qual direção e com qual velocidade
  • Navegação e orientação: como girar e se orientar no espaço
  • Manipulação: como o manipulador deve se aproximar, agarrar e mover objetos
  • Coordenação: como coordenar o movimento do corpo e braço para tarefas complexas

O modelo aprendeu através de tentativa e erro: tentou uma ação, viu o resultado na simulação, corrigiu seu comportamento. O processo não é instantâneo, mas após centenas de milhares de iterações, o modelo encontrou estratégias de controle eficientes. No final, aprendeu a realizar manipulações deliberadas — agarrar objetos, movê-los, empilhá-los — exatamente como se o robô fosse físico.

Ciberpunk em vez de marketing

O autor chama seu projeto de "ciberpunk" — um experimento que é simultaneamente tecnicamente interessante e provocativo. A filosofia é simples: se você pegar um modelo de código aberto, carregá-lo em um robô e deixar que aprenda em simulação, pode se tornar uma força de trabalho útil? Os céticos geralmente respondem "não" — dizem que a robótica requer arquitetura especial, bilhões de parâmetros e megabytes de dados.

A resposta do autor: não, pode. E funciona. Não requer parâmetros enormes, arquiteturas especiais ou dados infinitos.

Um modelo compacto com 270 milhões de parâmetros é suficiente para aprender, em condições de simulação, a controlar um sistema mecânico não trivial — um robô com esteiras e manipulador realizando manipulações no espaço tridimensional. O paradoxo é que modelos compactos são frequentemente mais versáteis do que ferramentas especializadas.

O que isso significa

O experimento apaga a fronteira entre modelos de linguagem "puros" e o controle de sistemas físicos. Amanhã, LLMs compactos podem naturalmente controlar manipuladores industriais, plataformas autônomas e robôs móveis no local — em oficinas, armazéns, agricultura, logística. Sem chamar a nuvem, sem atrasos de transmissão de rede, com licenças abertas e a preços acessíveis. Isso, é claro, é quando os modelos aprendem a transferir confiabilidade conhecimento da simulação para a realidade — a chamada transferência sim-para-real. E isso já começou.

ZK
Hamidun News
Notícias de AI sem ruído. Seleção editorial diária de mais de 400 fontes. Produto de Zhemal Khamidun, Head of AI na Alpina Digital.
O que você acha?
Carregando comentários…