36Kr (36氪)→ original

Robôs na armadilha dos dados: por que vídeos de saltos mortais são só o começo

Vídeos virais criam a ilusão de um avanço tecnológico, mas o progresso real é travado por uma "crise de dados". Ao contrário da AI baseada em texto, os robôs…

Processado por IA de 36Kr (36氪); editado por Hamidun News
Robôs na armadilha dos dados: por que vídeos de saltos mortais são só o começo
Fonte: 36Kr (36氪). Colagem: Hamidun News.
◐ Ouvir artigo

# Robôs Presos em uma Armadilha de Dados: Por Que Vídeos com Piruetas São Apenas o Começo

Nos últimos doze meses, a internet foi inundada com vídeos de truques impressionantes de robôs: robôs pulando, dançando, desferindo golpes, quebrando melancias com os pés. Os investimentos estão crescendo, as manchetes da mídia estão cheias de otimismo, e o público está convencido de que a era dos robôs assistentes domésticos está prestes a começar. Mas se você olhar por trás das cortinas deste teatro tecnológico, o quadro se mostra muito mais complexo e triste.

Neste exato momento, em silenciosos centros de preparação de dados espalhados por toda a China, operadores humanos com luvas estão lentamente, quase dolorosamente, controlando manipuladores — ensinando máquinas a pegar peças, dobrar ferramentas, fechar tampas de caixas. Este espetáculo carece de toda a qualidade cinematográfica dos vídeos virais, mas é precisamente isso que determina o progresso real na robótica. A questão é que o caminho de um truque impressionante para um assistente doméstico útil é bloqueado por um problema fundamental: uma escassez catastrófica de dados de qualidade.

Modelos de linguagem como ChatGPT e DeepSeek são construídos sobre o triunfo da lógica simples — milhares de bilhões de exemplos de texto da internet permitiram que a IA compreendesse a língua e começasse a gerar conteúdo significativo. Mas a robótica enfrentou uma realidade completamente diferente. Se os dados de texto vivem em um espaço digital bidimensional, fácil de copiar e distribuir, então o mundo físico é um fluxo multidimensional e contínuo de informação.

Um robô deve perceber o mundo através de múltiplos canais simultaneamente: vídeo de várias câmeras, sensores de força, sensores táteis, informações sobre posições das articulações. Cada operação realizada pelo manipulador gera dados estruturados — 57 medições em alguns sistemas. E todos estes fluxos devem estar perfeitamente sincronizados até o milissegundo, caso contrário o modelo aprenderá pura alucinação em vez de relações de causa e efeito.

Na China, mais de cinquenta centros para coleta e processamento de dados robóticos já estão em operação. Apenas em Pequim, um desses centros produz cerca de seis mil registros de exemplos de treinamento diariamente. Se extrapolamos aproximadamente, a produção anual poderia atingir dezenas de bilhões de exemplos.

Isso soa impressionante, mas na realidade é uma gota no oceano de necessidades. Especialistas da empresa PowerTech realizaram um cálculo conservador: para ensinar a um robô um movimento, você precisa de aproximadamente mil a cinco mil exemplos. Uma tarefa simples composta por vários movimentos — dez a vinte mil.

Mas se estamos falando de um robô universal capaz de lidar com oitenta por cento do trabalho humano em uma indústria, seria necessário um conjunto de dados de centenas de milhões. E se as ambições se estendem a milhares de indústrias — estamos falando de trilhões de exemplos. O déficit é de quatro a cinco ordens de magnitude.

Mas este nem é o problema mais sério. Muito mais insidioso se provou ser a incompatibilidade de equipamentos. Diferentes fabricantes criam robôs com diferentes configurações de sensores, diferentes protocolos de controle, diferentes parâmetros físicos. Os dados coletados em um modelo de manipulador frequentemente simplesmente não funcionam em outro — a linguagem de uma máquina permanece completamente estranha para outra. Isto significa que o conhecimento não se acumula, não se constrói em um único ativo para a indústria. Cada fabricante é forçado a coletar seu próprio conjunto de dados do zero, repetindo o mesmo trabalho caro repetidamente.

Alguns centros resolvem este dilema focando em modelos populares — essencialmente ignorando a diversidade. Outros seguem um caminho mais ambicioso: coletando dados de robôs de diferentes fabricantes em um espaço único, tentando ensinar ao modelo a generalizar conhecimento em equipamentos heterogêneos. Nenhuma abordagem ainda provou sua universalidade.

Tudo isto nos lembra dos primeiros dias do piloto automático — uma era em que parecia que o problema estava nos algoritmos, não nos dados. Quase vinte anos se passaram, bilhões de investimentos, e descobriu-se que a verdade está em algum lugar próximo, mas não exatamente onde estamos procurando. Antes que os robôs realmente entrem em nossas casas, haverá um longo e tedioso trabalho à frente nos centros de dados, onde pessoas com luvas pacientemente ensinarão às máquinas a entender o mundo físico. Vídeos virais são marketing. O progresso real é uma história completamente diferente.

ZK
Hamidun News
Notícias de AI sem ruído. Seleção editorial diária de mais de 400 fontes. Produto de Zhemal Khamidun, Head of AI na Alpina Digital.

Quer parar de ler sobre IA e começar a usar?

AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.

O que você acha?
Carregando comentários…