Micro1 Coleta Vídeos Domésticos em Todo o Mundo para Treinar Robôs Humanoides
O treinamento de robôs humanoides se transformou inesperadamente em um novo segmento da gig economy. A Micro1 e outras empresas pagam pessoas na Nigéria…
Processado por IA de MIT Technology Review; editado por Hamidun News
O treinamento de robôs humanoides esbarrou não apenas em mecânica e chips, mas na escassez de dados reais sobre como humanos se movem e lidam com objetos em casa. Por isso, um novo mercado está crescendo rapidamente ao redor da indústria: milhares de trabalhadores em gig estão gravando passagem de roupa, limpeza e culinária em casa, e então esses vídeos se tornam dados de treinamento para robôs.
Como o mercado funciona
Um desses trabalhadores é Zeus, um estudante de medicina da Nigéria. Após seu turno no hospital, ele liga uma luz de anel, prende seu iPhone na testa e grava ações cotidianas em primeira pessoa. Micro1, uma empresa de Palo Alto, coleta tais vídeos de contratados em mais de 50 países, incluindo Índia, Nigéria e Argentina, e depois os vende para empresas de robótica. Os candidatos são primeiro selecionados por um assistente de IA, e os próprios vídeos passam por verificação automática e manual antes da anotação.
- dobrar roupas e passar a ferro
- lavar louça e limpar a cozinha
- cozinhar e trabalhar com utensílios
- mover objetos pela sala
- navegação simples em espaços domésticos apertados
Na superfície, isso parece um trabalho paralelo muito simples: você precisa se mover naturalmente, manter as mãos no enquadramento e repetir ações domésticas familiares. Mas é precisamente nesses vídeos que os modelos aprendem a entender preensão de objetos, mudanças na posição do corpo e cenários básicos para interagir com coisas. Para alguns trabalhadores, essa é uma renda decente: Zeus recebe cerca de $15 por hora. Ao mesmo tempo, o trabalho rapidamente se torna monótono, e em um apartamento pequeno é difícil pensar em cenas novas e variações suficientes.
Por que robôs precisam disso
O boom mais recente em robótica cresceu em grande parte do sucesso dos grandes modelos de linguagem. A lógica da indústria é simples: se chatbots aprenderam com enormes volumes de texto, então robôs humanoides também podem ser treinados em grandes volumes de dados de movimento. O problema é que o mundo físico é muito mais complexo que a internet. Simulações funcionam razoavelmente bem para caminhar ou truques de demonstração, mas capturam mal a força de pressão, atrito, movimentos imprecisos e o caos de uma cozinha, quarto ou armazém real.
De acordo com o CEO da Micro1, Ali Ansari, empresas de robótica já estão gastando mais de $100 milhões por ano comprando dados reais. Em 2025, investidores despejaram mais de $6 bilhões em robôs humanoides, e não é apenas a Micro1 que busca tais dados: programas similares estão sendo desenvolvidos pela Scale AI e Encord, DoorDash paga entregadores para filmar tarefas domésticas, e na China trabalhadores estão sendo ensinados movimentos através de fones VR e exoesqueletos em centros especiais. Mesmo nessa escala, o mercado ainda está apenas construindo infraestrutura de coleta de dados.
"Isso levará mais tempo do que muitos pensam."
Essa avaliação, que especialistas em robótica no material também compartilham, descreve bem o estado atual do mercado e as expectativas da indústria. Mesmo dezenas e centenas de milhares de horas de vídeo ainda não parecem um volume suficiente para robôs verdadeiramente universais. A indústria ainda precisa descobrir quais dados são realmente úteis, quantas variações são necessárias para treinamento confiável e se é possível coletar tal volume sem aumentos agudos de custos e quedas de qualidade.
Onde os riscos começam
O problema mais óbvio é privacidade. Empresas pedem para não mostrar rostos, nomes, números de telefone e outros identificadores óbvios. Mas mesmo sem isso, os vídeos ainda capturam o interior de um apartamento, pertences pessoais, hábitos, crianças, vizinhos e rotinas diárias. Para trabalhadores com famílias, a tarefa é especialmente incômoda: você precisa constantemente observar para garantir que uma criança ou vizinho não apareça no enquadramento. Como resultado, "dados para robô" acaba sendo um registro muito detalhado da vida cotidiana de alguém.
Há um segundo problema também—qualidade e transparência de toda a cadeia. Trabalhadores entrevistados entendem que estão ajudando a treinar robôs, mas muitas vezes não sabem como as gravações serão armazenadas, para quem serão passadas e se depois poderão conseguir sua exclusão. Robóticos, enquanto isso, advertem que hábitos domésticos nem sempre são seguros e nem sempre são adequados como modelo para uma máquina. Se um robô absorver padrões malsucedidos de vídeos domésticos, os erros aparecerão no trabalho real, e controlar isso com um fluxo de vídeos de milhares de pessoas é muito difícil.
O que isso significa
O boom em robôs humanoides hoje é sustentado não apenas por novos modelos e hardware, mas por um mercado oculto de trabalho manual que fornece à indústria dados sobre a vida cotidiana. Se as empresas querem trazer robôs domésticos e industriais para adoção em massa, terão que resolver não apenas o problema do treinamento, mas também questões de consentimento, privacidade e qualidade de dados. Caso contrário, a "última milha" da automação vai se mostrar muito mais longa do que as apresentações prometem.
Quer parar de ler sobre IA e começar a usar?
AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.