36Kr (36氪)→ original

Robots en la trampa de los datos: por qué los videos de saltos mortales son solo el comienzo

Los videos virales crean la ilusión de un avance tecnológico, pero el progreso real se ve frenado por una "crisis de datos". A diferencia de la AI basada en…

Procesado por IA desde 36Kr (36氪); editado por Hamidun News
Robots en la trampa de los datos: por qué los videos de saltos mortales son solo el comienzo
Fuente: 36Kr (36氪). Collage: Hamidun News.
◐ Escuchar artículo

# Robots Atrapados en una Trampa de Datos: Por Qué los Vídeos con Mortales Son Solo el Comienzo

En el último año, internet se ha inundado de vídeos de trucos impresionantes de robots: robots saltando, bailando, lanzando golpes, rompiendo sandías con los pies. Las inversiones están creciendo, los titulares de los medios están llenos de optimismo, y el público está convencido de que la era de los robots asistentes domésticos está a punto de comenzar. Pero si miras detrás de las cortinas de este teatro tecnológico, el panorama resulta ser mucho más complejo y deprimente.

Ahora mismo, en silenciosos centros de preparación de datos repartidos por toda China, operadores humanos con guantes están lenta, casi dolorosamente controlando manipuladores — enseñando a las máquinas a recoger piezas, doblar herramientas, cerrar tapas de cajas. Este espectáculo carece de toda la calidad cinematográfica de los vídeos virales, pero es precisamente esto lo que determina el progreso real en la robótica. La cuestión es que el camino desde un truco impresionante a un asistente doméstico útil está bloqueado por un problema fundamental: una escasez catastrófica de datos de calidad.

Modelos de lenguaje como ChatGPT y DeepSeek se construyen sobre el triunfo de la lógica simple — miles de miles de millones de ejemplos de texto de internet permitieron que la IA comprendiera el lenguaje y comenzara a generar contenido significativo. Pero la robótica se enfrentó a una realidad completamente diferente. Si los datos de texto viven en un espacio digital bidimensional, fácil de copiar y distribuir, entonces el mundo físico es un flujo multidimensional y continuo de información.

Un robot debe percibir el mundo a través de múltiples canales simultáneamente: vídeo de varias cámaras, sensores de fuerza, sensores táctiles, información sobre posiciones de articulaciones. Cada operación realizada por el manipulador genera datos estructurados — 57 mediciones en algunos sistemas. Y todos estos flujos deben estar perfectamente sincronizados hasta el milisegundo, de lo contrario el modelo aprenderá pura alucinación en lugar de relaciones de causa y efecto.

En China ya están operando más de cincuenta centros para la recopilación y procesamiento de datos robóticos. Solo en Pekín, uno de estos centros produce alrededor de seis mil grabaciones de ejemplos de entrenamiento diariamente. Si extrapolamos aproximadamente, la producción anual podría alcanzar decenas de miles de millones de ejemplos.

Suena impresionante, pero en realidad es una gota en el océano de las necesidades. Expertos de la empresa PowerTech realizaron un cálculo conservador: para enseñar a un robot un movimiento, necesitas aproximadamente mil a cinco mil ejemplos. Una tarea simple consistente en varios movimientos — diez a veinte mil.

Pero si hablamos de un robot universal capaz de manejar el ochenta por ciento de las tareas humanas en una industria, se necesitaría un conjunto de datos de cientos de millones. Y si las ambiciones se extienden a miles de industrias — hablamos de billones de ejemplos. El déficit es de cuatro a cinco órdenes de magnitud.

Pero esto ni siquiera es el problema más grave. Mucho más insidioso resultó ser la incompatibilidad del equipamiento. Diferentes fabricantes crean robots con diferentes configuraciones de sensores, diferentes protocolos de control, diferentes parámetros físicos. Los datos recopilados en un modelo de manipulador frecuentemente simplemente no funcionan en otro — el lenguaje de una máquina permanece completamente ajeno a otro. Esto significa que el conocimiento no se acumula, no se construye en un único activo para la industria. Cada fabricante se ve obligado a recopilar su propio conjunto de datos desde cero, repitiendo una y otra vez el mismo trabajo costoso.

Algunos centros abordan este dilema concentrándose en modelos populares — esencialmente ignorando la diversidad. Otros toman un camino más ambicioso: recopilando datos de robots de diferentes fabricantes en un espacio único, intentando enseñarle al modelo a generalizar conocimiento en equipamiento heterogéneo. Ningún enfoque ha probado aún su universalidad.

Todo esto nos recuerda los primeros días del piloto automático — una época en que parecía que el problema estaba en los algoritmos, no en los datos. Han pasado casi veinte años, miles de millones de inversión, y resulta que la verdad está en algún lugar cerca, pero no exactamente donde la buscamos. Antes de que los robots realmente entren en nuestros hogares, habrá un largo y tedioso trabajo por delante en los centros de datos, donde personas con guantes enseñarán pacientemente a las máquinas a entender el mundo físico. Los vídeos virales son marketing. El progreso real es una historia completamente diferente.

ZK
Hamidun News
Noticias de AI sin ruido. Selección editorial diaria de más de 400 fuentes. Producto de Zhemal Khamidun, Head of AI en Alpina Digital.

¿Quieres dejar de leer sobre IA y empezar a usarla?

AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.

¿Qué te parece?
Cargando comentarios…