Habr AI→ original

Niantic Muestra Cómo Pokémon Go Convierte Acciones de Jugadores en Datasets para IA

Niantic usa Pokémon Go no solo como un juego, sino también como un mecanismo de recopilación de datos espaciales. reCAPTCHA, Strava Metro, Waze e incluso los…

Procesado por IA desde Habr AI; editado por Hamidun News
Niantic Muestra Cómo Pokémon Go Convierte Acciones de Jugadores en Datasets para IA
Fuente: Habr AI. Collage: Hamidun News.
◐ Escuchar artículo

La conclusión principal es simple: el conjunto de datos más valioso para la IA a menudo se recopila no en un laboratorio, sino en el momento en que una persona simplemente juega, conduce por la ciudad, resuelve un captcha o traza una ruta en una aplicación familiar. El caso de Pokémon Go lo demuestra particularmente bien. Niantic pasó años construyendo infraestructura de realidad aumentada alrededor del juego: posicionamiento visual, mapas 3D de ubicaciones y recopilación de imágenes del mundo real a través de teléfonos inteligentes de usuarios.

Al principio, esto parecía una forma conveniente de escanear el entorno, pero posteriormente se convirtió en un sistema completo de creación de conjuntos de datos espaciales. Como resultado, Pokémon Go se convirtió no solo en un juego móvil con geotags, sino en un entorno donde las acciones de millones de personas ayudan a los modelos a comprender mejor el espacio físico. Posteriormente, estos datos comenzaron a utilizarse para grandes modelos geoespaciales y sistemas de IA espacial que necesitan no solo reconocer una imagen, sino correlacionar un punto específico con un mapa global del área.

Por eso, la asociación de Niantic con Coco Robotics tiene sentido: las tecnologías creadas para escenarios de RA resultaron útiles para robots de entrega, que también necesitan navegar con confianza por la ciudad. La mecánica aquí es universal. Un usuario realiza una acción útil para sí mismo—escanea un objeto, evita el tráfico, anda en bicicleta por una ruta familiar o confirma que no es un bot—mientras que el sistema simultáneamente recibe observaciones estructuradas: imágenes vinculadas a coordenadas, trayectorias de movimiento, eventos de tránsito o respuestas humanas donde la automatización falla.

Después de la limpieza y agregación, todo esto se convierte en conjuntos de datos para visión, navegación, planificación y toma de decisiones. Un ejemplo clásico de este enfoque apareció mucho antes del auge de la IA generativa: reCAPTCHA. Para los usuarios, era una simple verificación, pero en realidad, las personas estaban ayudando al sistema a reconocer palabras con las que el OCR tenía dificultades al digitalizar libros y periódicos antiguos.

Ya en 2008, reCAPTCHA se ejecutaba en más de 40 mil sitios web y ayudó a reconocer correctamente más de 440 millones de palabras. Este es un ejemplo antiguo pero muy claro de cómo una acción rutinaria se convierte en parte de un pipeline de producción de aprendizaje automático. En servicios urbanos, este principio se vuelve aún más importante, porque los datos describen directamente el mundo físico.

Strava Metro agrega y anonimiza las rutas de los usuarios para que los planificadores urbanos comprendan mejor cómo se mueven realmente las personas por las calles, en lugar de solo cómo se dibuja la red vial. Waze recopila información sobre tráfico, accidentes, reparaciones y cierres en tiempo real, convirtiendo un mapa de una capa estática en un flujo casi continuo de eventos. Para navegación con IA, robótica y entrega, estos datos son particularmente valiosos: describen no una ciudad teórica, sino una ciudad en movimiento.

Sin embargo, hay una limitación: la audiencia de un servicio particular no siempre coincide con la estructura de toda la población, por lo que incluso un conjunto de datos útil puede no ser totalmente representativo y requiere una interpretación cuidadosa. Los videojuegos han servido durante mucho tiempo como un entorno para entrenar IA, incluso si no tienen nada que ver con calles y mapas. En StarCraft II, los investigadores utilizan repeticiones de partidas humanas como registros de decisiones complejas bajo información incompleta, donde deben distribuirse recursos, cambiar planes y adaptarse al comportamiento del oponente.

En un conjunto de datos, después del filtrado, quedaron aproximadamente 1,4 millones de juegos, 2,8 millones de episodios y 3,5 mil millones de observaciones de entrenamiento—una escala difícil de obtener manualmente en cualquier otro entorno. Y GTA V y mundos virtuales similares proporcionan escenas sintéticas para visión por computadora y navegación: puede cambiar rápidamente el clima, la iluminación, la densidad del tráfico y la posición de la cámara, recopilando grandes conjuntos de datos sin costosos viajes de campo y anotación manual. Por lo tanto, la IA moderna aprende de rastros del comportamiento humano o de mundos digitales realistas especialmente adaptados para la recopilación de datos.

¿Qué significa esto en la práctica?: la competencia en IA depende cada vez más no solo de la calidad del modelo, sino de quién ha logrado integrar la recopilación de datos en el comportamiento natural del usuario. El ganador no es necesariamente quien habla más fuerte sobre una nueva red neuronal, sino quien creó un servicio donde las personas mismas, casi imperceptiblemente, producen datos para la próxima generación de IA.

ZK
Hamidun News
Noticias de AI sin ruido. Selección editorial diaria de más de 400 fuentes. Producto de Zhemal Khamidun, Head of AI en Alpina Digital.

¿Quieres dejar de leer sobre IA y empezar a usarla?

AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.

¿Qué te parece?
Cargando comentarios…