Habr AI→ original

Niantic Montre Comment Pokémon Go Transforme les Actions des Joueurs en Datasets pour l'IA

Niantic utilise Pokémon Go non seulement comme un jeu, mais aussi comme un mécanisme de collecte de données spatiales. reCAPTCHA, Strava Metro, Waze et même…

Traité par IA depuis Habr AI ; édité par Hamidun News
Niantic Montre Comment Pokémon Go Transforme les Actions des Joueurs en Datasets pour l'IA
Source : Habr AI. Collage: Hamidun News.
◐ Écouter l'article

La conclusion principale est simple : l'ensemble de données le plus précieux pour l'IA est souvent collecté non pas en laboratoire, mais au moment où une personne joue simplement, conduit en ville, résout un captcha ou trace un itinéraire dans une application familière. Le cas de Pokémon Go le démontre particulièrement bien. Niantic a passé des années à construire une infrastructure de réalité augmentée autour du jeu : positionnement visuel, cartes 3D des lieux et collecte d'images du monde réel via les smartphones des utilisateurs.

Au début, cela semblait être un moyen pratique de numériser l'environnement, mais cela s'est ensuite transformé en un système complet de création d'ensembles de données spatiaux. En conséquence, Pokémon Go est devenu non seulement un jeu mobile avec des géomarques, mais un environnement où les actions de millions de personnes aident les modèles à mieux comprendre l'espace physique. Par la suite, ces données ont commencé à être utilisées pour de grands modèles géospatiaux et des systèmes d'IA spatiale qui ont besoin non seulement de reconnaître une image, mais de corréler un point spécifique avec une carte mondiale du territoire.

C'est pourquoi le partenariat de Niantic avec Coco Robotics a du sens : les technologies créées pour les scénarios de RA se sont avérées utiles pour les robots de livraison, qui ont également besoin de naviguer avec confiance en ville. La mécanique ici est universelle. Un utilisateur effectue une action utile pour lui-même—numérise un objet, contourne les embouteillages, fait du vélo sur un itinéraire familier ou confirme qu'il n'est pas un bot—tandis que le système reçoit simultanément des observations structurées : images liées aux coordonnées, trajectoires de mouvement, événements routiers ou réponses humaines où l'automatisation échoue.

Après nettoyage et agrégation, tout cela devient des ensembles de données pour la vision, la navigation, la planification et la prise de décision. Un exemple classique de cette approche est apparu bien avant le boom de l'IA générative : reCAPTCHA. Pour les utilisateurs, c'était une simple vérification, mais en réalité, les gens aidaient le système à reconnaître des mots avec lesquels l'OCR avait du mal lors de la numérisation de vieux livres et journaux.

Dès 2008, reCAPTCHA fonctionnait sur plus de 40 000 sites Web et a aidé à reconnaître correctement plus de 440 millions de mots. C'est un exemple ancien mais très clair de la façon dont une action routinière devient partie d'un pipeline de production d'apprentissage automatique. Dans les services urbains, ce principe devient encore plus important, car les données décrivent directement le monde physique.

Strava Metro agrège et anonymise les traces des utilisateurs pour que les urbanistes comprennent mieux comment les gens se déplacent réellement dans les rues, plutôt que de simplement regarder comment le réseau routier est dessiné. Waze collecte les informations sur les embouteillages, les accidents, les réparations et les fermetures en temps réel, transformant une carte d'une couche statique en un flux presque continu d'événements. Pour la navigation par IA, la robotique et la livraison, ces données sont particulièrement précieuses : elles décrivent non pas une ville théorique, mais une ville en mouvement.

Cependant, il y a une limitation : l'audience d'un service particulier ne correspond pas toujours à la structure de toute la population, de sorte qu'un ensemble de données utile peut ne pas être entièrement représentatif et nécessite une interprétation prudente. Les jeux servent depuis longtemps d'environnement pour l'entraînement de l'IA, même s'ils n'ont rien à voir avec les rues et les cartes. Dans StarCraft II, les chercheurs utilisent les rediffusions des matchs humains comme enregistrements de décisions complexes sous information incomplète, où les ressources doivent être distribuées, les plans modifiés et le comportement des adversaires pris en compte.

Dans un ensemble de données, après filtrage, il restait environ 1,4 million de parties, 2,8 millions d'épisodes et 3,5 milliards d'observations d'entraînement—une échelle difficile à obtenir manuellement dans tout autre environnement. Et GTA V et des mondes virtuels similaires fournissent des scènes synthétiques pour la vision par ordinateur et la navigation : vous pouvez rapidement modifier la météo, l'éclairage, la densité du trafic et la position de la caméra, collectant de grands ensembles de données sans déplacements coûteux et annotations manuelles. Par conséquent, l'IA moderne apprend soit des traces du comportement humain, soit des mondes numériques réalistes spécialement adaptés à la collecte de données.

Qu'est-ce que cela signifie en pratique : la concurrence en IA dépend de plus en plus non seulement de la qualité du modèle, mais de qui a réussi à intégrer la collecte de données dans le comportement naturel de l'utilisateur. Le gagnant n'est pas nécessairement celui qui parle le plus fort d'un nouveau réseau de neurones, mais celui qui a créé un service où les gens eux-mêmes, presque imperceptiblement, produisent des données pour la prochaine génération d'IA.

ZK
Hamidun News
Actualités IA sans bruit. Sélection éditoriale quotidienne de plus de 400 sources. Produit de Zhemal Khamidun, Head of AI chez Alpina Digital.

Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?

AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.

Qu'en pensez-vous ?
Chargement des commentaires…