Project Genie de Google: maintenant chacun peut construire son Mario 64 (mais très mal)
Imaginez vous réveiller dans un monde où créer un nouvel opus d'une franchise légendaire ne nécessite pas des centaines de programmeurs, cinq ans de…
Traité par IA depuis The Verge ; édité par Hamidun News
Imaginez vous réveiller dans un monde où créer un nouvel opus d'une franchise légendaire ne nécessite pas des centaines de programmeurs, cinq ans de développement et le budget d'un petit pays. Il suffit simplement de le demander à votre ordinateur. Cette semaine, Google DeepMind a jeté de l'huile sur le feu de ces fantasmes technologiques en permettant à des testeurs sélectionnés de tester Project Genie—son nouvel outil expérimental qui transforme le texte en quelque chose ressemblant à des mondes interactifs.
L'un des chanceux a immédiatement décidé de mettre le système à l'épreuve et l'a forcé à générer des clones de succès Nintendo. Le résultat s'est avéré étrange, par moments terrifiant, mais incroyablement important pour comprendre où se dirige toute l'industrie du divertissement.
Soyons honnêtes : ce que produit Genie en ce moment ressemble au mauvais rêve d'un gamer des années quatre-vingt-dix. Quand on demande au réseau de neurones de créer quelque chose ressemblant à Super Mario 64 ou Metroid Prime, il dessine docilement des paysages tridimensionnels qui s'effondrent à la première tentative d'interaction. Dans l'un des exemples, deux Link couraient sur l'écran à la fois, et la physique des sauts évoquait les souvenirs des pires jeux indie-horror de Steam.
Mais l'ironie est que Google DeepMind n'essayait même pas de faire un jeu parfait. Ils tentent d'enseigner à l'IA à comprendre l'essence même de l'« espace de jeu ». Contrairement aux générateurs vidéo ordinaires, qui prédisent simplement l'image suivante, Genie tente de simuler le contrôle et la réaction du monde aux actions de l'utilisateur.
Ce n'est pas juste un flux vidéo—c'est une hallucination interactive que vous pouvez contrôler.
Pour comprendre l'ampleur de ce qui se passe, il faut se rappeler comment fonctionnent réellement les jeux modernes. Habituellement, derrière chaque buisson d'une forêt virtuelle se cache le travail d'un modeleur, et derrière chaque saut du personnage figurent des milliers de lignes de code du moteur de physique. Project Genie prend un chemin différent.
Il a été entraîné sur d'énormes quantités d'enregistrements vidéo de jeu, « observant » essentiellement comment fonctionnent les règles des mondes virtuels. En résultat, le réseau de neurones commence intuitivement à comprendre que si un personnage appuie sur le bouton de saut, la caméra doit monter et le sol descendre. Il ne connaît pas les lois de Newton ; il sait simplement que « c'est généralement comme ça que ça marche ».
C'est un changement fondamental dans l'approche du développement : de la programmation rigide à l'apprentissage par l'exemple.
Bien sûr, pour l'instant, tout cela ressemble à un jouet amusant pour générer des mèmes. Les artefacts d'image suintent de partout, les objets matérialisent de nulle part, et les commandes semblent visqueuses comme dans une gelée épaisse. Cependant, il est bon de se rappeler à quoi ressemblaient les premiers générateurs d'images il y a seulement quelques années.
Ces mêmes « monstres à six doigts » se sont transformés en chefs-d'œuvre photorréalistes de Midjourney pratiquement du jour au lendemain. Si les rythmes de développement se maintiennent, dans un an ou deux Genie pourra produire non des esquisses tordues mais des niveaux tout à fait jouables. Et c'est là que les avocats de Nintendo et des autres grands éditeurs auront une vraie migraine.
Comment protéger la propriété intellectuelle d'un style visuel quand un réseau de neurones crée du « non-Mario » en temps réel sur la base d'une simple description textuelle ?
Pour l'industrie du développement de jeux vidéo, cela signifie le commencement de la fin de l'ère des moteurs traditionnels comme Unreal ou Unity sous leur forme actuelle. Pourquoi ajuster manuellement l'éclairage et les collisions si vous pouvez entraîner un modèle sur les meilleurs exemples et lui permettre de générer des variations infinies de niveaux à la volée ? Cela ouvre la voie à un contenu absolument personnalisé.
Imaginez un jeu qui s'adapte à vos peurs, vos préférences et votre niveau de compétence, créant de nouvelles salles et des ennemis au moment précis où vous ouvrez la porte suivante. Ce n'est plus simplement un jeu—c'est une série infinie où vous êtes à la fois le scénariste et le personnage principal et le seul spectateur.
L'essentiel : Google a montré que l'IA est prête à aller au-delà du texte et des images statiques. Nous nous tenons au seuil d'une ère de « mondes dynamiques » où la ligne entre regarder une vidéo et jouer à un jeu s'effacera définitivement. L'industrie sera-t-elle capable de digérer une telle technologie, ou nous attend-il un océan de déchets procéduraux de faible qualité ?
Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?
AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.