Jiqizhixin (机器之心)→ original

Agent2World : Le monde peut maintenant être compilé comme un logiciel ordinaire

Vous souvenez-vous de la façon dont tout le monde admirait Sora, l'appelant le premier signe de véritables modèles mondiaux ? Des vidéos magnifiques, des…

Traité par IA depuis Jiqizhixin (机器之心) ; édité par Hamidun News
Agent2World : Le monde peut maintenant être compilé comme un logiciel ordinaire
Source : Jiqizhixin (机器之心). Collage: Hamidun News.
◐ Écouter l'article

Vous souvenez-vous de la façon dont tout le monde admirait Sora, l'appelant le premier signe de véritables modèles mondiaux ? Des vidéos magnifiques, des fourrures de chat réalistes et des vagues presque physiquement correctes. Mais il y avait un problème : vous ne pouviez pas entrer dans ce monde et y changer quelque chose.

C'était une décoration magnifique, mais complètement statique. Les chercheurs ont présenté Agent2World, et c'est peut-être le changement de paradigme le plus important dans la création de réalités numériques au cours de la dernière année. Si auparavant nous tentions d'enseigner aux réseaux de neurones à « dessiner » la physique, nous leur apprenons maintenant à écrire son code.

L'essence du concept Agent2World réside dans la transformation des modèles mondiaux en ce que les auteurs appellent un environnement symbolique exécutable. Imaginez qu'au lieu de deviner quel pixel devrait se tenir à côté d'un autre, le modèle génère la structure logique du monde, les règles d'interaction des objets et leurs états. C'est très similaire à la façon dont les moteurs de jeu modernes comme Unreal Engine fonctionnent, mais avec un détail important : le monde est créé et compilé « en temps réel » pour la tâche spécifique d'un agent IA.

Nous passons de l'observation passive à la construction active. Pourquoi est-ce nécessaire si nous avons déjà d'excellents simulateurs ? Le problème avec les anciennes méthodes est leur inflexibilité monstrueuse.

Pour entraîner un robot à servir du café, vous devez dessiner manuellement une cuisine, prescrire la physique des collisions et définir des milliers de paramètres. Agent2World rend ce processus automatique. Il utilise la puissance des grands modèles de langage pour interpréter les intentions et les transformer en code de programme fonctionnel de l'environnement.

Cela élimine la « malédiction de la dimensionnalité » qui entrave l'entraînement des agents dans des conditions complexes depuis des décennies. Maintenant, un agent peut se commander un terrain d'entraînement et le système le « cultivera » en quelques secondes. La différence critique ici réside dans la rétroaction.

Dans les modèles génératifs ordinaires, un agent est un spectateur. Dans Agent2World, un agent est un participant à part entière. S'il effectue une action, l'environnement symbolique calcule le résultat selon des règles logiques, et non selon la probabilité statistique de l'apparition du prochain cadre.

Cela résout le principal problème des LLMs modernes : les hallucinations. Dans un monde symbolique, vous ne pouvez pas simplement traverser un mur si le code ne le permet pas. Cela nous donne cet « ancrage » de l'intelligence que Yann LeCun et d'autres défenseurs du bon sens en IA insistent depuis si longtemps.

Qu'est-ce que cela signifie pour l'industrie dans son ensemble ? Nous sommes à l'aube de l'émergence de bacs à sable d'entraînement infinis générés procéduralement. C'est un chemin direct pour accélérer le développement de la robotique.

Si auparavant la collecte de données nécessitait des milliers d'heures de tests dans le monde réel ou des années de modélisation manuelle, nous pouvons maintenant exécuter des millions d'itérations dans des mondes virtuels qui se construisent et se reconstruisent d'eux-mêmes. Cela fait d'Agent2World non pas simplement un autre cadre, mais un véritable compilateur de réalité pour l'intelligence artificielle. Il semble que l'ère où nous entraînions l'IA sur des textes d'Internet cède finalement la place à l'ère où l'IA apprend de sa propre expérience dans les mondes qu'elle encode elle-même.

La question principale : la transition vers des environnements symboliques résoudra-t-elle le problème de l'insuffisance des données pour l'entraînement des robots, ou allons-nous simplement remplacer les hallucinations d'images par des bugs dans le code du monde ?

ZK
Hamidun News
Actualités IA sans bruit. Sélection éditoriale quotidienne de plus de 400 sources. Produit de Zhemal Khamidun, Head of AI chez Alpina Digital.

Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?

AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.

Qu'en pensez-vous ?
Chargement des commentaires…