Alibaba présente Happy Oyster — un modèle d'AI pour générer des mondes 3D interactifs
Alibaba a dévoilé Happy Oyster, un world model pour générer des mondes 3D interactifs et de la vidéo. Le modèle peut assembler des scènes à partir de texte…
Traité par IA depuis 3DNews AI ; édité par Hamidun News
Alibaba a présenté Happy Oyster — un modèle IA mondial pour créer des espaces 3D interactifs et des vidéos qui simulent le comportement du monde réel. Pour l'entreprise, ce n'est pas simplement un projet de démonstration impressionnant, mais une autre étape dans la lutte pour le marché de l'IA générative, où les intérêts des plateformes cloud, des studios de jeux et des producteurs de contenu se chevauchent de plus en plus.
Ce qu'Alibaba a montré
Happy Oyster appartient à la classe des soi-disant modèles du monde — des systèmes qui ne font pas seulement rendre une seule vidéo basée sur un prompt, mais tentent d'assembler un environnement virtuel cohérent où vous pouvez changer la scène, la caméra et le comportement des objets. Alibaba dit que le modèle convient au développement de jeux, à la production cinématographique et à d'autres projets vidéo où le succès dépend non pas d'une seule belle image, mais d'un monde connecté ayant un sens de l'espace et de la logique.
Selon l'entreprise, Happy Oyster a deux modes de fonctionnement. Le premier est orienté vers la construction d'un monde basé sur des invites textuelles et visuelles, le second vers l'exploration d'une scène déjà créée. Un détail important est que le modèle peut répondre à de nouvelles commandes directement pendant la génération, et pas seulement en mode « une demande — un résultat ». Dans les démonstrations, il suffit que l'utilisateur ajoute une nouvelle instruction pour ajouter un corbeau au cadre, modifier le mouvement de la caméra ou faire interagir les personnages entre eux.
- Génération de scènes 3D à partir de texte et d'images
- Vidéo interactive jusqu'à trois minutes
- Changements de scène pendant la génération
- Modes séparés pour créer et explorer des mondes
- Application pour les jeux, les films et la prévisualisation
Pourquoi cela pour Alibaba
Le lancement d'Happy Oyster s'inscrit bien dans la restructuration plus large de l'IA d'Alibaba. L'entreprise montre ouvertement qu'elle veut non seulement publier des modèles de recherche, mais les transformer en produits commerciaux. L'objectif est ambitieux : augmenter les revenus annuels des technologies cloud et de l'IA de cinq fois en cinq ans — à 100 milliards de dollars. Dans ce contexte, Alibaba a simultanément modifié sa structure interne, constitué des équipes autour de nouveaux métiers de l'IA et accéléré le lancement de modèles.
Le nouvel outil a été développé par Alibaba Token Hub, ou ATH, créé spécifiquement pour consolider les initiatives clés de l'IA. L'accès à Happy Oyster est actuellement limité à un programme de test anticipé, ce qui signifie qu'il s'agit plutôt de montrer les capacités et de recueillir des commentaires qu'une sortie en masse. Mais le marché a rapidement réagi au signal : le jour de l'annonce, les actions d'Alibaba ont augmenté notablement, surpassant l'ensemble du marché. Cela montre que les investisseurs attendent de l'entreprise non pas d'autres promesses d'IA, mais des produits clairs avec un potentiel de revenus.
Il est aussi important de noter que juste une semaine avant, Alibaba a révélé la paternité du modèle vidéo Happy Horse, qui a fait sensation dans les classements de l'industrie. La combinaison d'Happy Horse et d'Happy Oyster montre que l'entreprise construit une gamme de produits non autour d'un seul chatbot, mais autour d'un ensemble de modèles pour différents formats de contenu — de la courte vidéo aux mondes virtuels interactifs. C'est important à la fois pour le positionnement dans le cloud et pour les ventes aux clients des studios.
La course aux modèles du monde
L'intérêt pour les modèles du monde croît maintenant non seulement pour le cinéma et les jeux. De tels systèmes sont nécessaires là où l'IA doit comprendre l'espace, la physique et la séquence des actions. C'est pourquoi ils sont considérés comme une couche fondatrice pour le contenu 3D, l'entraînement des robots et l'amélioration de la perception de l'environnement dans les véhicules autonomes. Si un modèle de langage apprend à travailler avec des mots, un modèle du monde apprend comment le monde est organisé dans un cadre : où se trouvent les objets, comment ils se déplacent et ce qui se passe quand l'utilisateur intervient dans la scène.
Dans ce domaine, Alibaba entre en concurrence directe avec Tencent, qui possède déjà la ligne Hunyuan3D, ainsi qu'avec Google et d'autres acteurs travaillant sur des systèmes similaires. Parallèlement, des équipes plus nouvelles comme World Labs entrent également dans la course, misant aussi sur la génération et l'exploration d'environnements 3D. La différence réside maintenant non seulement dans la qualité de l'image, mais dans la durée pendant laquelle le modèle maintient la cohérence du monde, accepte de nouvelles commandes et convient pour les scénarios de production réels.
Ce que cela signifie
Happy Oyster montre que la prochaine étape de l'IA générative s'éloigne des images individuelles et des courtes vidéos vers des environnements gérés où les utilisateurs peuvent non seulement regarder, mais intervenir dans ce qui se passe. Pour Alibaba, c'est une chance de vendre des outils IA plus coûteux via le cloud, et pour le marché — un signal que la concurrence se déplace des interfaces de chat vers la 3D, la vidéo et la production interactive.
Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?
AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.