Google Gemini Apprend à Générer des Modèles 3D Interactifs et des Simulations
Google a ajouté à Gemini la capacité de générer des modèles 3D interactifs et des simulations physiques directement en réponse aux questions des…
Traité par IA depuis The Verge ; édité par Hamidun News
Google a mis à jour Gemini : le chatbot peut désormais générer des modèles 3D interactifs et des simulations physiques directement dans la conversation. Il suffit de poser une question — et au lieu d'un texte statique ou d'une image, le système construit un objet avec lequel on peut interagir en temps réel. C'est l'une des expansions les plus notables des formats de réponse dans les grands modèles de langage ces derniers mois.
La fonction fonctionne comme suit : en réponse à une requête, Gemini crée un modèle tridimensionnel avec un ensemble d'éléments de contrôle interactifs. L'utilisateur peut faire tourner l'objet à la souris, déplacer des curseurs, entrer des valeurs numériques — et voir immédiatement comment le comportement du système change. Pas de téléchargements, pas de transitions vers des services tiers, pas d'attente de rendu : tout se passe dans l'interface de chat, sans aucun outil supplémentaire.
C'est une différence essentielle par rapport aux situations où un chatbot générait simplement un lien vers une simulation externe ou proposait de télécharger un fichier. Un éditeur de The Verge a testé la fonction avec un exemple spécifique. Il a demandé à Gemini de construire une simulation de la Lune en orbite autour de la Terre — sans aucun code ni configuration préalable.
Le chatbot a généré une scène tridimensionnelle avec plusieurs outils de contrôle : un curseur pour ajuster la vitesse orbitale, un bouton bascule pour contrôler la visibilité de la trajectoire orbitale et un bouton de pause. La physique a fonctionné correctement, les objets se sont déplacés en douceur et tous les éléments de contrôle ont réagi instantanément. Un tel résultat aurait précédemment nécessité le travail d'un programmeur et d'un logiciel spécialisé.
Jusqu'à présent, les chatbots génératifs traitaient principalement du texte, du code et des images. Les simulations interactives sont un niveau qualitativement différent : elles nécessitent non seulement de dessiner un objet, mais de générer la logique de fonctionnement de son comportement, y compris la physique et la réaction à l'entrée de l'utilisateur. En substance, Gemini agit désormais non seulement comme générateur de contenu, mais comme constructeur d'outils éducatifs et de recherche à la volée, sans impliquer de développeurs.
L'application d'un tel format de réponse est évidente dans plusieurs domaines. Dans l'éducation : au lieu de lire une description des orbites planétaires, un étudiant peut déplacer un curseur et voir comment les changements de vitesse affectent la trajectoire. En ingénierie — visualiser rapidement un mécanisme ou un processus physique sans exécuter de logiciel spécialisé comme MATLAB ou SolidWorks.
En médecine — examiner une structure anatomique sous tous les angles. En design — évaluer la forme d'un objet en trois dimensions directement pendant la discussion, sans quitter la conversation. Google n'a pas encore révélé les détails techniques sur la façon exacte dont Gemini génère la logique des simulations — s'il écrit du code sous le capot en utilisant WebGL, Three.
js ou utilise une approche différente. Ni la méthodologie ni les limitations sur les types d'objets supportés n'ont été officiellement annoncées. Cependant, du point de vue de l'utilisateur final, les détails de mise en œuvre ne sont pas essentiels : ce qui compte, c'est le résultat, et il semble déjà convaincant au stade des premières démonstrations.
Cette mise à jour s'inscrit dans une tendance concurrentielle plus large. Les grands laboratoires d'IA rivalisent non seulement sur la précision des réponses textuelles, mais aussi sur la richesse des formats de sortie. OpenAI a lancé Canvas pour l'édition collaborative de documents et de code, Anthropic développe des artefacts avec du HTML interactif, et maintenant Google ajoute des simulations 3D et physiques.
Les chatbots se transforment progressivement d'assistants textuels en environnements de travail multiformat. Pour les utilisateurs de Gemini, cela signifie des capacités élargies sans compétences techniques supplémentaires. Vous voulez comprendre comment fonctionne un pendule — posez la question.
Vous voulez voir une molécule en trois dimensions — posez la question aussi. Vous voulez comparer le comportement de deux ressorts différents — définissez les paramètres et observez. La limite entre une question et un manuel interactif continue de s'estomper, et les simulations 3D en sont l'une des confirmations les plus vivantes.
Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?
AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.