Nvidia a expliqué le principe du DLSS 5 : le système n’a besoin que d’une image 2D et de vecteurs de mouvement
Nvidia a donné plus de détails sur le fonctionnement du DLSS 5. Selon Jacob Friedman, le système ne reçoit pas une scène 3D complète, mais une image 2D déjà…
Traité par IA depuis 3DNews AI ; édité par Hamidun News
Nvidia a quelque peu ouvert la boîte noire autour de DLSS 5. Selon Jacob Friedman, le système ne reçoit pas une scène 3D complète : il reçoit à la place une frame 2D ordinaire déjà rendue par le jeu et les vecteurs de mouvement des objets.
Ce que
Reçoit DLSS Ceci est une clarification importante pour tous les débats sur la manière exacte dont l'upscaling par IA « dessine » les pixels manquants. Beaucoup imaginent DLSS comme un modèle qui voit le monde entier du jeu presque au niveau du moteur. En pratique, le schéma est beaucoup plus compact.
Le jeu rend d'abord la frame à une résolution plus basse, puis la transmet à DLSS avec une carte de mouvement, qui indique comment les objets et les zones individuelles de l'image se déplacent d'une frame à l'autre. Sur cette base, le réseau de neurones reconstruit une image plus détaillée. Cette approche explique pourquoi la technologie peut augmenter considérablement la netteté sans un recalcul complet de la scène en résolution native.
Le modèle n'a pas besoin de reconstruire la géométrie du monde ou de recevoir toutes les données internes du moteur. Il fonctionne comme un système de reconstruction : il cherche des modèles, compare la frame actuelle avec le mouvement des éléments et prédit comment le résultat final devrait ressembler à une résolution plus élevée. C'est précisément pour cela que DLSS reste étroitement lié non seulement au réseau de neurones lui-même, mais aussi à la façon dont le jeu prépare soigneusement les données source.
"DLSS 5 reçoit une frame 2D et des vecteurs de mouvement en entrée".
Pourquoi les
Vecteurs de Mouvement Sont-Ils Nécessaires Les vecteurs de mouvement sont un élément clé de ce schéma. Ils indiquent vers où et à quelle vitesse se déplacent les objets entre les frames adjacentes. Sans eux, l'IA devrait deviner presque à l'aveugle où le bras du personnage devrait être, où l'ombre s'est déplacée, ou comment continuer une fine ligne sur un objet qui se déplace rapidement.
Plus ces données sont précises, plus l'image semble stable en dynamique, quand le joueur tourne la caméra, conduit à grande vitesse ou participe à une fusillade avec de nombreux effets à l'écran. En pratique, cela offre plusieurs avantages notables: plus grande netteté des petits détails sans rendu complet en résolution native moins de scintillement sur les fines lignes, les fils, l'herbe et les objets lointains image plus stable en mouvement, pas seulement sur une capture d'écran statique gains de performance, car le jeu n'a pas besoin de calculer chaque pixel à qualité maximale De cela découle également la dépendance inverse : si le jeu forme mal les vecteurs de mouvement, le résultat final en souffrira aussi. Par conséquent, la qualité de DLSS est déterminée non pas par un seul modèle « magique » de Nvidia, mais par une combinaison d'algorithme, de moteur et d'implémentation spécifique dans un jeu particulier.
Où
Sont les Limites de la Méthode L'explication de Nvidia est aussi utile en ce qu'elle fixe les limites des attentes. DLSS 5 ne « connaît » pas la scène comme la connaît le moteur du jeu. Il ne reçoit pas un modèle tridimensionnel complet du monde dans sa totalité, ce qui signifie que dans toute situation complexe, il s'appuie sur des informations incomplètes, bien que très utiles.
De là viennent les artefacts typiques familiers aux utilisateurs des technologies de reconstruction : flou des éléments fins, traînées aux limites contrastées ou instabilité dans les frames avec un mouvement très complexe, une transparence et une grande quantité de petits effets. En même temps, il est important de ne pas confondre la reconstruction avec un redessinage aléatoire. Le sens de DLSS est précisément que le système s'appuie sur des données réelles du jeu, pas juste « imaginer » sur l'image.
Mais l'explication de Friedman montre : même l'IA la plus forte ici reste dépendante de la qualité de la frame source et de la télémétrie de service. En d'autres termes, DLSS 5 n'est pas un bouton pour « le rendre beau à partir de rien », mais un compromis avancé entre les performances et la qualité visuelle.
Ce
Que Cela Signifie Pour les joueurs et les développeurs, c'est un signal utile : la principale force de DLSS 5 n'est pas l'accès à une certaine magie 3D cachée, mais la capacité à reconstruire plus efficacement une image à partir d'un ensemble limité de données. Plus le jeu prépare bien la frame et les vecteurs de mouvement, plus convaincant sera le résultat. Et ainsi la course à la qualité des graphiques par IA dépend de plus en plus non seulement du modèle de Nvidia, mais aussi de la discipline des studios eux-mêmes lors de l'intégration de la technologie.
Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?
AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.