Unity a montré comment créer des PNJ vocaux avec mémoire et contexte du monde
Unity a présenté une approche pour créer un PNJ vocal qui entend le joueur, se souvient des conversations passées et répond en tenant compte du contexte du…
Traité par IA depuis Habr AI ; édité par Hamidun News
Un guide détaillé a été publié sur la façon de construire en Unity des PNJ vocaux qui ne se contentent pas de répondre selon un script, mais qui tiennent compte de la mémoire, de l'état du monde et des dialogues précédents. À la base de l'approche se trouve la combinaison d'un LLM local, d'une entrée vocale et de l'architecture Generative Agents, afin que le personnage réagisse au joueur comme à un véritable interlocuteur.
Comment le PNJ Change
L'idée principale du matériel est de s'éloigner des répliques classiques déclenchées par des événements et de construire un personnage qui perçoit la conversation comme une histoire continue. Si le joueur a déjà posé des questions sur le forgeron, visité le village pendant la journée, puis est revenu le soir, le PNJ ne recommence pas le dialogue à zéro. Il obtient le contexte, se souvient des rencontres précédentes et répond comme s'il vivait réellement dans le monde, pas seulement dans une fenêtre de dialogue.
L'auteur décrit le système comme un assemblage séquentiel : de la première requête au modèle de langage local jusqu'à une interface vocale complète. En résultat, le PNJ peut entendre la phrase du joueur, l'interpréter en tenant compte des règles du monde, faire un raisonnement déductif simple et retourner une réponse par la voix. Pour les développeurs indépendants, c'est un changement important : au lieu de branches de dialogue rigides, apparaît une couche de comportement plus flexible qui peut être développée sans des milliers de répliques pré-écrites.
De Quels Blocs Elle Se Compose
Au centre de l'architecture se trouvent non pas un seul invite magique, mais plusieurs couches de travail qui maintiennent la sensation d'un personnage "vivant". Selon la description, le système est construit autour de la mémoire, du contexte de la scène et du contour vocal, et le LLM agit non seulement comme un générateur de texte, mais comme un mécanisme pour prendre des décisions locales dans le monde défini.
- Le LLM local traite les répliques et forme une réponse sans nécessairement envoyer les données vers le cloud
- La mémoire stocke les conversations précédentes, les faits sur le personnage et les événements importants
- Le contexte du monde suggère au modèle l'heure du jour, le lieu, les rôles du PNJ et la situation actuelle
- La couche vocale convertit la parole du joueur en texte et prononce la réponse finale du personnage
Séparément, il est important de s'appuyer sur Generative Agents de Stanford. Cette architecture est connue pour diviser le comportement de l'agent en observations, mémoire, réflexion et planification. Dans un contexte de jeu, cette approche est utile car le PNJ cesse d'être simplement un "bouton parlant". Il peut connecter la question actuelle du joueur avec les événements passés, tenir compte des règles locales et répondre non pas au hasard, mais dans le cadre de son caractère et de son rôle.
Pourquoi C'est Intéressant pour les Développeurs
Le matériel montre non pas une idée abstraite d'"IA dans les jeux", mais un itinéraire pratiquement applicable pour le développement Unity. Ici, le format étape par étape est important : d'abord un canal de communication de base avec le modèle est établi, puis les connaissances sur le monde sont ajoutées, après cela — la mémoire à long terme et la voix. Cet ordre abaisse la barrière d'entrée. Un développeur n'a pas besoin de construire un système parfait d'emblée ; vous pouvez commencer avec un PNJ, vérifier la qualité du dialogue, puis compliquer la mécanique.
"Bonjour, où est la taverne ici ?" — un exemple d'une demande à
laquelle le PNJ doit répondre en tenant compte de la conversation précédente et du contexte actuel.
Un autre point fort est l'accent sur un modèle local. Pour les prototypes et les petits studios, cela signifie plus de contrôle sur les coûts, moins de dépendance vis-à-vis des API externes et la capacité d'expérimenter même lorsque Internet constant ou le budget cloud est limité. Bien sûr, une telle approche nécessite un réglage soigneux : vous devez surveiller le volume de mémoire, la qualité de la reconnaissance vocale et vous assurer que le modèle ne sort pas du lore. Mais le simple fait qu'un tel système puisse être assemblé dans Unity dans une séquence claire rend le sujet beaucoup plus proche du développement réel que de nombreuses conversations générales sur l'IA-PNJ.
Ce Que Cela Signifie
Le marché des jeux évolue graduellement des dialogues scripés vers des personnages qui se souviennent, écoutent et réagissent au contexte. De tels guides sont importants non pas parce qu'ils donnent un résultat AAA prêt à l'emploi, mais parce qu'ils transforment l'idée de "PNJ vivants" en une tâche d'ingénierie reproductible pour les équipes Unity.
Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?
AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.