التحكم في نماذج اللغة الكبيرة في لعبة الأدوار: معمارية Beyond The Verge
أخضع مطورو Beyond The Verge تحديات نماذج اللغة الكبيرة في ألعاب الأدوار: انجراف النموذج والنسيان والانتهاك غير المقصود للقوانين. الحل جذري: خادم خلفي صارم…
معالج بواسطة الذكاء الاصطناعي من Habr AI؛ بتحرير Hamidun News
Beyond The Verge - لعبة أدوار نصية روسية بالكامل تعتمد على نماذج اللغة الكبيرة - واجهت المشكلة الكلاسيكية: تنسى النماذج السياق، تنتهك قوانين اللعبة، وتضيف أشياء من العدم. بعد ثلاثين حركة، تتحول اللعبة إلى دردشة غير منطقية. اختار المطورون عدم محاولة 'ترويض' النموذج، بل سحب السيطرة على ميكانيكا اللعبة منه تماماً.
لماذا لا تناسب LLM ميكانيكا اللعبة
النماذج توليدية بطبيعتها، بينما ألعاب الأدوار تتطلب حتمية صارمة. النموذج يتذكر فقط سياق النافذة الحالية، ولا يميز بين خياله والحالة الفعلية للعبة، ويمكنه تغيير السرد بشكل عفوي أو انتهاك المنطق الداخلي. إذا سمحنا له بإدارة المخزون، سيفقد السيف بسهولة، ينسى القيود، أو يضيف شيئاً لم يلتقطه اللاعب أبداً.
المعمارية: LLM كمجرد راوٍ للقصة
قسمت Beyond The Verge المسؤوليات بشكل واضح. جميع ميكانيكا اللعبة تعمل وفق منطق حتمي في الخادم الخلفي:
- المخزون - صف في قاعدة بيانات PostgreSQL يحتوي على معرفات الأشياء والوزن والخصائص
- الخريطة - رسم بياني يضم الرؤوس (المواقع) والحواف (الممرات بينها)
- حالة الشخصية - متجهات في pgvector للبحث السريع عن السياق ذي الصلة
- نظام القتال - معادلات الضرر والدفاع والضربات الحرجة - كل شيء محسوب بدقة
- المهام والسياقات - آلات حالة محدودة مع حالات ثابتة ومعروفة مسبقاً
تتلقى LLM لقطة من حالة اللعبة بصيغة نصية وتولد وصفاً فقط: 'دخلت غابة مظلمة. تسمع أصوات الطيور. في مخزونك: خنجر، إكسير الماناة (30%). أمامك هوبلين ضعيف'. يتم تحليل إجراء اللاعب والتحقق منه من خلال منطق الخادم الخلفي (هل يمكن للشخصية تنفيذ هذا الإجراء؟)، ثم يحسب النظام النتيجة وأخيراً تصف LLM العواقب والتطورات.
FastAPI + PostgreSQL + pgvector
المكدس التكنولوجي بسيط لكن فعال جداً: FastAPI يعالج حركات اللاعب، PostgreSQL يخزن كامل حالة اللعبة (المخزون والشخصيات غير اللاعب والمهام)، pgvector يبحث عن السياق ذي الصلة لـ LLM (ذكريات الشخصية وأجواء الموقع)، و Flutter Web يوفر الواجهة. عندما يتحرك اللاعب، يحدّث الخادم الخلفي موقعه في رسم الخريطة البياني، يبحث عن أفضل الأوصاف في pgvector، ويجمع الأشياء المرئية. تتلقى LLM سياقاً مضغوطاً وتولد النص في أقل من ثانية واحدة. لا توجد حروب مع ذاكرة النموذج، ولا فقدان للذاكرة.
قابلية التوسع عبر نظام الإصدارات
عند وجود ألف جلسة لعبة متزامنة، قد تتعارض الحالات: حركتان في اللحظة ذاتها - من يفوز؟ الحل: القفل المتفائل مع إصدار الحالة. لكل حالة رقم إصدار؛ إذا تم اكتشاف تعارض أثناء حركة ما، يعيد العميل المزامنة وتعاد الحركة من جديد. لا توجد حالات تسابق، والنظام يتوسع بشكل خطي.
ماذا يعني هذا
LLM أداة لتوليد النصوص وليست للإدارة والتحكم. بالنسبة للأنظمة الموثوقة، يجب أن يعيش المنطق والحالة والميكانيكا في الكود وليس في النموذج. تترجم LLM الأحداث إلى وصف حي وجذاب. هذا نمط معماري ينطبق على جميع الأنظمة القائمة على الذكاء الاصطناعي ذات الحالة الحتمية: وكلاء المتصفح والمحاكاات المعقدة والألعاب. فصل ما يمكن إدارته عما هو توليدي هو الطريق إلى الموثوقية والقابلية للتوسع.
هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟
AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.