Habr AI→ المصدر

وحدة NGT Memory توضح كيفية منح LLM ذاكرة دائمة بدون قاعدة بيانات متجهة

NGT Memory هي وحدة ذاكرة مفتوحة المصدر لـ LLM تخزن حقائق حول المستخدم بين الجلسات وتحقنها في استجابات النموذج. بالداخل: بحث جيب التمام، رسم بياني ترابطي، ملف…

معالج بواسطة الذكاء الاصطناعي من Habr AI؛ بتحرير Hamidun News
وحدة NGT Memory توضح كيفية منح LLM ذاكرة دائمة بدون قاعدة بيانات متجهة
المصدر: Habr AI. كولاج: Hamidun News.
◐ استمع للمقال

يقدم مشروع NGT Memory ذو المصدر المفتوح إجابة عملية أكثر على مشكلة قديمة في نماذج اللغة الكبيرة: كيفية عدم نسيان حقائق مهمة عن المستخدم بين الجلسات. بدلاً من توسيع السياق بلا نهاية، تخزن الوحدة الحقائق وتبني ملف تعريف وتحقن الذاكرة في رد النموذج.

كيف تعمل الذاكرة

يبدأ مؤلف المشروع من فكرة بسيطة: تخزين سجل المحادثة الكامل في نافذة السياق يكون مريحاً فقط حتى حد الرمز الأول. بعد ذلك تأتي اختزالات الرسائل القديمة وتلخيص مع فقدان التفاصيل أو الاتصال بقاعدة بيانات متجهة خارجية مع حمل إضافي للبنية الأساسية. يقترح NGT Memory مسار آخر: الذاكرة تعيش مباشرة في عملية Python، وتُرفع عبر API REST و Docker، ولا تتطلب قاعدة بيانات منفصلة عند الإطلاق. الفكرة هي استخراج ليس المحادثة بأكملها، بل فقط الحقائق التي يحتاجها النموذج فعلياً في الطلب الحالي.

  • يجد التشابه جيب الزاوية الحقائق القريبة دلالياً
  • يربط الرسم البياني الترابطي المفاهيم مثل "نباتي" و"المطاعم"
  • تعزز المحافظة الهرمية الحقائق المستخدمة بكثرة إلى الذاكرة طويلة الأمد
  • يضع الملف الشخصي المنظم العمر والمدينة والنظام الغذائي والحساسية في فتحات منفصلة

على الذاكرة النصية، تبني الوحدة أيضاً ملف تعريف المستخدم. إذا كتب الشخص أجزاء متناثرة، يمكن للنظام لصق قطع مثل "أنا" + "30" + "سنة" في حقيقة مفيدة وحفظها بثقة مخفضة. إذا حدث تضارب لاحقاً، على سبيل المثال انخفاض العمر فجأة، يتم حظر التحديث حتى تصحيح صريح مثل "أخطأت". بسبب هذا، تتصرف الذاكرة ليس كسجل سلبي، بل كطبقة تحقق تحاول التمييز بين بيانات المستخدم الحقيقية والضوضاء العشوائية.

نتائج الاختبارات

أكثر ما يهم في المقالة ليس الهندسة المعمارية نفسها، بل التحقق على سيناريوهات عملية. في تجربة واحدة مع مساعد طبي ومساعد شخصي ودعم تقني، رفع وضع الذاكرة الدقة الموضوعية من 1.22 إلى 2.44 نقطة من 3. في اختبار A/B أكثر واقعية، فازت الذاكرة في 17 من 18 تقييم، وكان متوسط تقييم الرد 0.889 مقابل 0.056 بدون ذاكرة. بشكل منفصل، أجرى المؤلف 54 فحص على الحالات الحدية وحصل على 51 نتيجة ناجحة، أي حوالي 94%.

"الرد على القمامة هو أيضاً قمامة". تشرح هذه الصيغة جيداً طبقة مهمة

أخرى من النظام: مرشح الجودة. الرسائل القصيرة الخالية من المعنى والأرقام الخالصة والأحرف الخاصة وحتى ردود المساعد على مثل هذه القمامة لا تدخل الذاكرة. بخلاف ذلك، ستغرق الحقائق المفيدة بسرعة في الضوضاء. مثل هذا المرشح مهم بشكل خاص لروبوتات الدردشة والأنظمة الوكيل، حيث يكتب المستخدم في كثير من الأحيان بشكل متقطع، والنموذج نفسه يميل إلى إنشاء عبارات مهذبة لكن فارغة التي تلوث فقط الناتج عند البحث التالي في الذاكرة.

القيود الرئيسية

رغم النتائج الجيدة، لا يمكن تسمية NGT Memory بأنها ذاكرة إنتاجية عامة جاهزة بدون تحفظات. تخزن النسخة الحالية كل شيء في الذاكرة العشوائية لعملية واحدة، لذا بعد إعادة تشغيل الحاوية يتم فقدان الحالة. عند تشغيل عدة عمال، تنشأ مشكلة أخرى: كل منها يحتفظ بتخزينه الخاص للجلسة، وقد تذهب طلب الحفظ إلى عملية واحدة بينما تذهب طلب الاسترجاع إلى أخرى.

في الاختبارات، تعمل الذاكرة المحلية بسرعة — حوالي 2–3 ميلي ثانية على المعالج، لكن التأخير الرئيسي لا يزال يأتي من استدعاءات التضمين والدردشة الخارجية، التي تستغرق مئات الميلي ثانية. يصف المؤلف أيضاً بشكل منفصل الأخطاء الأكثر عملية. أدى نص الإشارة الناعم جداً إلى رؤية النموذج للذاكرة لكن تجاهلها كنصيحة اختيارية.

بعد تصعيد التعليمات، أصبحت الإجابات أكثر استقراراً. أعطى حالة أخرى غير سارة regex لاستخراج الاسم: بدأ نمط مثل I'm + name بقبول كلمات مثل allergic كاسم. تُظهر مثل هذه التفاصيل جيداً أن ذاكرة نموذج اللغة الكبيرة تصطدم ليس فقط باسترجاع، بل بعدد من القواعد الصغيرة، بدونها ينهار العرض التوضيحي بسرعة في الحوار الحقيقي.

ماذا يعني هذا

يظهر NGT Memory تحول مفيد في النهج تجاه تطبيقات نموذج اللغة الكبيرة: لا تحتاج الذاكرة فقط إلى أن تكون "ذكية"، بل يجب أن تكون قابلة للتحقق وغير مكلفة ومقاومة للقمامة. بالنسبة لمطوري روبوتات وأنظمة الذكاء الاصطناعي، هذه علامة جيدة على أن طبقة السياق طويل الأمد يمكن بالفعل تجميعها كوحدة هندسية منفصلة، بدلاً من أن تكون مجموعة من الحلول البديلة المنقطعة.

ZK
Hamidun News
أخبار الذكاء الاصطناعي بدون ضوضاء. اختيار تحريري يومي من أكثر من 400 مصدر. منتج من جمال حميدون، رئيس الذكاء الاصطناعي في Alpina Digital.

هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟

AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.

ما رأيك؟
جارٍ تحميل التعليقات…