غوبلنز في GPT-5.1: كيف استولت عادة خيالية على نموذج OpenAI
لاحظ الباحثون في GPT-5.1 اتجاهاً غريباً: يستخدم النموذج باستمرار استعارات عن غوبلنز وغريملنز وغيرها من الكائنات الخرافية. هذا ليس خللاً كلاسيكياً في النموذج، بل

في GPT-5.1، بدأت وباء غريب وتماماً غير متوقع: بدأ النموذج يذكر بإلحاح الأقزام والغرملينات وكائنات خيالية أخرى في تقريباً واحدة من كل ثلاث أو أربع إجابات. لا بشكل ملحوظ كما هو الحال مع انهيار رياضي أو هلوسة سريرية، لكن بشكل واضح ومنتظم. لاحظ باحثو OpenAI أن الاتجاه ينمو مع كل جيل جديد من النموذج، واليوم يشكون في أن هذا قد يكون إشارة إلى مشاكل أعمق في عملية التدريب وانتشار الأخطاء بين الأجيال.
شذوذ بدون انخفاض المقاييس
عادة عندما يحدث خطأ ما في نماذج اللغة الكبيرة، نراه على الفور وبوضوح: ينخفض مقياس الجودة، تصبح الإجابات هراء محض، يبدأ المستخدمون في الشكوى. لكن مع الأقزام الأمر مختلف تماماً. ذكر واحد لـ "قزم صغير" في الإجابة يبدو لطيفاً وغير ضار — ربما حتى مضحكاً وذكياً. تكمن المشكلة في الحجم: عبر أجيال التدريب، أصبحت هذه الذكريات أكثر فأكثر تكراراً. للوهلة الأولى، يبدو هذا غريباً طفيفاً، بالكاد يستحق القلق. لكن الباحثين يرون فيه عرضاً من ظاهرة أكثر خطورة. تعلم النموذج في مكان ما في طبقات المحول "يفضل" الاستعارات الخيالية عند وصف العمليات الحسابية المعقدة. بدأ الأقزام الصغيرة بمهاجمة المنطق، وتورطت الغرملينات في بناء الجملة، وكل هذا يبدو مصوراً جداً، لكن غير مناسب تماماً.
كيف تضاعفت العادة الغريبة عبر الأجيال
أنتج الجيل الأول من GPT-5.1 قزماً تقريباً مرة واحدة لكل مائة إجابة. لا شيء مخيف، لا شيء يتطلب تدخلاً. لكن المطورين لم ينظفوا بيانات التدريب من هذه الظاهرة، وعندما بدأوا بتدريب الجيل الثاني على مخرجات الأول، زادت تكرار الذكريات بما يقرب من الضعف — إلى تقريباً مرة واحدة لكل خمسين إجابة. كان الجيل الثالث يتذكر بالفعل كائنات خيالية بانتظام مثير للقلق: مرتان لكل عشرين إجابة. أظهر الجيل الرابع ذكريات أكثر تكراراً. واجه الباحثون مشكلة كلاسيكية في التعلم على المخرجات: إذا كان هناك نمط غير مرغوب فيه في البيانات، وكنت تدرب نموذجاً جديداً على مخرجات نموذج قديم، يمكن للنمط أن يتضخم بشكل أسي.
"تضاعفت الأقزام مثل الفيروس، لكن فيروس طيب — لم يضر أحداً، فقط حيّا
الجميع بابتسامة"، لاحظ أحد الباحثين.
أصبحت المشكلة حادة بما يكفي لجذب انتباه جاد. بدأ النموذج في إنتاج توصيات مثل "قزم صغير سيريك الطريق الصحيح في قاعدة البيانات" أو "ستساعدك الغرملينات على تحسين خوارزميتك".
فرضيات حول الأصل
من أين جاءت هذه الحشود من الكائنات الخيالية؟ لدى الباحثين عدة فرضيات متنافسة. الأولى: تحتوي بيانات التدريب ببساطة على فائض من الأدب الخيالي ومحتوى D&D وألعاب لعب الأدوار، حيث استخدم المطورون ذات مرة الأقزام كاستعارات لوصف الأنظمة المعقدة. تشير النسخة الثانية إلى RLHF (التعلم المعزز من التغذية الراجعة البشرية). ربما وضع المشروحون البشريون عن غير قصد علامة على إجابة بها استخدام إبداعي للقزم كـ "جيد" و "إبداعي"، وقد حدد هذا بشكل غريب علامة في النموذج. الثالثة، الفرضية الأكثر إثارة للاهتمام: لاحظ النموذج نفسه "فعالية" الاستعارات واختار الأقزام لأنهم عالميون. إنهم مألوفون بما يكفي بفضل ألعاب الفيديو والثقافة الشعبية، لكنهم مجردون بما يكفي ليناسبوا أي سياق — من قواعد البيانات إلى التعلم الآلي.
- فائض من المحتوى الخيالي في بيانات التدريب
- تعزيز موجب من RLHF للتفسيرات الإبداعية
- اكتشاف النموذج المستقل لفعالية الاستعارات
- غياب المرشحات في أجيال التدريب الوسيطة
- تضخيم أسي للنمط عند التدريب على المخرجات
ما يعنيه هذا
قصة الأقزام في GPT-5.1 ليست مجرد خطأ مضحك أو حالة فضولية. إنها تظهر كيف يمكن لنماذج اللغة الكبيرة أن تطور عادات غريبة لكن مستمرة تكون غير مرئية تماماً في مقاييس الجودة القياسية. قد لا يلاحظ المستخدمون حتى الملء البطيء لإجاباتهم بكائنات خيالية غير مرئية. إنه يذكرنا بالأهمية الحاسمة لليس فقط التقييم الكمي للنماذج — الدقة، BLEU، التقييمات البشرية — بل أيضاً التحليل النوعي للاتجاهات في مخرجات النموذج عبر أجيال التدريب. الأقزام اليوم، من يعلم ماذا غداً.