3DNews AI→ المصدر

كشفت OpenAI أصل «الغريملنز» في ChatGPT وأظهرت كيفية إزالة القيد في Codex

اعترفت OpenAI بخلل غريب في سلوك GPT: بدءًا من GPT-5.1، راحت النماذج تُدرج على نحو متزايد غوبلنز وغريملنز ومخلوقات أخرى في الإجابات. وتبيّن أن السبب يعود إلى…

معالج بواسطة الذكاء الاصطناعي من 3DNews AI؛ بتحرير Hamidun News
كشفت OpenAI أصل «الغريملنز» في ChatGPT وأظهرت كيفية إزالة القيد في Codex
المصدر: 3DNews AI. كولاج: Hamidun News.
◐ استمع للمقال

أوضحت OpenAI علناً خاصية غريبة في نماذجها: بدأت بإدراج الجنود والعفاريت وكائنات أخرى بتكرار أكثر بكثير في الإجابات. ربطت الشركة هذا ليس بميمات الإنترنت، بل بإشارة تدريب محددة داخل نمط الشخصية Nerdy وأظهرت حتى كيفية إزالة مرشح الحماية مؤقتاً في Codex.

من أين جاءت الكائنات

في 29 أبريل 2026، أصدرت OpenAI تحليلاً مفصلاً حول سبب بدء نماذج GPT بالإساءة في استخدام مثل هذه الكلمات في الاستعارات. بناءً على الملاحظات الداخلية للشركة، بدأ التحول الملحوظ بعد إطلاق GPT-5.1: شكا المستخدمون من نبرة مألوفة جداً، وأشار الباحثون إلى تكرار حركات لفظية.

عندما تحقق الفريق من الإحصائيات، تبين أن تكرار كلمة "goblin" في ChatGPT زاد بنسبة 175٪، و"gremlin" زاد بنسبة 52٪. مع GPT-5.4، أصبحت المشكلة أكثر وضوحاً، وأظهر التحليل تفصيلاً مهماً: ارتبط الارتفاع بقوة بنمط الشخصية Nerdy. تم استخدام هذا الأسلوب في حوالي 2.5٪ فقط من إجابات ChatGPT، لكنه شمل 66.7٪ من جميع ذكر "goblin". بالنسبة لـ OpenAI، أصبح هذا حجة ضد النسخة البسيطة من تأثير لغة الإنترنت. إذا كان الأمر مجرد مسألة ثقافة شبكة عامة، فستتوزع هذه الكلمات بشكل موحد أكثر بكثير عبر حركة المرور.

لماذا ترسخت العادة

تشرح OpenAI أن جذر المشكلة كان في نظام المكافآت خلال التدريب بالتعلم المعزز. حصل النموذج المضبوط على أسلوب مرح وصريح "الحنين" على نقاط إضافية للإجابات التي تتضمن مثل هذه الصور. أظهر التدقيق الداخلي أن إشارة مكافأة خاصة لـ Nerdy قيّمت المتغيرات ذات "goblin" أو "gremlin" أعلى من الصيغ المحايدة في 76.2٪ من مجموعات البيانات المفحوصة.

ثم جاء التأثير الجانبي غير السار: بدأت حركة لفظية ناجحة في وضع واحد بالتسرب إلى سيناريوهات أخرى. تصف OpenAI هذا بشكل منفصل باعتباره حلقة تغذية راجعة: أولاً يتم تعزيز الأسلوب المطلوب، ثم تترسخ الكلمات المميزة معه، ثم تظهر بشكل متزايد في إجابات النشر الجديدة وتعود إلى بيانات التدريب بين مراحل الضبط الدقيق. نتيجة لذلك، ينقل النموذج تقنية معينة إلى سلوك أوسع، على الرغم من أنها كان يجب أن تبقى فقط ضمن إعداد شخصية واحد.

بشكل مبسط، بدت السلسلة كالتالي:

  • تلقى الأسلوب المرح مكافآت
  • مع ذلك، تلقت الكلمات المميزة أيضاً مكافآت
  • ظهرت مثل هذه الصيغ بشكل متزايد في إجابات النشر الجديدة
  • تم إعادة استخدام هذه الإجابات في بيانات SFT والتفضيل
  • أعاد النموذج بشكل متزايد إنتاج نفس النمط خارج Nerdy

كشف البحث في بيانات SFT لـ GPT-5.5 أن المشكلة تتضمن أكثر من كلمتين فقط. ظهرت كائنات أخرى في أمثلة التدريب: الراكون والعفاريت والأوغريين والحمام. هذا هو السبب في أن المرشح في Codex بدا غريب جداً ومفصل جداً: لم يكن يحجب مجرد ميم واحد، بل عائلة كاملة من عادات لفظية محفورة بالصدفة التي جعلها النموذج جزءاً من أسلوبه الطبيعي حتى في الإجابات المتعلقة بالعمل.

كيفية إصلاح OpenAI لها

بعد إطلاق GPT-5.4، أزالت الشركة نمط الشخصية Nerdy في مارس 2026، ثم أزالت إشارة المكافأة التي كانت تدفع النموذج نحو مثل هذه الاستعارات. بالتوازي، بدأت OpenAI بتصفية بيانات التدريب التي تحتوي على هذه الكلمات لتقليل فرصة ظهورها بشكل غير مناسب. ومع ذلك، كان يتم بالفعل تدريب GPT-5.5 قبل أن يتتبع الفريق السبب الأساسي، لذا وصلت آثار المشكلة إلى Codex—أداة للبرمجة بناءً على النموذج الجديد.

"في البداية بدا مضحكاً، لكن عدد شكاوى الموظفين أصبح مثيراً للقلق."

خلال الاختبارات المبكرة لـ Codex، رأى الموظفون نفس طريقة الكلام مرة أخرى، وأضافت OpenAI تعليماً مباشراً إلى موجه المطور لعدم ذكر هذه الكائنات بدون ضرورة صريحة. لكن القصة لم تنته هناك: في تحليلها، نشرت الشركة أيضاً الأمر الذي يشغل Codex بدون هذا التعليمات المحظورة. بمعنى آخر، لم تعترف OpenAI فقط علناً بالخلل الغريب، بل سمحت فعلياً للمتحمسين بإعادته للتجارب.

ماذا يعني هذا

قصة "العفاريت" هي مثال جيد على كيفية أن إشارة مكافأة صغيرة يمكن أن تضر بسلوك نموذج كبير بشكل أكثر حدة مما تقترحه المعايير. بالنسبة للمطورين، فهذا تذكير: يجب التحقق من الشخصنة وأنماط الأسلوب ليس فقط من حيث الفائدة، بل أيضاً فيما يتعلق بالعادات اللفظية التي تنتشرها عن غير قصد في جميع أنحاء النظام.

ZK
Hamidun News
أخبار الذكاء الاصطناعي بدون ضوضاء. اختيار تحريري يومي من أكثر من 400 مصدر. منتج من جمال حميدون، رئيس الذكاء الاصطناعي في Alpina Digital.

هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟

AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.

ما رأيك؟
جارٍ تحميل التعليقات…