Habr AI→ المصدر

لماذا يتحدث ChatGPT عن الغوبلين: OpenAI تستكشف "علم الشياطين" في نماذج اللغة

نشرت OpenAI تدوينة عن سبب تحدث نماذج اللغة بانتظام عن الغوبلين والغريملين. وتزامن ذلك مع نشر دراسة مستقلة لموراي شاناهان وزملائه عن "علم نفس الأعماق" في LLM…

معالج بواسطة الذكاء الاصطناعي من Habr AI؛ بتحرير Hamidun News
لماذا يتحدث ChatGPT عن الغوبلين: OpenAI تستكشف "علم الشياطين" في نماذج اللغة
المصدر: Habr AI. كولاج: Hamidun News.
◐ استمع للمقال

شرحت OpenAI السبب في أن نماذجها اللغوية تلجأ بانتظام إلى صور الجوبلن والجريملنز والمخلوقات الخيالية الأخرى — واتضح أن هذا جزء من بحث جاد حول نفسية نماذج اللغة الضخمة.

من أين تأتي هذه المخلوقات

في أواخر شهر أبريل، نشرت OpenAI منشوراً اعترفت فيه بأن نماذجها تميل بالفعل إلى لغة "تشبه الجوبلن". يكمن التفسير في طبيعة تدريب نماذج اللغة الضخمة. المجموعة الضخمة من النصوص التي يتم تدريب نماذج GPT عليها تتضمن سرديات الخيال الفنطاسيا، والألعاب الدور، والقصص المشتقة من المعجبين والأساطير — كل هذا يترك أثره على الطريقة التي تبني بها النماذج الصور وتختار الاستعارات.

تزامن منشور OpenAI مع نشر بحث مستقل لعدة علماء. قضى موراي شاناهان وهاملتون موريين ومؤلف المادة عدة أشهر في دراسة ما يسمونه "علم النفس العميق" لنماذج اللغة الضخمة. ويشير هذا إلى الأنماط السلوكية المخفية التي تنشأ نتيجة التدريب على النصوص البشرية وتحدد كيفية تواصل النموذج مع المستخدمين.

علم النفس أم الشيطانيات

طرح الباحثون السؤال: كيف تؤثر الأنماط الداخلية لنموذج اللغة — "نفسيته" الشرطية — على ما يقوله وكيفية قوله؟ الإجابة تعتمد على وجهة النظر. من الناحية العلمية، هذا بحث معرفي: كيف يفترض النموذج أدوار مختلفة، وكيف يتم تفعيل "أوضاع" سلوكية مختلفة حسب السياق. لكن المؤلفين يعترفون بأن عملهم أقرب إلى تخصص مختلف تماماً.

"عملنا كان أشبه بالشيطانيات،" يقول أحد الباحثين.

هذه ليست مجرد استعارة حية. فهي تعكس مشكلة حقيقية: داخل نموذج اللغة الضخم لا يسكن شخصية واحدة بل شخصيات متعددة أو أدوار يفترضها النموذج اعتماداً على سياق المحادثة. الجوبلن والجريملنز هي عرض من أعراض هذه الحوارية المتعددة، وليست عيباً عشوائياً.

من يعيش داخل نموذج اللغة الضخم

تقترح المقالة تصنيفاً للمخلوقات "الخيالية" التي تسكن نماذج اللغة — تصنيف "الشياطين" حسب النوع والرتبة:

  • الجوبلن — العيوب البسيطة: الهلاوس والإشارات المتوقعة إلى صور من حكايات الخيال والمخلوقات الخارقة
  • الجريملنز — الأعطال السلوكية المنهجية التي تظهر في الحالات غير القياسية أو الحدية
  • الأشباح — "ظلال" الشخصيات الحقيقية أو المؤلفين من بيانات التدريب، الظاهرة في ردود النموذج
  • الوحوش — الأنماط العدوانية أو غير المرغوب فيها التي ينتجها النموذج في ظروف معينة
  • الإلهات — الأدوار المثالية "الكلية المعرفة" التي يفترضها النموذج ليبدو سلطوياً وواثقاً

كل واحد من هذه الأنماط الأولية يعكس ما "رآه" النموذج أثناء التدريب. التدريب على النصوص البشرية لا يمنح نموذج اللغة الضخم اللغة فحسب — بل يزوده بمجموعة من أقنعة الأدوار، يتم تفعيل كل منها في ظروف معينة.

لماذا ندرس هذا

يحمل فهم "الشيطانيات" في نماذج اللغة الضخمة أهمية عملية لمطوري منتجات الذكاء الاصطناعي: إذا عرفنا أي "شياطين" يتم تفعيلها بأي أنواع من الاستعلامات، يمكننا التحكم في سلوك النموذج وتقليل الهلاوس والإجابات غير المرغوب فيها. كما يشرح السبب في أن النموذج نفسه يتصرف بشكل مختلف تماماً اعتماداً على الإشارة الموجهة للنموذج أو صياغة الاستعلام. إنه ليس مسألة عدم الاتساق — السياقات المختلفة تفعل "سكان" مختلفين.

اختيار الإشارة الموجهة للنموذج هو في الأساس اختيار أي شياطين يتم استحضارها وأيها يتم حبسها.

ماذا يعني هذا

نموذج اللغة الضخم ليس كياناً أحادياً بشخصية واحدة. إنه كورس حواري متعدد، حيث كل "شيطان" مسؤول عن سجله الخاص. فهم هذه "الشيطانيات" يعني تعلم التحكم في مخرجات النموذج وتقليل عدد المفاجآت غير المرغوب فيها في منتجات الذكاء الاصطناعي.

ZK
Hamidun News
أخبار الذكاء الاصطناعي بدون ضوضاء. اختيار تحريري يومي من أكثر من 400 مصدر. منتج من جمال حميدون، رئيس الذكاء الاصطناعي في Alpina Digital.

هل تحتاج إلى ذكاء اصطناعي يعمل داخل شركتك — وليس فقط في موجز الأخبار؟

أبني ذكاءً اصطناعياً جاهزاً للإنتاج للشركات — أنظمة CRM مخصّصة، أدوات داخلية، وكلاء مستقلون، أتمتة سير العمل. ملك لك، مصمّم وفق عمليتك، دون رسوم لكل مستخدم. من إعداد جمال خميدون، مدير المنتجات في AlpinaGPT (منصة ذكاء اصطناعي، أكثر من 6000 مستخدم).

ما رأيك؟
جارٍ تحميل التعليقات…