MIT News→ المصدر

MIT يكشف أسرار LLM: كيف تكتشف المشاعر والتحيزات الخفية

طوّر باحثون من MIT طريقة لكشف الجوانب الخفية في عمل النماذج اللغوية الكبيرة، بما في ذلك التحيزات والمشاعر والسمات الشخصية. تحلل التقنية الحالات الداخلية…

معالج بواسطة الذكاء الاصطناعي من MIT News؛ بتحرير Hamidun News
MIT يكشف أسرار LLM: كيف تكتشف المشاعر والتحيزات الخفية
المصدر: MIT News. كولاج: Hamidun News.
◐ استمع للمقال

لم تعد نماذج اللغة الكبيرة مجرد مولدات نصية — لقد أصبحت البنية التحتية التي تدعم الطب والقانون والتعليم والمالية. لكن وراء النتائج المثيرة للإعجاب تختبئ مشكلة أساسية: لا أحد يفهم حقاً ما يحدث بداخلها. قام باحثون في معهد ماساتشوستس للتكنولوجيا بخطوة قد تغير هذا الوضع — طورّوا طريقة تسمح بإلقاء نظرة خاطفة في "الصندوق الأسود" للشبكة العصبية واكتشاف شيء غير متوقع بداخله: انحيازات مخفية وأنماط عاطفية وحتى ما يمكن أن يسمى سمات شخصية للنموذج.

مشكلة قابلية تفسير الذكاء الاصطناعي موجودة منذ وجود الشبكات العصبية نفسها. عندما يرد GPT-4 أو Claude على سؤال ما، لا يكشف عن آلية تفكيره — يُنتج النتيجة ببساطة. يسمح الاختبار القياسي بتقييم دقة الإجابات وتحديد الأخطاء الواضحة والانحيازات الفجة. غير أن التشوهات الدقيقة والمنهجية — تلك التي تظهر ليس في استعلام واحد بل عبر آلاف التفاعلات — تبقى غير مرئية تقريباً. وهذا هو الفجوة التي يحاول معهد ماساتشوستس سدها: الفجوة بين السلوك الملحوظ والمنطق الداخلي للنموذج.

تعمل الطريقة الجديدة على مستوى الحالات الداخلية للشبكة العصبية — تلك الطبقات الحسابية الوسيطة التي تمر عبرها المعلومات قبل أن تتحول إلى نص. تعلم الباحثون قراءة هذه الحالات كنوع من الخريطة للمفاهيم المجردة: كيف يشكل النموذج تمثيلات المشاعر، وما هي السلاسل الترابطية التي يبنيها حول مجموعات اجتماعية معينة، وكيف تتغير "نبرته" الداخلية بناءً على موضوع المحادثة. بشكل أساسي، هذه أول أداة تسمح ليس فقط بسؤال النموذج عن انحيازاته، بل بمراقبة كيفية وجود هذه الانحيازات بداخله — بغض النظر عما يعلنه النموذج في ردوده.

تصعب المبالغة في أهمية هذا النهج لسلامة الذكاء الاصطناعي. اليوم، الطريقة الرئيسية لكشف السلوك الخطير في النماذج هي ما يسمى بالفريق الأحمر: تحاول فرق من المتخصصين يدوياً استفزاز الشبكة العصبية لإنتاج استجابات غير مرغوبة. هذه العملية شاقة وتكاليفها مرتفعة وغير مكتملة بطبيعتها — تبحث عن التهديدات المعروفة ولكنها عاجزة عن تحديد المجهول منها بشكل منهجي. طريقة معهد ماساتشوستس تعكس المنطق: بدلاً من مهاجمة النموذج من الخارج، تفحصه من الداخل. يمكن اكتشاف الثغرات قبل أن تظهر في التفاعل الحقيقي مع المستخدم. هذا تحول من الأمن التفاعلي إلى الأمن الوقائي — تماماً كما تنتقل الطب من معالجة الأعراض إلى التشخيص المبكر.

بالنسبة للصناعة، يحمل هذا الاكتشاف عدة عواقب عملية فورية. تحصل الشركات التي تطور نماذج اللغة الكبيرة على أداة لإجراء تدقيق أعمق لنماذجها قبل الإطلاق. يحصل المنظمون، الذين يبحثون بنشاط في جميع أنحاء العالم عن معايير تقييم الذكاء الاصطناعي — من قانون الذكاء الاصطناعي الأوروبي إلى الأوامر التنفيذية الأمريكية — على حجة لصالح التحليل الإلزامي للحالات الداخلية كجزء من الشهادة. أخيراً، يستطيع العملاء من الشركات الذين يستخدمون نماذج اللغة في المجالات الحساسة أن يطالبوا ليس فقط بتقارير الدقة بل بتحليل موثق للأنماط المخفية.

من المهم، مع ذلك، فهم حدود الطريقة الجديدة. اكتشاف الانحياز لا يعني القضاء عليه. لا تُعاد برمجة الشبكة العصبية لأن الباحث رأى شيئاً غير سار في طبقاتها الداخلية. سيتطلب الطريق من التشخيص إلى العلاج تطورات منفصلة: تقنيات ضبط دقيقة جديدة وطرق محاذاة أكثر دقة، وربما — حلول معمارية مختلفة. بحث معهد ماساتشوستس هو أكثر من تطوير معدات تشخيصية بدلاً من كونه مسار علاج.

مع ذلك، فإن مجرد ظهور مثل هذه الأداة يغير الحوار حول أخلاقيات الذكاء الاصطناعي. حتى الآن، جرى النقاش حول انحياز نماذج اللغة بشكل أساسي على مستوى بيانات الإخراج: ينتج هذا النموذج محتوى سام، وذاك يستنسخ الصور النمطية الجنسانية. الآن يظهر احتمال الحديث عن البنية الداخلية للانحياز — عن أين بالضبط وكيف يتشكل. هذا مستوى مختلف من الناحية النوعية في الفهم، ويفتح الباب أمام حلول مختلفة من الناحية النوعية. تبقى نماذج اللغة الكبيرة صناديق سوداء للآن، غير أن الغطاء، يبدو أنه قد بدأ أخيراً ينفتح.

ZK
Hamidun News
أخبار الذكاء الاصطناعي بدون ضوضاء. اختيار تحريري يومي من أكثر من 400 مصدر. منتج من جمال حميدون، رئيس الذكاء الاصطناعي في Alpina Digital.

هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟

AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.

ما رأيك؟
جارٍ تحميل التعليقات…