كيف دفع Gemini مدونة الذكاء الاصطناعي نحو mode collapse وأجبر على إعادة بناء مولد الموضوعات
انزلق النموذج المفتوح لتوليد الموضوعات في مدونة الذكاء الاصطناعي تدريجياً نحو mode collapse: لمدة أربعة أيام جمعة متتالية، اقترح نموذج اللغة الكبير نفس…
معالج بواسطة الذكاء الاصطناعي من Habr AI؛ بتحرير Hamidun News
أثبتت رسالة إبداعية مفتوحة أنها محرر سيء: فبدلاً من التنوع، دفعت بالمقالة الأسبوعية لمدونة الذكاء الاصطناعي بسرعة نحو انهيار الوضع. لمدة أربعة أسابيع متتالية، كانت نموذج اللغة الكبيرة تقترح جوهرياً نفس "السؤال المثير للجدل حول الذكاء الاصطناعي"، مع تغيير الصياغة بشكل طفيف فقط، وأصبح هذا واضحاً فقط عندما تشكلت النصوص المتطابقة لفظياً سلسلة. لم تظهر المشكلة على الفور لأن كل منشور فردي بدا مقبولاً.
في الأسبوع الأول بدا الموضوع مناسباً، في الثاني—مشابهاً فقط، في الثالث يمكن أن تُعزى التكرار إلى صدفة، لكن بحلول الرابع أصبح واضحاً: النموذج لم يكن يبحث عن زوايا جديدة بل يدور حول نفس النمط. بالنسبة لفريق تحرير هذا نوع غير سار بشكل خاص من الفشل، لأنه محلياً يتم الحفاظ على الجودة بينما نظامياً يبدأ المحتوى في استنساخ نفسه. في البداية، تم البحث عن الحلول في الرسالة نفسها.
كانت المنطق واضحة: إذا علق النموذج على أطروحة واحدة، فإن متطلبات التنوع الأكثر صرامة والقيود والطلبات بوجهات نظر جديدة أو حظر التكرارات كانت ضرورية. لكن هذه التدابير ساعدت بشكل سطحي فقط. تغيرت الصيغ، تحول النبرة، لكن الفكرة الأساسية ظلت كما هي.
هذه ملاحظة مهمة لأي شخص يستخدم نماذج لغة كبيرة في خطوط إنتاج المحتوى: الطلب المفتوح "توصل بموضوع مثير للاهتمام" لا يضمن تنوعاً حقيقياً، حتى لو بدت الإجابات طازجة. في سياق التحقيق، تبين أن جزءاً من المشكلة كان لا يقع فقط في هندسة الرسائل بل أيضاً في تكوين Gemini الخاص به. سقطت هذه الطبقة في البداية من مجال الرؤية، رغم أنها تؤثر مباشرة على توزيع الإجابات وميل النموذج إلى تكرار القوالب الآمنة.
في مثل هذه الأنظمة، نادراً ما يوجد الخطأ في مكان واحد: الرسالة ومعاملات التوليد والمنطق العام للخط الأنابيب تعزز بعضها البعض. لذا فإن محاولة "إصلاح" كل شيء بصياغة سحرية واحدة عادة ما تخفي العرض فقط ولا تزيل السبب. أظهرت الحالة أيضاً مشكلة عملية أخرى للتشريح الآلي: التدقيق اليدوي القياسي لا يلتقط مثل هذه الأعطال إذا نظرت إلى المواد واحدة تلو الأخرى.
ما هو مطلوب هو التحكم على مستوى السلسلة—مقارنة الموضوعات على مدى شهر، والتحقق من التقارب الدلالي، وسجل الزوايا المنشورة بالفعل وعلى الأقل متري تنوع بسيطة. وإلا فإن النموذج سيُنتج نصوصاً "عادية" تؤثر في المجموع على الملاحظة وتخلق الانطباع بأن المدونة تجادل مراراً وتكراراً مع نفسها بشأن سؤال واحد. بعد أربع جولات من التجارب، توصل الفريق إلى استنتاج أكثر عملية: من الأفضل عدم ترك مهمة إنشاء الموضوعات بالكامل لتقدير النموذج.
بدلاً من طلب مفتوح "توصل بسؤال"، تم تحويل المولد إلى دوران حتمي لمجموعة موضوعات مجمعة ومحررة مسبقاً. هذا النهج أقل فعالية من وجهة نظر "الإبداع"، لكنه يوفر ما يحتاجه فريق التحرير فعلاً—تغطية يمكن التنبؤ بها لقصص مختلفة، وغياب الحلقات والسيطرة على التوازن الموضوعي. ولم يتطلب الإصلاح أي ضبط دقيق أو RAG أو الهجرة إلى نموذج آخر.
الدرس الرئيسي هنا بسيط: إذا تم دمج نموذج لغة كبيرة في عملية تحرير منتظمة، يجب تقييمه ليس من خلال إجابة واحدة ناجحة بل من خلال سلسلة من الإصدارات. انهيار الوضع في المهام التطبيقية يبدو غالباً ليس كفشل حاد بل كتضييق تدريجي لنطاق الأفكار، ملحوظ فقط على المسافة. لذلك بالنسبة لمولدات الأقسام ومولدات الموضوعات والسيناريوهات المتكررة الأخرى، فإن ما هو أكثر موثوقية من حرية النموذج الأقصى هو مزيج من القوائم المُنسقة والدوران الصارم والفحوصات الدورية للتكرار الدلالي—والقرارات يتم اتخاذها بشكل أفضل مقدماً، قبل أن يصبح التكرار عادة تحريرية راسخة.
هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟
AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.