الشبكة العصبية كآلة زمن: لماذا تُدرَّب نماذج LLM على التفكير بعقلية الماضي
وجد الباحثون طريقة تبدو متناقضة لاستخدام نماذج LLM: فبدلًا من توسيع بيانات التدريب، يقومون بتقييدها لبناء نماذج «تفكر» كما كان يفكر الناس في العصور الماضية…
معالج بواسطة الذكاء الاصطناعي من Habr AI؛ بتحرير Hamidun News
تُقيَّم نماذج اللغة تقليديًا بحسب حجم المعرفة التي تمتلكها: كلما امتصت الشبكة العصبية بيانات أكثر، أصبحت أكثر ذكاءً. لكن مجموعة من الباحثين والمتحمسين قلبت هذا المنطق رأسًا على عقب. إنهم يقللون بشكل متعمد مجموعات بيانات التدريب، محددين إياها بنصوص من حقبة تاريخية معينة، ويحصلون على شيء غير متوقع تماما: ذكاء اصطناعي يفكر وكأنه يعيش في القرن السابع عشر أو بداية القرن العشرين.
للوهلة الأولى، تبدو الفكرة مثل نزوة غريبة الأطوار. لماذا قد يحتاج أحدهم إلى نموذج لا يعرف شيئًا عن المضادات الحيوية أو نظرية النسبية أو الإنترنت؟ لكن هناك دافع علمي جاد وراء هذا. تُدرب نماذج اللغة الكبيرة الحديثة على مجموعات نصية تغطي كل تاريخ اللغة المكتوبة حتى الحاضر. فهي لا محالة ترى الماضي من خلال عدسة الحاضر — بمصطلحاته وقيمه ومعرفته المتراكمة. نموذج تم تدريبه فقط على نصوص قبل عام 1912 يفتقد هذه العدسة الرجعية. إنه لا يعيد ببساطة إنتاج كلمات حقبة — فهو يعيد إنتاج طريقة تفكيرها وعماياتها الفكرية وثقتها بأمور اعتبرناها منذ زمن أوهامًا.
من الناحية التقنية، يبدو النهج كما يلي. يتم أخذ بنية نموذج لغة معياري — عادة ما يكون مضغوطًا نسبيًا، حيث أن حجم النصوص التاريخية محدود. يتم تشكيل مجموعة التدريب حصريًا من المصادر المؤرخة بفترة معينة: الكتب والصحف والرسائل والأطروحات العلمية والوثائق القانونية. من الأهمية الحاسمة استبعاد أي نصوص مكتوبة بعد تاريخ القطع المختار. نتيجة لذلك، يستوعب النموذج ليس فقط مفردات وقواعد العصر، بل أيضًا إطاره الإبستيمولوجي — أي حدود ما اعتبره الناس في ذلك الوقت ممكنًا وحقيقيًا ومقبولًا.
يتضح أن تطبيق هذه النماذج 'الزمنية' يكون أوسع بكثير مما قد يفترض المرء. في مجال الإبستيمولوجيا — علم المعرفة — فإنها تسمح للباحثين بالتحقق من كيفية تغير آليات تكوين المعرفة ذاتها. يمكنك أن تطرح على نموذج من عام 1650 سؤالاً عن طبيعة الأمراض وتتلقى إجابة مبنية على النظرية الخلطية — ليس كأسلوب، بل كقناعة حقيقية لنظام لا توجد فيه نظرية الجراثيم أصلاً. هذا يوفر للعلماء أداة فريدة لنمذجة الأنماط الفكرية التاريخية.
في العلوم السلوكية، تساعد هذه النماذج على دراسة كيف يشكل السياق الثقافي والمعلوماتي السلوك والقرارات. إذا وضعت نموذج لغة كبيرة ضمن إطار معرفة حقبة معينة، يمكنك نمذجة ردود الفعل على الأحداث والقرارات الاقتصادية والمواقف الاجتماعية — ومقارنتها ببيانات تاريخية فعلية. في جوهره، هذا شكل من أشكال علم النفس التاريخي الحسابي الذي كان سيعتبر مستحيلاً قبل بضع سنوات فقط.
الإمكانات التعليمية مثيرة للإعجاب أيضًا. تخيل حوارًا تفاعليًا مع 'عالم' من عصر التنوير لا يقتصر على الاستشهاد بنصوص القرن الثامن عشر، بل يفكر بشكل متسق ضمن إطار رؤية العالم في تلك الحقبة. يمكن للطالب أن يطرح أسئلة ويجادل ويواجه منطقًا كان بلا خلل في عصره لكنه يبدو سخيفًا اليوم. هذه طريقة قوية لإظهار أن المعرفة ليست قيمة مطلقة، بل عملية مشروطة تاريخيًا.
عدة مبادرات مفتوحة تعمل بالفعل في هذا الاتجاه. المشاريع التي يناقشها متخصصو Beeline Cloud تطور كلاً من النماذج نفسها ومنهجية إعداد مجموعات النصوص التاريخية. التحدي الرئيسي هنا هو جودة البيانات. غالبًا ما تحتوي النصوص الرقمية من القرون الماضية على أخطاء في التعرف، واختيار المصادر يتطلب خبرة جادة من المؤرخين لضمان أن تمثل المجموعة بشكل كافٍ فكر العصر، وليس فقط نخبته الأدبية.
وهناك سؤال أساسي يثيره هذا النهج. إذا كان نموذج يتم تدريبه على نصوص من الماضي يعيد إنتاج الأوهام والتحيزات في عصره، فماذا يقول عن نماذج اللغة الكبيرة الحديثة؟ إنها محصورة بالقدر نفسه في حدود عصرنا — ببساطة لا نعرف حتى الآن أي من 'حقائقنا الواضحة' ستجدها الأجيال المقبلة ساذجة. تصبح النماذج الزمنية مرآة تذكرنا: أي ذكاء، اصطناعي أم لا، هو منتج عصره. والوعي بهذه الحقيقة قد يكون أثمن من أي اختراق تكنولوجي.
هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟
AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.