كيف تعلّم نموذج Allen AI اكتشاف تخصص الخبراء بنفسه
رصد باحثو Allen AI أثرًا لافتًا: عند تدريب مزيج كبير من الخبراء على وثائق مختلفة، يختار كل خبير تخصصه بنفسه — فيتجه أحدهم إلى الطب، وآخر إلى السياسة، وثالث إلى
معالج بواسطة الذكاء الاصطناعي من Hugging Face Blog؛ بتحرير Hamidun News
كيف تجد الشبكات العصبية تخصصها الخاص بها
نشرت Allen AI بحثاً عن نموذج EMO (Emergent Modularity)، الذي أظهر سلوكاً غير متوقع: عند التدريب على مزيج من المستندات من مجالات مختلفة (الطب والسياسة والسينما والأخبار)، تخصص كل خبير بشكل طبيعي في أحدها. لم يخبر أحد النموذج أي المجالات كانت مهمة أو كيفية تقسيمها — اكتشف النموذج هذا بشكل مستقل، معتمداً فقط على محتوى النصوص.
فكرة بسيطة ذات إمكانات كبيرة
عادةً في معماريات خليط الخبراء، يعمل التوجيه إما بشكل عشوائي أو يتطلب تسميةً صريحةً للبيانات. طبق باحثو Allen AI منهجاً مختلفاً: بدلاً من إخبار النموذج بالمجالات المهمة، راقبوا ببساطة أي خبير يعالج المستندات من نوع واحد بشكل متكرر. اتضح أنه عند التدريب على مستوى المستند (عندما يختار النموذج خبيراً واحداً لنص كامل)، تتشكل البنية بشكل طبيعي. هذا يعمل لأن خبيراً واحداً يتعامل بشكل أفضل مع الطب، وآخر مع السياسة، وثالث مع الترفيه. يتقارب النظام نحو هذا التقسيم دون الحاجة إلى تعليمات صريحة. نتيجةً لذلك، تحصل على نموذج قابل للتفسير: يمكنك فتح الكود ورؤية ما يفعله كل مكون.
أي المجالات ظهرت؟
كشف التحليل خمسة أنماط رئيسية:
- Health: خبير في المجال الطبي يعالج المحتوى الطبي
- News: التخصص في المواد الإخبارية
- Politics: التركيز على المحتوى السياسي
- Film & Music: محتوى الترفيه (السينما والموسيقى)
- Mixed: خبير متعدد المجالات لكل شيء آخر
ومن الطريف أن هذا التخصص ظهر بشكل تلقائي تماماً. لم يقدم المؤلفون الفئات مسبقاً — لقد نظروا ببساطة إلى النتائج ورأوا البنية.
الأداء: مجاني تقريباً
إليك الأرقام الرئيسية: يستخدم النموذج 12.5% فقط من الخبراء لكل مستند بينما يفقد حوالي 3% من الجودة — وهو حل وسط مقبول تماماً لمثل هذه الوفورات. بالإضافة إلى ذلك، يمكن للنموذج أن يتعلم من خلال بضعة أمثلة اختيار الخبير المناسب لمهمة جديدة — حتى لو لم يتم لقاء هذا المجال أثناء التدريب الرئيسي.
الشيء الأكثر قيمة: يمكننا فتح "الصندوق الأسود" للشبكة العصبية وفهم ما
يحدث فعلاً هناك. بدلاً من خليط معتم، نحصل على نظام ذو بنية مرئية وقابلة للفهم.
ماذا يعني هذا للمستقبل؟
تقدم نتائج EMO مساراً جديداً نحو نماذج قابلة للتوسع وقابلة للتفسير. بدلاً من بناء صناديق سوداء، يمكننا السماح للنظام بتنظيم نفسه بنفسه إلى مكونات مفهومة. هذا يبسط تصحيح الأخطاء: إذا أخطأ النموذج في الطب، يمكنك النظر إلى خبير Health وفهم السبب. من الناحية العملية، هذا يعني أن نماذج اللغة الكبيرة ستصبح أكثر شفافية. حالياً، من الصعب شرح للمستخدم لماذا GPT يخطئ في موقف معين. إذا بنيت نموذجاً من أجزاء قابلة للتفسير، كما هو الحال في EMO، هناك فرصة حقيقية لـ AI أكثر صراحة وقابلية للتفسير.
هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟
AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.