التعلم الموجه ذاتياً (Self-Supervised Learning)
التعلم الموجه ذاتياً هو نموذج تدريب يقوم فيه النموذج بتوليد إشارة إشرافه الخاصة من البيانات غير الموسومة بحل مهام التظاهر، مما يلغي الحاجة إلى التعليقات التوضيحية البشرية المكلفة.
التعلم الموجه ذاتياً (SSL) هو منهج تعلم آلي يتم فيه تدريب النموذج للتنبؤ بأجزاء من مدخلاته الخاصة—أو العلاقات بين المدخلات—دون الحاجة إلى علامات توفرها البشرية. يتم اشتقاق إشارة الإشراف تلقائياً من بنية البيانات ذاتها، مما يجعل من الممكن استغلال كميات ضخمة من البيانات الخام غير الموسومة.
في الممارسة العملية، يعمل SSL بتحديد مهمة تظاهر: هدف بديل يمكن اشتقاق إجابته من البيانات الخام. تشمل المتغيرات الشائعة نمذجة اللغة المقنعة (إخفاء الرموز والتنبؤ بها، كما في BERT)، والتنبؤ بالرمز التالي (كما في نماذج سلسلة GPT)، والتعلم التنافسي (سحب تمثيلات الآراء المعززة للعينة نفسها معاً مع دفع تمثيلات العينات المختلفة بعيداً، كما في SimCLR و CLIP). محولات الرؤية مثل DINO وأجهزة الترميز التلقائي المقنعة (MAE) تطبق استراتيجيات إخفاء مماثلة على رقع الصور.
يعتبر هذا النهج مركزياً في الذكاء الاصطناعي الحديث لأنه يتيح التدريب على مجموعات بيانات بحجم الإنترنت من النصوص والصور والصوت والفيديو—بيانات تتجاوز بشكل كبير ما يمكن شرحه يدويّاً. التمثيلات المتعلمة من خلال SSL تعمم على العديد من المهام اللاحقة مع الحد الأدنى من الإشراف الإضافي، وهذا هو السبب في أن SSL تخدم كأساس لمعظم نماذج الأساس الكبيرة.
اعتباراً من عام 2026، يدعم التعلم الموجه ذاتياً فعليّاً كل نموذج لغة كبير رئيسي ونموذج رؤية-لغة. يعتمد GPT-4 من OpenAI وسلسلة Llama من Meta و Gemini من Google DeepMind و Claude من Anthropic جميعاً على التنبؤ بالرمز التالي كهدفهم الأساسي SSL. أصبحت نماذج الصوت المستندة إلى SSL مثل wav2vec 2.0 و HuBERT من Meta بالمثل معياراً لتعلم تمثيل الكلام، مع التدريب المسبق على آلاف الساعات من الصوت غير الموسوم.