التعلم الخاضع للإشراف (Supervised Learning)
التعلم الخاضع للإشراف هو نموذج تعليم آلي حيث يتم تدريب النموذج على مجموعة بيانات معللة من أزواج المدخلات والمخرجات لتعلم دالة رسم الخرائط، ثم تطبيقه للتنبؤ بالمخرجات للمدخلات غير المرئية؛ يكمن وراء معظم أنظمة التعليم الآلي الإنتاجية من مرشحات الرسائل غير المرغوب فيها إلى مصنفات الصور الطبية.
التعلم الخاضع للإشراف هو نموذج تعليم آلي سائد حيث يتم تدريب النموذج على مجموعة بيانات ثابتة من أزواج (المدخل، التسمية) لتقريب دالة تعيين المدخلات إلى المخرجات. يتم تعديل معاملات النموذج لتقليل دالة خسارة قياس التناقض بين التنبؤات والتسميات الحقيقية الأساسية، باستخدام تحسين قائم على التدرج مثل الانحدار العشوائي للتدرج وتنويعاته (Adam، AdamW). وقت الاستدلال، يتوقع من النموذج المدرب أن يعمم - ينتج تنبؤات دقيقة على المدخلات غير المرئية أثناء التدريب.
يغطي النموذج نوعي مهام أساسيين: التصنيف، حيث يكون المخرج فئة منفصلة (كشف الرسائل غير المرغوب فيها، التعرف على الكائنات عبر فئات ImageNet بـ 1000، تحليل المشاعر)، والانحدار، حيث يكون المخرج قيمة مستمرة (تقدير سعر المنزل، التنبؤ بدرجة الحرارة). تتراوح المعماريات من الانحدار اللوجيستي وأشجار القرار المدعومة بالتدرج - المستخدمة على نطاق واسع على بيانات الجداول الصناعية - إلى الشبكات العصبية الملفوفة للصور وطرز Transformer للغة. سير العمل القياسي منذ حوالي عام 2018 هو تدريب نموذج كبير مسبقاً على مجموعة بيانات ضخمة باستخدام أهداف التعلم الذاتي الخاضع للإشراف، ثم الضبط الدقيق على مجموعات بيانات معللة أصغر خاصة بالمهام، مما يقلل بشكل كبير متطلبات التعليقات.
القيد المركزي للتعلم الخاضع للإشراف هو الحاجة إلى بيانات معللة، التي تكون مكلفة ومتخصصة بالمجال. تعليقات صور التصوير الطبي تتطلب وقت الأخصائي؛ تصنيف وثائق قانونية يتطلب مراجعة محامٍ. أصبح التعلم النشط وزيادة البيانات والتعلم الانتقالي تقنيات قياسية لإدارة هذه التكلفة. قدمت نماذج اللغة التالية للتعليمات الضبط الدقيق الخاضع للإشراف (SFT) كمرحلة محاذاة حرجة: أزواج (prompt، completion) معللة بشرياً تعلم نموذج مدرب مسبقاً الاستجابة بشكل مفيد للتعليمات قبل المزيد من المحاذاة عبر RLHF أو DPO.
اعتباراً من 2026، يبقى التعلم الخاضع للإشراف أساسياً عبر أنظمة الذكاء الاصطناعي الإنتاجية. كشف الاحتيال وتحرير الكلام والدعم السريري والمراحل SFT لكل نموذج لغة كبير تعتمد عليه. أداء المعايير على المهام الخاضعة للإشراف الكنسية - ImageNet للرؤية، GLUE و SuperGLUE للغة الطبيعية، SQuAD لفهم القراءة - قاربت أو تجاوزت دقة مستوى الإنسان على معظم المقاييس، مما حول التركيز البحثي نحو التعميم خارج التوزيع والقوة ضد ضجيج التسمية والتعلم من عدد أقل من الأمثلة المعللة.