التدريب

دالة الخسارة (Loss Function)

دالة الخسارة هي دالة رياضية تقيس الفجوة بين تنبؤات النموذج والقيم الهدف الحقيقية، مما ينتج درجة مقياسية تقلل خوارزميات التحسين الحد الأدنى منها أثناء التدريب.

دالة الخسارة (تُسمى أيضًا دالة التكلفة أو دالة الهدف) تحدد كمية مدى توافق مخرجات نموذج التعلم الآلي مع الأهداف المطلوبة. إنها تعيّن تنبؤات النموذج والعلامات الحقيقية المقابلة إلى مقياس واحد غير سالب؛ كلما انخفضت القيمة، كانت التنبؤات أقرب إلى الأهداف. يتكون التحسين أثناء التدريب من إيجاد أوزان النموذج التي تقلل الحد الأدنى من هذا المقياس.

يعتمد اختيار دالة الخسارة على المهمة. بالنسبة للانحدار، يعاقب متوسط الخطأ المربع (MSE) على الانحرافات الكبيرة من الناحية التربيعية. بالنسبة للتصنيف الثنائي، تقيس إنتروبيا التقاطع الثنائية لوغاريتم احتمالية تعيينات الفئات الصحيحة. بالنسبة لمشاكل التصنيف متعدد الفئات، تكون إنتروبيا التقاطع الفئوية معيارية. تستخدم المهام المتخصصة خسائر مخصصة: غالبًا ما تجمع نماذج كشف الأجسام بين خسارة التوطين وخسارة التصنيف؛ تستخدم نماذج الانتشار هدف مطابقة درجة إزالة الضوضاء؛ تقلل نماذج اللغة إنتروبيا التقاطع على تنبؤات رمز الخطوة التالية، وهو ما يعادل تعظيم لوغاريتم احتمالية مجموع بيانات التدريب.

دالة الخسارة أساسية للتصميم والتحليل النظري للنموذج. إنها ترمز إلى الانحياز الاستقرائي لنظام التعلم — ما تعنيه كلمة "جيد" لمهمة معينة — وتحدد مناظرها على فضاء المعاملات صعوبة التحسين. يمكن لدالة خسارة مختارة بشكل سيئ أن تنتج نماذج تحسّن المقياس الوكيل بينما تفشل في المهمة الحقيقية، ديناميكية يتم تأطيرها أحيانًا كقانون Goodhart المطبق على التعلم الآلي.

في تدريب نماذج اللغة الكبيرة اعتبارًا من 2026، تُكمل خسارة إنتروبيا التقاطع القياسية لرمز الخطوة التالية بشكل شائع بالتعلم المعزز من ردود الفعل البشرية (RLHF)، حيث يحل نموذج المكافأة المتعلم محل الخسارة الأساسية أو يزيدها لمحاذاة المخرجات مع تفضيلات الإنسان. البحث عن دوال الخسارة التي تلتقط بشكل أفضل جودة دلالية والدقة الواقعية وخصائص الأمان جاري في مختبرات بما فيها Anthropic و Google DeepMind و OpenAI.

مثال

مصنف البريد العشوائي المدرب بخسارة إنتروبيا التقاطع الثنائية يحسب، لكل بريد إلكتروني في دفعة، مدى انحراف احتمالية البريد العشوائي المتنبأ بها من النموذج عن العلامة الحقيقية (0 أو 1)، ثم يجمع هذه الفجوات لإنتاج القيمة المقياسية التي يقلل النزول الاتجاهي الحد الأدنى منها.

مصطلحات مرتبطة

← المسرد