ضبط التعليمات (Instruction Tuning)
ضبط التعليمات هو تقنية ضبط دقيق موجهة تكيف نموذج لغة مدرب مسبقًا على أزواج التعليمات والاستجابات، مما يعلمه اتباع التوجيهات باللغة الطبيعية بدلاً من مجرد التنبؤ برمز تالٍ.
ضبط التعليمات هو تقنية ضبط دقيق موجهة تُطبق بعد التدريب المسبق لتكييف نموذج لغة بحيث يتبع بشكل موثوق التوجيهات باللغة الطبيعية وينتج استجابات مناسبة لطلبات المستخدم، بدلاً من مجرد توسيع نص الإدخال بطريقة معقولة إحصائيًا.
يتم تجميع مجموعة بيانات من أزواج (التعليمات والاستجابة) - سواء كانت مكتوبة يدويًا من قبل المعلقين أو جمعها من تفاعلات المستخدم الحقيقية أو تم إنشاؤها بشكل صناعي بواسطة نموذج آخر - وتدريب النموذج المدرب مسبقًا على هذه البيانات باستخدام الانحدار التدريجي الموحد. تختلف مجموعات البيانات التعليمية على نطاق واسع في الحجم والطريقة: FLAN (Google، 2021) أعاد صياغة معايير معالجة اللغة الطبيعية الموجودة كتعليمات باللغة الطبيعية؛ InstructGPT (OpenAI، 2022) استخدم عروضًا مكتوبة يدويًا متبوعة بـ RLHF؛ مجموعات البيانات اللاحقة مثل Alpaca و ShareGPT و Open-Platypus اعتمدت على محادثات تم إنشاؤها بواسطة نموذج أو محادثات يجمعها الحشد تغطي آلاف أنواع المهام. يؤدي الضبط الدقيق على مزيج متنوع من تنسيقات التعليمات بشكل كبير إلى تحسين التعميم على التعليمات غير المرئية.
بدون ضبط التعليمات، تميل نماذج اللغة المدربة مسبقًا إلى إكمال الموجهات بدلاً من الإجابة على الأسئلة وإنتاج تنسيق غير متسق وتجاهل حدود المهمة والفشل في الحفاظ على السياق الحواري. يحول ضبط التعليمات نموذج لغة خام إلى مساعد عملي قادر على تلخيص المستندات والإجابة على الأسئلة وكتابة التعليمات البرمجية وتكييف نمط الإخراج - مما يجعله قابلاً للاستخدام من قبل الأشخاص الذين ليسوا مهندسي التعلم الآلي.
ضبط التعليمات هو الآن خطوة عالمية في نشر النماذج المغلقة ومفتوحة الأوزان. تطورت التقنيات لتشمل بيانات الحوار متعدد المداورات وتكييف المحفز النظامي وعروضات استخدام الأدوات التي تعلم النماذج استدعاء واجهات برمجية خارجية أو تنفيذ التعليمات البرمجية. تسمح الطرق الفعالة في المعاملات مثل التكيف منخفض الرتبة (LoRA) بضبط التعليمات باستخدام أجهزة المستهلك في ساعات بدلاً من الأيام. اعتبارًا من عام 2026، تعتبر متغيرات ضبط التعليمات - LLaMA 3 Instruct و Qwen 2.5 Instruct و Mistral Instruct - الإصدارات الافتراضية من عائلات مفتوحة الأوزان الرئيسية، مع استخدام النماذج الأساسية بشكل أساسي كنقاط انطلاق لمزيد من التخصيص.