MarkTechPost→ المصدر

لماذا يتعطل LoRA في الإنتاج وكيف ينقذ RS-LoRA الضبط الدقيق للنماذج

يعمل LoRA بشكل جيد عندما تحتاج النماذج إلى تغيير النبرة أو الصيغة أو الشخصية، لكنه يؤدي أداءً أضعف عند إضافة حقائق جديدة إليه. المشكلة تكمن في أن الرتبة…

معالج بواسطة الذكاء الاصطناعي من MarkTechPost؛ بتحرير Hamidun News
لماذا يتعطل LoRA في الإنتاج وكيف ينقذ RS-LoRA الضبط الدقيق للنماذج
المصدر: MarkTechPost. كولاج: Hamidun News.
◐ استمع للمقال

لقد أصبحت LoRA منذ زمن طويل المعيار الأساسي للضبط الدقيق الاقتصادي للنماذج الكبيرة، لكنها في الإنتاج تعتمد على افتراض مخفي: بأن جميع تحديثات الأوزان منظمة بنفس الطريقة. في الواقع، هذا ليس صحيحاً — التغييرات المسؤولة عن الأسلوب هي فعلاً مضغوطة، بينما التحديثات التي تضيف حقائق جديدة وخبرة في المجال موزعة على عدد كبير من الأبعاد، وهنا بالتحديد حيث تبدأ LoRA القياسية في فقدان البيانات. يمكن فهم شعبية LoRA: الطريقة تسمح بضبط دقيق للنموذج دون إعادة حساب جميع المعاملات، باستخدام مصفوفات منخفضة الرتبة صغيرة.

يعمل هذا بشكل ممتاز عندما تحتاج إلى تغيير النبرة أو تنسيق الإجابة أو الشخصية أو عادات الكلام للمساعد. يوضح المقال هذا على مصفوفة أوزان مبسطة بحجم 64×64: في تحديثات الأسلوب، عدة قيم فردية تهيمن بشكل حاد، لذا فإن تقريب الرتبة 4 أو الرتبة 8 يحافظ على الإشارة تقريباً بالكامل. في محاكاتهم، حتى عند الرتبة 4، يتمكنون من تغطية أكثر من 99% من التباين المفيد.

لذلك، يتعلم روبوت الدردشة بسهولة أسلوب اتصال جديد أو نموذج إجابة أو طريقة مطلوبة دون إعادة تدريب ثقيلة لكامل النموذج. تبدأ المشاكل حيث تحتاج إلى تعليم ليس الشكل بل المحتوى: حقائق طبية أو كتالوجات منتجات أو لوائح داخلية أو إحصائيات أو قواعد الصناعة. هذه التحديثات تتصرف كرتبة عالية: المعلومات موزعة على عدد كبير من الاتجاهات بدلاً من التركيز في عدة مكونات سائدة.

في تجربة المقال، الرتبة 8 تحتفظ بحوالي 28% فقط من الإشارة الفعلية. ومن هنا التأثير المألوف في الإنتاج: النموذج يبدو واثقاً، يستخدم المصطلحات الصحيحة وتنسيق الإجابة المناسب، لكنه يخلط الأرقام أو يفوته التفاصيل أو يعطي استنتاجات ناقصة. بالنسبة للمساعدين المؤسسيين والتحليلات والدعم والسيناريوهات المرتبطة بالمعرفة، هذا لم يعد خطأً تجميلياً بل مخاطرة في الجودة.

الفرق الرئيسي مرئي بوضوح في طيف القيم الفردية. لمهام الأسلوب هناك كوع واضح: بعد عدة مكونات، الأبعاد الإضافية تساهم بقليل جداً. مع الحقائق — هناك ذيل طويل، حيث تضيف كل مكونة متعاقبة جزءاً من المعرفة المفيدة.

عندما تقطع LoRA بحدة مثل هذا التحديث إلى رتبة منخفضة، فإنها تقطع هذا الذيل بالتحديد. ظاهرياً، قد يبدو النظام محسناً لأن التنسيق والنبرة والبنية أصبحت أنظف، لكن الدقة الفعلية تنمو بشكل ملحوظ أقل مما يبدو من الاختبارات السطحية. وهذا يشرح لماذا لا تضمن إجابات جميلة في العروض التوضيحية والأسلوب الجيد سلوكاً موثوقاً على بيانات الإنتاج.

رد الفعل المنطقي للمهندس هو ببساطة رفع الرتبة. لكن LoRA القياسية لديها مشكلة مخفية ثانية: تحجيم alpha/r. كلما كانت الرتبة أعلى، كلما ضُغط المعامل بشكل أقوى وضعُف إشارة التدريب أكثر.

في المثال مع alpha = 16، ينخفض المقياس من 16 عند الرتبة 1 إلى 0.25 عند الرتبة 64. تحصل على مفارقة: تضيف سعة للنموذج حتى يتمكن من تمثيل تحديث أكثر تعقيداً، لكنك في نفس الوقت تقلل من التأثير الفعلي لهذا التحديث على الأوزان.

يجب على المحسِّن التعويض بخطوات أكثر عدوانية، مما يسبب أن يتقارب التدريب بشكل سيء أو يصبح غير مستقر. لذا فإن النصيحة برفع الرتبة في الإنتاج غالباً لا تحل المشكلة وأحياناً تخفيها فقط. تقدم RS-LoRA تصحيحاً بسيطاً لكن مهماً: استخدم alpha/√r بدلاً من alpha/r.

رسمياً، هذا مجرد استبدال رمز واحد تقريباً، لكن عملياً التأثير كبير. عند الرتبة 64، يبقى المقياس 2.0 بدلاً من 0.

25، لذا فإن التكيف عالي الرتبة يحافظ على حجم معنوي ولا يقتل الإشارة. يوضح المقال هذا بدون حلقات تدريب ثقيلة وأطر عمل — فقط عبر NumPy و SVD ومقارنة أخطاء إعادة البناء. لهذا السبب، الحجة تبدو واضحة بشكل خاص: مهام الأسلوب منخفضة الرتبة لا تزال يتم حلها جيداً بواسطة LoRA القياسية، بينما مهام إضافة المعرفة تتطلب إما RS-LoRA أو استراتيجية تكيف مختلفة جوهرياً من البداية.

الخلاصة للفريق الذي ينشر LLMs محسنة في الإنتاج واضحة جداً: يجب اختيار تكوين المحول ليس فقط على أساس الميزانية والسرعة، بل أيضاً على نوع التحديث. إذا كنت تغير النبرة أو الشخصية أو تنسيق الإجابة، فإن LoRA منخفضة الرتبة القياسية تكفي عادةً. إذا كنت تنشر حقائق جديدة أو بيانات مرجعية أو قواعد أو خبرة في المجال، فقد تخلق الرتبة المنخفضة وهماً بالتدريب الناجح بينما تفقد بصمت جزءاً كبيراً من المعلومات.

في هذه الحالات، RS-LoRA لا تبدو كتحسين دقيق، بل كمتطلب لموثوقية النموذج في العملية الفعلية.

ZK
Hamidun News
أخبار الذكاء الاصطناعي بدون ضوضاء. اختيار تحريري يومي من أكثر من 400 مصدر. منتج من جمال حميدون، رئيس الذكاء الاصطناعي في Alpina Digital.

هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟

AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.

ما رأيك؟
جارٍ تحميل التعليقات…