تظهر AWS كيفية ضبط Amazon Nova من خلال Nova Forge SDK و SageMaker Jobs
شرحت AWS بالتفصيل كيفية تخصيص Amazon Nova عبر Nova Forge SDK و SageMaker AI. في المثال، يدرب الفريق نموذجاً لتصنيف أسئلة Stack Overflow: النموذج الأساسي يحقق…
معالج بواسطة الذكاء الاصطناعي من AWS Machine Learning Blog؛ بتحرير Hamidun News
أظهرت AWS سيناريو عملي لتخصيص نماذج Amazon Nova من خلال Nova Forge SDK و Amazon SageMaker AI. في الدليل، تمر الفريق بالدورة كاملة — من التقييم الأساسي للنموذج إلى SFT و RFT ونشر نقطة نهاية مخصصة للاستدلال.
السيناريو والبيانات
تضع AWS Nova Forge SDK كطبقة تزيل الجزء الأكثر مللاً من تخصيص LLM: تحضير البنية الأساسية واختيار الصور والتحقق من صحة الإعدادات وتشغيل وصفات التدريب. بدلاً من بناء خط أنابيب يدويًا، يحصل المطور على مجموعة من المكونات الجاهزة لتحميل مجموعة بيانات وتحويل الصيغة وبدء وظيفة في SageMaker وتقييم النتائج لاحقًا. في المقالة، يتم توضيح ذلك ليس بمثال تافه، بل بمهمة عملية واضحة — التصنيف الآلي لأسئلة Stack Overflow حسب الجودة.
للتجربة، أخذت AWS مجموعة بيانات Stack Overflow Question Quality بـ 60 ألف سؤال من 2016-2020 واختارت عشوائياً 4700 سجل. كان يجب على النموذج تصنيف كل سؤال في واحدة من ثلاث فئات: HQ أو LQ_EDIT أو LQ_CLOSE. تم تخصيص 3500 مثال لـ SFT و500 للتقييم، وللـ RFT تم استخدام 700 مثال متخصص إضافي، مكملاً بجميع سجلات 3500 SFT لمنع النموذج من نسيان صيغة الإجابة التي تعلمها بالفعل.
كيف تقدم التدريب
ينقسم مخطط التجربة إلى أربع خطوات: أولاً، تقييم أساسي للـ Nova 2.0 المُدرب مسبقاً، ثم ضبط دقيق خاضع للإشراف، يتبعه ضبط دقيق بالتعزيز، وأخيراً نشر على Amazon SageMaker AI Inference. لتحميل CSV والتحقق من المخطط وتحويل البيانات، تستخدم AWS فئة CSVDatasetLoader، ولتشغيل الحسابات — SMTJRuntimeManager. يعمل SFT في المثال على أربع حالات ml.p5.48xlarge، ويمكن للـ SDK التحقق مسبقاً من توافق البيئة والمعاملات لتجنب التقاط الأخطاء بعد بدء الوظيفة.
- يوضح Baseline كيف يتصرف النموذج بدون ضبط دقيق
- يعلم SFT الصيغة الصحيحة والنمط الموضوعي للإجابة
- يضبط RFT الحل عبر دالة المكافأة
- يمكن القيام بالنشر إما في Bedrock أو في SageMaker
بالنسبة لـ RFT، أضافت AWS دالة مكافأة بسيطة عبر Lambda: +1 للفئة الصحيحة و -1 للفئة الخاطئة. تم إطلاق الضبط الدقيق فوق نقطة تفتيش SFT على حالتي ml.p5.48xlarge، والتشغيل نفسه تم الحفاظ عليه قصيراً — 40 خطوة فقط. بالإضافة إلى ذلك، حدد الفريق طول الإخراج وأدخل عقوبة KL لمنع النموذج من الانحراف بعيداً جداً عن السلوك المحدد أثناء مرحلة SFT. بعبارة أخرى، يعمل SDK هنا ليس فقط كمغلف حول التشغيل، بل كنقطة موحدة لتحضير البيانات والتدريب والسجلات والنشر.
ما أظهرت المقاييس
الجزء الأكثر فائدة من المقالة — الأرقام. أظهرت Nova 2.0 الأساسية فقط 13% من المطابقة الدقيقة في مهمة ثلاث فئات، حيث سيؤدي التخمين العشوائي إلى حوالي 33.3%. حتى لو تجاهلنا الإطناب في الإجابات واستخرجنا علامة الفئة فقط من النص، كانت الدقة 52.2%. تشرح AWS هذا بمشكلتين: كان النموذج حريصاً جداً على كتابة تفسيرات طويلة بدلاً من علامة واحدة، وكان منحازاً نحو إجابة HQ بغض النظر عن الجودة الفعلية للسؤال.
بعد ضبط دقيق قصير، ارتفعت المطابقة الدقيقة إلى 77.2%، ودقة التصنيف على العلامات المستخرجة — إلى 79.0%. أضافت الطبقة التالية RFT أكثر قليلاً: ارتفعت المطابقة الدقيقة إلى 78.8%، شبه EM — إلى 80.6%، F1 — إلى 78.8%. كان التحسن بعد مرحلة التعزيز ليس ضخماً، لكنه متسق عبر جميع المقاييس الرئيسية تقريباً. تلاحظ AWS أيضاً بشكل منفصل أن BLEU غير مفيد تقريباً لمثل هذه المهمة: عندما يجيب النموذج برمز واحد مثل HQ أو LQ_CLOSE، من الأهم النظر إلى المطابقة الدقيقة و F1، بدلاً من تداخل n-gram.
ما يعنيه هذا
تحاول AWS بيع ليس مجرد نموذج آخر، بل مسار أقصر لتخصيصه العملي. إذا كان Nova Forge SDK يغطي فعلاً التحقق والتشغيل والمراقبة والنشر في واجهة واحدة، فستجد الفريق أسهل لاختبار الفرضيات على مجموعات بيانات متخصصة دون مهمة MLOps منفصلة لكل تكرار.
هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟
AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.