الاستدلال

أخذ العينات من النواة (Top-p)

أخذ العينات من النواة (top-p) هي استراتيجية فك تشفير تقيد اختيار الرموز إلى أصغر مجموعة من الرموز التي يلبي احتمالها التراكمي حد p، التكيف الديناميكي مع حجم مجموعة المرشحين مع ثقة النموذج في كل خطوة توليد.

أخذ العينات من النواة (top-p)، يدعى أيضاً أخذ عينات النواة، هي استراتيجية فك تشفير قدمها Holtzman وآخرون في "الحالة الفضولية لترجيع النص العصبي" (ICLR 2020). في كل خطوة توليد، يتم ترتيب الرموز بالاحتمال المتناقص والنواة تُعرّف كأصغر بادئة من تلك القائمة المرتبة التي احتمالها التراكمي يكون على الأقل p. يتم سحب الرمز التالي من النواة بعد إعادة تطبيع احتمالاتها لمجموع 1.

الميزة الرئيسية على أخذ عينات أعلى k الثابت هي التكيف. عندما يكون النموذج واثقاً بشدة — على سبيل المثال، بعد الموجه "الرمز الكيميائي للذهب هو" — قد تحتوي النواة على رمز واحد أو اثنين فقط، مما يحافظ على التوليد حتمياً ودقيقاً. عندما يواجه النموذج غموضاً حقيقياً — مثل الكلمة التالية في قصة مفتوحة النهاية — تتوسع النواة إلى عشرات أو مئات من المرشحين، تمكين التنوع الإبداعي. قيمة k الثابتة لا يمكنها تحقيق هذا التوازن: k صغير محدود جداً في السياقات غير المؤكدة، بينما k كبير يقبل رموز غير محتملة جداً عندما يكون النموذج واثقاً. معامل p النموذجي يُضبط بين 0.9 و 0.95 للاستخدام العام.

يهم أخذ العينات من النواة لأنه تجريبياً يقلل من التكرار المتدهور والعدم التماسك الذي يؤثر على فك التشفير الجشع والقائم على درجة الحرارة النقي، مع منع أخذ عينات من ذيل التوزيع حيث تتجمع الرموز غير المتماسكة أو الهلوسة. عادة ما يتم دمجه مع درجة الحرارة: إعادة تشكيل درجة الحرارة لتوزيع اللوجت أولاً، ثم أخذ عينات top-p تحديد من النواة الناتجة. معاً يوفران رافعان مكملتان — التنوع الكلي واقتطاع الذيل — التي يمكن ضبطها بشكل مستقل.

Top-p هو معامل قياسي في جميع واجهات برمجة تطبيقات نموذج اللغة الإنتاجية وأطر عمل الاستدلال تقريباً اعتباراً من 2026، بما في ذلك OpenAI، Claude API الخاص بـ Anthropic، Google Gemini، vLLM، و Hugging Face Transformers. البحث استكشف بدائل مثل أخذ عينات min-p (إزالة الرموز التي احتمالها ينخفض أسفل جزء من احتمال الرمز الأعلى) وأخذ عينات top-a، كل واحد يقدم سلوكات قطع ذيل مختلفة قليلاً. رغم هذه البدائل، تبقى top-p النهج السائد بسبب بساطتها وسلوكها التجريبي المفهوم جيداً عبر عائلات النموذج.

مثال

مع p=0.92 ودرجة حرارة=0.8، ينتج نموذج اللغة الذي يولد روايات غموض مرشحي الكلمة التالية محصورة على استمرارية المؤامرة المعقولة — عادة بضع عشرات رموز — بينما لا يزال يسمح باختيارات غير متوقعة لكن متماسكة التي فك التشفير الجشع لن ينتجها أبداً.

مصطلحات مرتبطة

درجة الحرارة (Temperature)الرمز (Token)اللوجتات (Logits)

← المسرد