Habr AI→ المصدر

أنثروبيك قدمت نصائح متعارضة لـ Fable 5 و Opus 4.8: ماذا تغير في الرسائل

الرسائل التي عملت لسنوات على Claude Opus 4.8 قد تكسر Fable 5. تنشر Anthropic الآن أدلة منفصلة لكل نموذج — والنصائح فيها أحياناً متعارضة تماماً. يحتاج Opus…

معالج بواسطة الذكاء الاصطناعي من Habr AI؛ بتحرير Hamidun News
أنثروبيك قدمت نصائح متعارضة لـ Fable 5 و Opus 4.8: ماذا تغير في الرسائل
المصدر: Habr AI. كولاج: Hamidun News.
◐ استمع للمقال

بدأت Anthropic بإصدار أدلة منفصلة للإشارات لكل نموذج من نماذجها — والنصائح الواردة فيها تتناقض أحياناً مباشرة مع بعضها. سيتعين على المطورين الذين قضوا سنوات في تجميع مجموعات من الإشارات المختبرة أن يعيدوا مراجعتها بشكل منفصل لكل نموذج جديد.

لماذا تصرف Fable 5 بطريقة غريبة

حالة معبرة من المجتمع: قام مطور بتوصيل Claude Fable 5 فور إطلاقه. يفوق النموذج بشكل موضوعي Opus 4.8 في المعايير، لكنه في الواقع عمل بشكل أسوأ من التوقعات. في تشغيل واحد، استهلك الوكيل 200 ألف رمز على مدى ساعة ونصف دون إكمال المهمة. في البداية، لام المطور النموذج نفسه، حتى فتح الدليل الرسمي للإشارات من Anthropic خصيصاً ل Fable 5. اتضح أن المشكلة كانت في الإشارات. تمت كتابتها لمنطق Opus 4.8 وتعارضت مع بنية النموذج الجديد. بعد إعادة صياغتها وفقاً لتوصيات Anthropic الخاصة ب Fable 5، عملت كل شيء بشكل صحيح.

الاستنتاج الرئيسي: لدى Anthropic الآن وثيقتا منفصلتان حول الإشارات — والنصائح الواردة فيهما متناقضة تماماً أحياناً. تلك التعليمات التي عاشت لسنوات في المهارات والإشارات النظامية أصبحت معاكسة للإنتاجية على النموذج الجديد.

نصائح متناقضة لنموذجين

عند مقارنة التوصيات الرسمية ل Anthropic ل Fable 5 و Opus 4.8، تثبت الاختلافات أنها أحدّ مما قد تتوقعه من نموذجي نفس المورد:

  • الوكلاء الفرعيون: يحتاج Opus 4.8 إلى دفع صريح نحو تفويض المهام — دون تعليمات يفضل حل كل شيء في سياق واحد. يطلق Fable 5 الوكلاء الفرعيين بقوة افتراضياً، وينبغي أن يكون مقيداً بحدود صريحة على العمق وعدد الاستدعاءات.
  • شرح الاستدلال: التعليمة "اشرح استدلالك" — تقنية مثبتة ل Opus — بدأت تسبب رفض تنفيذ المهمة على Fable 5.
  • الإطالة: ينتج Fable 5 إجابات طويلة حتى بدون طلب. يحتاج Opus 4.8 إلى طلب صريح للحصول على إجابات مفصلة.
  • حدود العودة الاستدعائية: بالنسبة ل Fable 5، من الحرج تحديد القيود مقدماً على عدد استدعاءات الأدوات وعمق السلاسل المتداخلة — وإلا تنتهي بسهولة بتلك 200 ألف رمز بالضبط لكل جلسة.
  • الصيغة الافتراضية: يميل Fable 5 نحو المخرجات المنظمة حتى بدون تعليمات صريحة؛ يفضل Opus في حالة مماثلة النص الحر.

توضح Anthropic التناقض من خلال أنماط تدريب مختلفة: يتم تحسين Fable 5 للسلاسل الطويلة للوكلاء بأقصى حكم ذاتي، Opus 4.8 — للإجابات عالية الجودة ضمن استدعاء واحد.

طريق ثالثة من OpenAI

لدى OpenAI فلسفتها الخاصة للإشارات ل o3 و GPT-5، والتي لا تتطابق مع توصيات Fable 5 أو توصيات Opus 4.8. بينما تركز Anthropic على إدارة الحكم الذاتي للوكيل وميله لتوسيع السياق بنفسه، تؤكد OpenAI على تحلل واضح للمهمة وقيود صريحة على صيغة المخرجات ونقاط تفتيش إجبارية في السيناريوهات متعددة الخطوات.

رد فعل المجتمع غير متجانس. يرى بعض المطورين أن الأدلة المختلفة علامة على نضج المنصة: النماذج مبنية بشكل مختلف، والأفضل الاعتراف بهذا صراحة بدلاً من تقديم نصائح عامة تعمل بنصف قوتها للجميع. يرى آخرون فيها إزعاجاً — بدلاً من مجموعة واحدة من الإشارات المتحققة، تحتاج الآن إلى الحفاظ على ثلاث نسخ متوازية على الأقل.

"من الناحية التقنية هذا مبرر — النماذج مختلفة. لكن من الناحية العملية

هذا يعني عدة نسخ من نفس الإشارات في الإنتاج", — من نقاش في مجتمع المطورين.

ماذا يعني هذا

عصر الإشارات العالمية التي تعمل بشكل متساوٍ على أي نموذج يقترب من نهايته. إذا كنت تعمل مع نماذج متعددة في الإنتاج، ستحتاج إلى إما تكوين منفصل لكل واحد أو موجه إشارات يختار المتغير الصحيح تلقائياً. بالنسبة للفرق، هذه مهمة هندسية محددة ستحتاج إلى حلها قبل وصول النموذج التالي.

ZK
Hamidun News
أخبار الذكاء الاصطناعي بدون ضوضاء. اختيار تحريري يومي من أكثر من 400 مصدر. منتج من جمال حميدون، رئيس الذكاء الاصطناعي في Alpina Digital.

هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟

AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.

ما رأيك؟
جارٍ تحميل التعليقات…