Habr AI→ المصدر

Anthropic و Claude Opus 4.7: استهلاك الرموز الفعلي تجاوز الأرقام المعلنة

أظهر محول الرموز في Claude Opus 4.7 استهلاكاً أعلى بكثير من ما وعدت به Anthropic. في اختباريّ العالم الحقيقي، بلغت الزيادة 1.47x على التوثيق التقني و1.45x…

معالج بواسطة الذكاء الاصطناعي من Habr AI؛ بتحرير Hamidun News
Anthropic و Claude Opus 4.7: استهلاك الرموز الفعلي تجاوز الأرقام المعلنة
المصدر: Habr AI. كولاج: Hamidun News.
◐ استمع للمقال

يمكن لموديل التحويل الجديد لـ Claude Opus 4.7 أن يزيد بشكل كبير من تكلفة استخدام النموذج: في الاختبارات الفعلية، كان الاستهلاك أقرب إلى 45–47%، وليس 0–35% كما ذكرت Anthropic في دليل الترحيل. بالنسبة للفرق التي تعمل مع موجهات طويلة وتعليمات نظام موسعة وبادئات قابلة للتخزين المؤقت، هذا ليس فرقاً تجميلياً بل ضربة مباشرة للحصص والسرعة وتكلفة كل جلسة.

كان سبب هذا التحليل هو التناقض بين الوعود والممارسة. في توثيق Anthropic، يُذكر أن موديل التحويل الجديد يستخدم حوالي 1.0–1.

35 مرة أكثر من الرموز مقارنة بإصدار Opus 4.6. قرر المؤلف التحقق من ذلك ليس على أمثلة مجردة، بل على مواد تشبه فعلياً حمل عمل المطورين الحقيقي.

في القياس الأول، قام بتشغيل التوثيق التقني من خلال موديل التحويل وحصل على نمو يصل إلى 1.47x. وفي الثاني، أخذ ملف CLAUDE.

md حقيقياً—سياق تعليمي كبير—وشاهد تقريباً نفس النتيجة: 1.45x. الفرق من الحد الأعلى في الدليل كبير جداً ليعتبر ضوضاء قياس عادية.

المشكلة ليست في حقيقة نمو الرموز نفسها: أحياناً يوفر موديل التحويل الأثقل فعلاً فوائد في الجودة أو الاستقرار أو دعم النصوص المعقدة. السؤال هو أن Anthropic لا تغير الأسعار والحصص استجابة لذلك. إذا كان نفس النص يحتل الآن رموزاً أكثر، فإن المستخدم يصل إلى حدود السياق بشكل أسرع، ويواجه حدود المعدل في وقت أبكر، وينفق ميزانية أكثر لكل تكرار.

هذا مؤلم بشكل خاص للسيناريوهات التي تحتوي على موجهات نظام طويلة وعدد من القواعد والإجابات النموذجية وأجزاء من التوثيق والبادئات القابلة للتخزين المؤقت التي تُرسل مراراً وتكراراً. على الورق، السعر هو نفسه، لكن السعة المفيدة الفعلية أقل. لهذا السبب ذهب المؤلف أبعد من مجرد العد وحاول فهم ما يحصل عليه النموذج بالضبط مقابل ذلك.

بناءً على وصف التجربة، تم اختبار الفوائد المزعومة لموديل التحويل الجديد وسلوكه في المهام العملية. الخلاصة الرئيسية هي أنه لم يحدث تعويض معجزة: في الأقل في السيناريوهات المختبرة، كانت الزيادة في الاستهلاك واضحة جداً، والفائدة لم تبدو واضحة وجهية وجهازية. بعبارة أخرى، من منظور شخص يدفع مقابل الرموز أو يعيش ضمن حصص الاشتراك، يبدو التبادل غير موات للمستخدم.

هذا لا يعني بالضرورة أن Opus 4.7 أسوأ كنموذج، لكنه يعني أن اقتصادياتها أصبحت أقل راحة. بالنسبة للسوق، هذا إشارة مهمة.

نادراً ما يناقش موديل التحويل خارج دائرة ضيقة من المهندسين، على الرغم من أنه بالضبط ما يحدد كم نصاً حقيقياً يتسع في نافذة السياق وكم تكلفة كل عملية فوق واجهة برمجية التطبيقات. الفرق بنسبة 5–10% غالباً ما يكون محتملاً ويمكن أن يضيع في خلفية التباين العادي للطلبات. لكن قفزة بحوالي 45% لا تعود مسألة تقنية صغيرة بل عاملاً يؤثر على معمارية الوكلاء وطول تعليمات النظام واستراتيجية التخزين المؤقت وحتى اقتصاديات الوحدة للمنتج.

إذا كان لدى فريق خط أنابيب حيث نفس البادئة الكبيرة تشارك في مئات الاستدعاءات، فإن الرموز الإضافية تبدأ في استهلاك الأموال والإنتاجية بسرعة كبيرة جداً. الخلاصة العملية بسيطة: يجب تقييم الهجرة إلى Claude Opus 4.7 ليس بالصيغة التسويقية في دليل الترحيل، بل بنصوصك الحقيقية الخاصة.

من الجدير بالاهتمام تشغيل موجهات النظام وملفات التعليمات والتوثيق وقوالب مهام الوكلاء وكل ما يدخل السياق في كثير من الأحيان. إذا أظهرت القياسات نمواً قريباً من 1.45x، قد يتعين على الفريق أن يقلص الموجهات، أو ينقل جزءاً من المنطق خارج السياق، أو يعيد النظر في التخزين المؤقت، أو حتى يؤجل الترحيل إلى أن تظهر فوائد أوضح.

الدرس الرئيسي هنا هو أنه لا يمكن تقييم جودة النموذج فقط من خلال العروض التوضيحية والمعايير: أحياناً ما يهم فعلاً ليس ذكاء الإجابة بل تكلفة كل رمز إضافي.

ZK
Hamidun News
أخبار الذكاء الاصطناعي بدون ضوضاء. اختيار تحريري يومي من أكثر من 400 مصدر. منتج من جمال حميدون، رئيس الذكاء الاصطناعي في Alpina Digital.

هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟

AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.

ما رأيك؟
جارٍ تحميل التعليقات…