Opus 4.7 من Anthropic يستهلك توكنات أكثر: تضخم مخفي بأسعار ثابتة
في Opus 4.7 من Anthropic، يتم ترميز النص نفسه إلى توكنات أكثر مقارنة بـ Opus 4.6. من الناحية الرسمية، لم تتغير الأسعار وحدود السياق، لكن عمليًا تزداد تكاليف…
معالج بواسطة الذكاء الاصطناعي من Habr AI؛ بتحرير Hamidun News
أطلقت Anthropic نموذج Claude Opus 4.7، وكشفت الاختبارات الأولى عبر API عن شيء غير متوقع: النص نفسه في النموذج الجديد قد يحتل عدداً أكبر بكثير من الرموز (tokens) مقارنة بـ Opus 4.6. مع عدم تغيير الأسعار رسمياً، هذا يمثل زيادة خفية لكن حقيقية في التكاليف.
ما هي المشكلة
المحلل (tokenizer) هو مكون يقسم النص إلى أجزاء قبل إدخاله في النموذج. يحدد عدد هذه الأجزاء بدقة تكلفة الطلب وحجم نافذة السياق المشغولة. عندما تغير Anthropic المحلل بين الإصدارات، يبدأ الموجه (prompt) بـ "الوزن" بشكل مختلف. في حالة Opus 4.7، زاد الوزن. إذا كان طلبك النموذجي يحتل 1,000 رمز سابقاً، فقد يحتل الآن 1,300–1,500 رمز. لم يتغير السعر لكل مليون رمز—لكنك بالفعل تستهلك المزيد من الرموز للعمل ذاته.
"ينتج عن ذلك تضخم مخفي: الأسعار والحدود مدرجة كما هي، لكن في الواقع قد تزيد التكاليف" — من بحث فريق
Kodik.
قامت شركة Kodik، التي تطور محرر أكواد يدعم عدة نماذج ذكاء اصطناعي، بفحص سلوك المحلل بشكل مستقل عبر API. لم تنشر Anthropic بيانات مقارنة رسمية، لذا أجرى المطورون اختباراتهم الخاصة وشاركوا نتائجهم.
أي محتوى يتأثر أكثر
الزيادة في الرموز ليست موحدة عبر أنواع النصوص المختلفة. بناءً على البيانات المتاحة، الصورة تبدو هكذا:
- الأكواد — زيادة ملحوظة، خاصة في اللغات التي تحتوي على العديد من الأحرف الخاصة: العوامل، الأقواس، المحاذاة
- الخيوط التقنية (JSON و XML و YAML و SQL) — تختلف التغييرات حسب البنية؛ قد تنمو الهياكل المتداخلة أكثر
- الموجهات النظام — تتأثر بنفس طريقة طلبات المستخدم؛ بالنسبة للمنتجات التي تحتوي على تعليمات نظام طويلة، هذا حساس بشكل خاص
- النص العادي — نمو معتدل، أقل وضوحاً في الطلبات القصيرة
- المحتوى المختلط (نص + أكواد + JSON) — السلوك غير متنبأ به؛ يستحق الاختبار لسيناريوك المحدد
من المهم الأخذ في الاعتبار الحجم: إذا نما الموجه بنسبة 20٪، وكان لديك مليون طلب يومياً، ستتغير فاتورتك الفعلية بشكل كبير جداً.
لماذا هذه مشكلة منهجية
الوضع مع Opus 4.7 ليس استثناءً. يمكن للمحلل أن يتغير في أي نموذج من أي موفر، وليس دائماً ما يرد بشكل صريح في ملاحظات الإصدار. بالنسبة للفرق التي تبني منتجات فوق واجهات برمجية، هذا ينشئ عدة مخاطر.
مفاجآت الميزانية. قد تتجاوز الحدود المحسوبة على أساس البيانات التاريخية بشكل غير متوقع بعد تغيير النموذج—حتى لو لم تتغير الطلبات نفسها.
تجاوز نافذة السياق. قد يبدأ نظام كان يناسب بـ 128 ألف رمز سابقاً بقص السياق أو إرجاع خطأ بعد التحديث.
اختبارات A/B غير عادلة. عند مقارنة جودة نسختي نموذج على البيانات نفسها، يعني المحللون المختلفون أن النماذج تتلقى مدخلات مختلفة من الناحية التقنية—هذا يؤثر على تفسير النتائج.
انحدار مخفي في خطوط الأنابيب RAG. إذا كنت تحزم الأجزاء حسب حد الرموز، قد يكسر تغيير المحلل منطق التقسيم لديك دون خطأ واحد في السجلات.
ماذا يعني هذا
يجب على المطورين الذين يستخدمون بالفعل Opus في الإنتاج أو يخططون للانتقال إلى 4.7 تشغيل موجهاتك الفعلية عبر API المحلل لكلا الإصدارين قبل التبديل. هذا سيستغرق بضع ساعات، لكنه سيسمح لك بتقييم زيادة التكاليف بصراحة وتعديل ميزانيتك أو بنيتك وفقاً لذلك. حالة Opus 4.7 تذكير جيد: عند ترقية نموذج، تحقق ليس فقط من جودة الإجابات، بل أيضاً من كفاءة التحليل.
هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟
AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.