OpenAI و Anthropic يعيدان تعريف حساب تكاليف نماذج اللغة: في 2026، سعر المهمة هو الأهم
المقياس الأساسي لسوق LLM يتغير. تنقل OpenAI خططها الموجهة للشركات إلى نموذج تسعير أكثر مرونة بناءً على حجم الاستخدام، بينما تتخلى Anthropic عن الأسعار…
معالج بواسطة الذكاء الاصطناعي من Habr AI؛ بتحرير Hamidun News
يدخل سوق نماذج اللغة الكبيرة مرحلة جديدة: الرمز الأرخص لا يعني بعد الآن ميزانية يمكن التنبؤ بها. أظهرت OpenAI و Anthropic في الوقت نفسه تقريبًا أنه في عام 2026، ستضطر الشركات إلى حساب ليس فقط السعر لكل مليون رمز، بل أيضًا التكلفة الإجمالية لإكمال مهمة. بالنسبة للشركات التي تبني منتجات على سيناريوهات الوكلاء، هذا يغير منطق الشراء والتخطيط والاقتصاد على مستوى الوحدة نفسه.
جاءت الإشارة الأولى من Anthropic. نقلت الشركة أطرعملها للوكلاء إلى فواتير تستند إلى الاستخدام، أي الدفع بناءً على الاستهلاك الفعلي للرموز بدلاً من الاشتراكات الثابتة. من الناحية العملية، هذا يعني أن بعض الأغلفة الخارجية والخدمات التي يمكنها سابقًا العمل بنموذج معدل ثابت تفقد أساسها المالي السابق. طالما كان الحمل متنبأ به نسبيًا، بدت الاشتراكات مريحة لكل من المزود والعميل. لكن في أنظمة الوكلاء، تنمو تكاليف الحوسبة بسرعة: النموذج لا يجيب ببساطة على طلب واحد، بل يخطط الخطوات، ويجري استدعاءات متعددة، ويصل إلى الأدوات، ويتحقق من النتائج مرة أخرى، ويمكنه إطلاق سلسلة طويلة من الإجراءات.
بالتوازي، غيرت OpenAI منهجها للعملاء الشركات. في خطط Enterprise و Business و EDU، قدمت الشركة تسعيرًا أكثر مرونة، حيث تتناسب التكلفة مع حجم الاستخدام بدلاً من البقاء مرتبطة بصرامة برخص المقاعد. بالنسبة لفرق الشراء، هذا تحول مهم. حتى وقت قريب، كان بإمكان المرء أن ينظر إلى الاشتراك كبند نفقات ثابت تقريبًا، لكن الآن يصبح النموذج أقرب إلى خدمات السحابة: الدفع يعتمد بشكل أكبر على شدة الاستخدام الفعلي.
كلما استخدم الموظفون الجيل والبحث وتحليل المستندات ووظائف الوكلاء بنشاط أكثر، كلما تغيرت الفاتورة بشكل ملحوظ.
هذا لا يلغي اتجاهًا آخر لاحظه السوق على مدار السنتين الماضيتين. من 2023 إلى 2025، أصبحت واجهات برمجة التطبيقات أرخص بالفعل، وانخفضت التكلفة لكل مليون رمز لنماذج فئة GPT-4. لهذا السبب اعتادت العديد من الفرق على التفكير بقاعدة بسيطة: إذا انخفض سعر الرمز، فإن تطبيق LLM يصبح تلقائيًا أكثر ربحية بمرور الوقت.
في عام 2026، هذه القاعدة لا تعمل بعد الآن بدون تحفظات. المقياس الرئيسي الآن ليس سعر الرمز بحد ذاته، بل تكلفة حل مهمة محددة. إذا كانت النتيجة المفيدة تتطلب من النظام إجراء عدة جولات، واستخدام سياق طويل، وإجراء استدعاءات أدوات، وإجراء فحوصات إضافية، وإعادة الجيل عدة مرات، فقد تنمو الفاتورة الإجمالية حتى مع واجهة برمجية تطبيقية أرخص رسميًا.
هذا ملحوظ بشكل خاص في منتجات الوكلاء، حيث يمكن لسيناريو واحد يبدو للمستخدم كإجراء واحد أن ينقسم داخليًا إلى عشرات عمليات النموذج.
من هذا تنبع استنتاجات عملية للفرق. يجب الآن بناء ميزانية LLM حول تكلفة الإجراء المكتمل: كم تكلفة تقرير واحد، وتحليل مستند واحد، وجلسة مساعد واحدة، أو سير عمل وكيل واحد منفذ بنجاح. من هنا تنشأ متطلبات منتج جديدة: القضاء على الخطوات غير الضرورية، والتحكم في عمق استدلال الوكيل، وتقليل السياق، والتخزين المؤقت، والتوجيه نحو نماذج أرخص حيث يكون ذلك مقبولاً، والقياس الصارم للمكالمات التي تخلق قيمة حقيقية.
بالنسبة لمديري التكنولوجيا وكبار مسؤولي المنتج والفرق المالية، هذا يعني الانتقال من الحديث عن "ذكاء اصطناعي رخيص" إلى الاقتصاد التشغيلي السليم، حيث لا يعتبر السعر الجميل في جدول، بل تكلفة نتيجة عملية محددة.
النقطة الأساسية لهذا التحول هي أن سوق LLM لم يتوقف عن الانخفاض، بل توقف عن كونه بسيطًا بسذاجة. أزمة الحوسبة في 2026 ليست مجرد مسألة قدرة متاحة، بل مسألة إدارة النفقات. الفائزون لن يكونوا الشركات التي تبحث عن أقل سعر لكل رمز، بل تلك التي يمكنها حساب تكلفة النتيجة النهائية وتصميم الأنظمة بحيث يجلب كل رمز إضافي قيمة قابلة للقياس.
هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟
AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.