3DNews AI→ المصدر

معالجات GPU الجديدة ستخفض تكاليف الاستدلال، لكن ليس أسعار المستخدمين

الاستدلال (نشر نماذج الذكاء الاصطناعي) يزداد تكلفة بسبب العبء المتزايد على البنية التحتية. يعد الجيل الجديد من معالجات GPU والمسرعات المتخصصة بتخفيف الطلب…

معالج بواسطة الذكاء الاصطناعي من 3DNews AI؛ بتحرير Hamidun News
معالجات GPU الجديدة ستخفض تكاليف الاستدلال، لكن ليس أسعار المستخدمين
المصدر: 3DNews AI. كولاج: Hamidun News.
◐ استمع للمقال

كل يوم تزداد تكاليف خدمات الذكاء الاصطناعي بسبب العبء المتزايد على البنية التحتية. تنفق الشركات المزيد والمزيد على الخوادم ومعالجات الرسومات للاستدلال — المرحلة التي تعمل فيها النموذج المدرب وتستجيب لطلبات المستخدمين. والمستهلكون يشعرون بذلك في فواتيرهم عن API والاشتراكات.

لماذا الاستدلال مكلف جداً

الاستدلال ليس تدريب النموذج. تم تدريب النموذج مرة واحدة، ثم يتم تشغيله آلاف المرات يومياً على آلاف الخوادم. كل طلب من المستخدم يتطلب حساباً على GPU. عندما يكتب الملايين من الأشخاص في ChatGPT في نفس الوقت، فإن هذا يخلق حملاً ضخماً. لدى المطورين خياران: إما شراء معالجات GPU إضافية، أو التعايش مع الطوابير.

تبيع NVIDIA معالجات H100 و B100 بمئات الآلاف من الدولارات لكل واحدة. تشتري OpenAI و Google و Meta الآلاف منها. بالإضافة إلى ذلك، تدفع مقابل الكهرباء (عدة كيلوواتات لكل رقاقة) والتبريد (أنظمة تبريد مائية متخصصة). هذا هو السبب في أن اشتراك Claude Pro يكلف 20 دولاراً شهرياً - إنها ببساطة هندسة البنية التحتية.

الإنقاذ من الأجهزة الجديدة

يرى مصنعو المعالجات المشكلة ويطلقون أجهزة متخصصة للاستدلال. تعد NVIDIA سلسلة Blackwell للذكاء الاصطناعي، تطور Intel معالج Gaudi، وتحسن AMD معالج MI300X. يعد الجيل الجديد بـ:

  • استهلاك طاقة أقل (أرخص بنسبة 30-40٪ سنوياً على الكهرباء)
  • أداء أفضل لكل واط (رقاقة واحدة جديدة ستحل محل رقاقتين قديمتين)
  • تحسين لنماذج نموذجية (ذاكرة أقل، حسابات أسرع)
  • قابلية التوسع (من الأسهل بناء مزرعة من آلاف الرقاقات)

نظرياً، يمكن أن يقلل هذا من تكاليف تشغيل الاستدلال بنسبة 25-50٪.

لكن أسعار المستخدمين لن تنخفض

يذكر موقع The Register بعدل: عندما يصبح المعدات أرخص، فإن هذا نادراً ما يؤدي إلى انخفاض الأسعار للمستهلك النهائي. إليك السبب:

أولاً، المطورون لا يزالون يدفعون مقابل الكهرباء والرفوف والتبريد والاستهلاك التدريجي لمعالجات GPU القديمة (التي لا تختفي في يوم واحد).

ثانياً، تستخدم الشركات المدخرات لتطوير ميزات جديدة وزيادة عدد المعاملات في النماذج - هذا مكلف ويتطلب المزيد من معالجات GPU مرة أخرى.

ثالثاً، السوق صغير. OpenAI و Google و Anthropic لا تزال تحدد الأسعار ولا تتنافس بقوة على السعر. إنهم يتنافسون على الجودة والقدرات. عندما يكون هناك 20 خدمة قابلة للمقارنة في السوق، ستنخفض الأسعار - لكن هذا ليس اليوم.

ماذا يعني هذا

الأجهزة الجديدة هي هدية للشركات وليس للمستهلكين. ستسمح معالجات GPU الأرخص لخدمات الذكاء الاصطناعي بالبقاء مربحة حتى مع الطلب المتزايد. من المحتمل أن تذهب المدخرات إلى تدريب نماذج جديدة وتوسيع الجغرافيا وتحسين الخدمة - لكن ليس لتخفيضات المشتركين. ستظل خدمات الذكاء الاصطناعي مكلفة طالما أن هذا يعمل.

*تم الاعتراف بـ Meta كمنظمة متطرفة وحظرها في الاتحاد الروسي.

ZK
Hamidun News
أخبار الذكاء الاصطناعي بدون ضوضاء. اختيار تحريري يومي من أكثر من 400 مصدر. منتج من جمال حميدون، رئيس الذكاء الاصطناعي في Alpina Digital.

هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟

AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.

ما رأيك؟
جارٍ تحميل التعليقات…