Hugging Face Blog→ المصدر

أضافت Hugging Face DeepInfra إلى Inference Providers لتشغيل النماذج عبر API موحد

أضافت Hugging Face DeepInfra إلى Inference Providers على Hub. يمكن الآن تشغيل نماذج DeepSeek و Kimi و GLM مباشرة من صفحات النماذج عبر SDKs Python و…

معالج بواسطة الذكاء الاصطناعي من Hugging Face Blog؛ بتحرير Hamidun News
أضافت Hugging Face DeepInfra إلى Inference Providers لتشغيل النماذج عبر API موحد
المصدر: Hugging Face Blog. كولاج: Hamidun News.
◐ استمع للمقال

أضاف Hugging Face منصة DeepInfra إلى قائمة موفري الاستدلال (Inference Providers) على Hub. الآن يمكن للمطورين تشغيل النماذج المتاحة عبر DeepInfra مباشرة من صفحات النماذج، من خلال حزم SDK للعميل وموجه Hugging Face الموحد دون الحاجة إلى تكامل مخصص منفصل.

ما تم إطلاقه

يوسع التكامل الجديد نظام البيئة للاستدلال بدون خادم داخل Hugging Face. أصبحت DeepInfra موفر خدمة مدعوم على Hub، مما يعني أنه يمكن اختيار نماذجها في نفس المكان الذي يبحث فيه المطورون بالفعل عن مجموعات البيانات وبطاقات النماذج وأمثلة الأكواد الجاهزة لتشغيل النماذج. في الإعلان ذاته، يتم وصف DeepInfra بأنها منصة استدلال الذكاء الاصطناعي التي تحتوي على أكثر من 100 نموذج وأحد أقل الأسعار لكل رمز في السوق. بالنسبة إلى Hugging Face، هذه خطوة أخرى نحو نموذج حيث يعمل Hub ليس فقط كفهرس، بل كنقطة إطلاق موحدة للنماذج.

عند الإطلاق، يغطي التكامل السيناريوهات التحادثية وتوليد النصوص القياسي. من خلال DeepInfra على Hugging Face، يمكنك بالفعل الوصول إلى نماذج شهيرة مفتوحة الوزن مثل DeepSeek V4 و Kimi-K2.6 و GLM-5.1. في الوقت ذاته، قد حددت الفريق بالفعل المرحلة التالية: في المستقبل، يجب أن تظهر تحويل النصوص إلى صور وتحويل النصوص إلى فيديو والتضمينات وأنواع مهام أخرى من خلال نفس الطبقة. بعبارة أخرى، هذا لا يتعلق بتكامل لمرة واحدة لنموذج أو نموذجين من نماذج اللغة الكبيرة، بل بربط قناة حسابية أوسع بالبنية الأساسية Hugging Face.

كيفية عمله

من وجهة نظر المستخدم، كل شيء مدرج في واجهة Hub المألوفة. في إعدادات الحساب، يمكنك إضافة مفاتيح موفري الخدمة الخاصة بك وتعيين ترتيب التفضيل، وعلى صفحات نماذج Hugging Face، يعرض موفري الخدمات الخارجيين المتوافقين ويولد الحاجيات وأمثلة الأكواد لهم. إذا لم يتم تحديد مفتاح، يمكن للطلبات أن تمر عبر Hugging Face نفسها. إذا تم توفير مفتاح، يتم إرسال الاستدعاءات مباشرة إلى DeepInfra. هذا يلغي الإعداد اليدوي غير الضروري ويجعل التبديل بين موفري الخدمات أسهل بكثير.

  • مفتاح API DeepInfra الخاص بك للاستدعاءات المباشرة بدون وسيط
  • وضع الموجه بواسطة HF، عندما لا يكون هناك حاجة إلى مفتاح موفر خدمة منفصل
  • ترتيب موفري الخدمات حسب أولوية المستخدم
  • نفس الأسلوب في واجهة Hub و Python SDK و JavaScript SDK
  • التكامل مع أدوات الوكلاء الشهيرة دون إعداد إضافي

بالنسبة للأكواد، النظام أيضاً بسيط جداً. يمكن الوصول إلى DeepInfra من خلال `huggingface_hub` لـ Python و `@huggingface/inference` لـ JavaScript، والأمثلة في الإعلان تستخدم عميل متوافق مع OpenAI مع عنوان URL الأساسي `https://router.huggingface.co/v1` ورمز Hugging Face. يتم تحديد النموذج بالصيغة `model:provider`، على سبيل المثال لاستدعاء DeepSeek من خلال DeepInfra.

يتم التأكيد بشكل منفصل على أن التكامل يعمل بالفعل في عدد من أدوات الوكلاء، لذا يمكن توصيل النماذج ليس فقط في الأكواد الخام، بل أيضاً في أدوات الوكيل فوق واجهة برمجية التطبيقات المشتركة.

الأسعار والوصول

فيما يتعلق بالفواتير، ترك Hugging Face سيناريوهين واضحين. إذا استخدم المطور مفتاح DeepInfra الخاص به، يذهب الدفع إلى DeepInfra وفقاً لأسعارها. إذا تم توجيه الطلب من خلال Hugging Face Hub، تتم عملية الخصم عبر حساب Hugging Face، ولكن بدون رسم إضافي من جانب المنصة: تقول الشركة إنها تنقل فقط التكلفة القياسية لواجهة برمجة التطبيقات الخاصة بموفر الخدمة. بالنسبة للفريق، هذا تفصيل مهم، لأن الموجه الموحد لا يصبح طبقة تسعير إضافية أخرى فوق البنية الأساسية الموجودة بالفعل.

هناك أيضاً طريقة واضحة لاختبار التكامل دون نفقات كبيرة. يحصل مستخدمو خطة PRO على دولارين من رصيد الاستدلال شهرياً، والذي يمكن إنفاقه لدى موفري خدمات مختلفين داخل هذا النظام. الحسابات المجانية لديها أيضاً حد صغير من الاستدلال، على الرغم من أن Hugging Face تشجع بشكل مباشر المستخدمين النشطين على الانتقال إلى PRO. من الناحية العملية، يقلل هذا من حاجز الدخول: يمكنك المقارنة السريعة بين DeepInfra وموفري الخدمات الآخرين على نفس النماذج دون بناء إعداد اختبار منفصل أو تكوين عدة حزم SDK مختلفة.

ما يعنيه هذا

يحول Hugging Face Hub بشكل متزايد إلى طبقة تنسيق فوق عدة موفري خدمات الذكاء الاصطناعي، وليس مجرد عرض نماذج. بالنسبة للمطورين، هذا يعني تكامل يدوي أقل واختبار أسرع لنماذج اللغة الكبيرة مفتوحة الوزن ومسار أسهل نحو معمارية متعددة موفري الخدمات دون إعادة كتابة أكواد العميل.

ZK
Hamidun News
أخبار الذكاء الاصطناعي بدون ضوضاء. اختيار تحريري يومي من أكثر من 400 مصدر. منتج من جمال حميدون، رئيس الذكاء الاصطناعي في Alpina Digital.

هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟

AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.

ما رأيك؟
جارٍ تحميل التعليقات…