MarkTechPost→ المصدر

HPC-Ops من Tencent: البرامج الصينية تعصر الأقصى من المعدات الأمريكية

بينما يناقش العالم أيهما نموذج أكثر ذكاءً، قررت فريق المهندسين في Tencent التعامل مع مشكلة عملية جداً لكنها أكثر أهمية بكثير — كيفية التوقف عن حرق الميزانيات…

معالج بواسطة الذكاء الاصطناعي من MarkTechPost؛ بتحرير Hamidun News
HPC-Ops من Tencent: البرامج الصينية تعصر الأقصى من المعدات الأمريكية
المصدر: MarkTechPost. كولاج: Hamidun News.
◐ استمع للمقال

بينما يناقش العالم أيهما نموذج أكثر ذكاءً، قررت فريق المهندسين في Tencent التعامل مع مشكلة عملية جداً لكنها أكثر أهمية بكثير — كيفية التوقف عن حرق الميزانيات على الحسابات غير الفعالة. الجميع معتاد على كتابة الشبكات العصبية باستخدام Python، لكن عندما يتعلق الأمر بأحمال العمل الفعلية في الإنتاج، تصبح اللغات المفسرة عبئاً. هناك حاجة إلى وصول مباشر إلى الأجهزة، وهذا بالضبط ما توفره مكتبة HPC-Ops الجديدة. إنها ليست مجرد مجموعة أخرى من البرامج النصية، بل مكتبة كاملة من المشغلات للاستدلال عالي الأداء، والتي قضت Tencent Hunyuan سنوات في صقلها على خدماتها الداخلية.

المشكلة الأساسية بسيطة: المعماريات الحديثة مثل Mixture of Experts (MoE) أو المحولات ذات السياق الضخم تتطلب الكثير جداً من حيث عرض نطاق الذاكرة وقوة الحوسبة GPU. المكتبات القياسية من NVIDIA لا تناسب دائماً تماماً الاحتياجات المحددة لمعماريات معينة. اتخذت Tencent مسار التخصيص وأعادت كتابة نوى CUDA الحاسمة لعمليات مثل Attention و Grouped GEMM. هذه هي اللبنات الأساسية التي يتم بناء أي نموذج لغة حديث منها. إذا كانت هذه اللبنات ملتوية، فسيتهاوى الهيكل بأكمله وستنفجر فواتير السحابة.

تم توجيه اهتمام خاص في HPC-Ops إلى Fused MoE — تقنية تسمح بدمج عدة مراحل حسابية في ممر واحد عبر الذاكرة. في معماريات "مزيج الخبراء"، هذا حاسم للغاية، لأن نقل البيانات المستمر بين أجزاء مختلفة من GPU يخلق تأخيرات ضخمة. يسمح تحسين هذه العمليات للنماذج بالاستجابة بشكل أسرع، مما يؤثر مباشرة على تجربة المستخدم. لا أحد يريد أن ينتظر خمس ثوان بينما يحاول روبوت الدردشة معرفة كيفية إنهاء الجملة.

لماذا قررت Tencent فتح الكود الآن بالضبط؟ الإجابة تكمن في السياق العالمي. في ظل العقوبات والنقص في الرقائق المتقدمة مثل H100، تُجبر الشركات الصينية على أن تصبح أبطال الكفاءة. عندما لا يكون لديك إمدادات لا نهائية من GPUs، تبدأ في صقل البرنامج حتى يصبح لامعاً. من خلال إطلاق HPC-Ops كمصدر مفتوح، توفر Tencent فعلياً للسوق معياراً يمكن أن ينافس الحلول من NVIDIA أو Meta. هذه خطوة قوية في الصراع على التأثير في مجتمع مطوري البنية الأساسية.

بالنسبة للمطور العادي، هذا يعني أن الحد الأدنى للدخول لإنشاء خدمات ذكاء اصطناعي سريعة وارخصة أصبح أقل قليلاً. توفر المكتبة واجهات برمجيات تطبيقات مدمجة للغة C و Python، مما يسمح بدمج هذه الابتكارات في المشاريع الموجودة دون الحاجة إلى إعادة كتابة كل شيء من البداية. هذا جسر بين البحث الأكاديمي والواقع المؤسسي القاسي، حيث تحتسب كل ميلي ثانية.

على المدى الطويل، مثل هذه الإطلاقات تعيد تشكيل منظر الصناعة. نحن ننتقل من عصر "اجعله يعمل فقط" إلى عصر "اجعله فعالاً قدر الإمكان." Tencent توضح بوضوح أنها ليست مجرد مستهلكة للتكنولوجيا، بل هي التي تملي قواعد اللعبة على مستوى المعمارية. الآن السؤال الوحيد هو مدى سرعة التقاط هذه الابتكارات من قبل لاعبين آخرين كبار وما إذا ستصبح HPC-Ops جزءاً من المكدس القياسي لاستدلال LLM في جميع أنحاء العالم.

الجوهر: Tencent تنقل الصراع على سوق الذكاء الاصطناعي نحو كفاءة الحوسبة. هل يمكن للأطر الغربية تقديم شيء محسن بنفس الطريقة للعمل مع MoE؟

ZK
Hamidun News
أخبار الذكاء الاصطناعي بدون ضوضاء. اختيار تحريري يومي من أكثر من 400 مصدر. منتج من جمال حميدون، رئيس الذكاء الاصطناعي في Alpina Digital.

هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟

AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.

ما رأيك؟
جارٍ تحميل التعليقات…