36Kr (36氪)→ المصدر

Sunrise S3: الرد الصيني على "الجوع" من ذاكرة الفيديو والتوليد الباهظ

بينما تختنق الصناعة من نقص ذاكرة الفيديو والأسعار الفلكية لمعالجات H100، قررت شركة Sunrise الصينية أن تدخل بأوراق رابحة تقلق المطورين حقاً. شريحة S3 الجديدة…

معالج بواسطة الذكاء الاصطناعي من 36Kr (36氪)؛ بتحرير Hamidun News
Sunrise S3: الرد الصيني على "الجوع" من ذاكرة الفيديو والتوليد الباهظ
المصدر: 36Kr (36氪). كولاج: Hamidun News.
◐ استمع للمقال

بينما تختنق الصناعة من نقص ذاكرة الفيديو والأسعار الفلكية لمعالجات H100، قررت شركة Sunrise الصينية أن تدخل بأوراق رابحة تقلق المطورين حقاً. شريحة S3 الجديدة الخاصة بهم ليست مجرد محاولة أخرى للحاق بالقادة من حيث الأداء الحسابية، بل هي أداة عملية لحل مشكلة "اختناق الذاكرة". أي شخص حاول تشغيل نموذج لغة ثقيل محلياً يعرف: القوة الحسابية غالباً ما تبقى معطلة لأن البيانات لا تحمّل بسرعة كافية من الذاكرة.

قامت Sunrise بتنفيذ دعم معيار الذاكرة LPDDR6 في S3. هذه هي الحالة الأولى لحلول GPGPU الصينية، والخطوة تبدو جريئة على الأقل. بفضل هذا الحل، زاد حجم الذاكرة المتاحة بمعامل أربعة مقارنة برقائق الجيل السابق للشركة.

في عالم تنمو فيه معاملات النماذج بسرعة أكبر من الميزانيات المخصصة للأجهزة، يسمح مثل هذا القفزة بالاحتفاظ بسياقات أكبر بكثير وأوزان نماذج أكبر في ذاكرة الوصول العشوائي دون اللجوء إلى التخزين الخارجي البطيء. تكمن خدعة هندسية أخرى في المرونة الحسابية. يسمح S3 بالتبديل بين دقة FP16 و FP4 حرفياً بسرعة.

بالنسبة لمن لا يتابعون تفاصيل التكميم: الانتقال إلى FP4 يسمح بضغط بيانات النموذج دون فقدان حرج في جودة الإجابات. يؤثر هذا بشكل مباشر على سرعة التوليد والأهم من ذلك على اقتصاديات العملية. عندما يشغل النموذج مساحة أقل ويتطلب موارد أقل لمعالجة كل كلمة، تنخفض تكاليف التشغيل بشكل أسي.

الأرقام التي تقدمها Sunrise تبدو استفزازية تقريباً. على النماذج الشهيرة من عائلة DeepSeek، انخفضت تكلفة توليد الرمز الواحد بنسبة 90% مقارنة بحلول الشركة السابقة. إذا تأكدت هذه المؤشرات في خوادم حقيقية، سنشهد موجة جديدة من خدمات الذكاء الاصطناعي الميسورة التي لا تتطلب استثمارات بمليارات الدولارات في البنية التحتية.

هذا ذو صلة خاصة بالسوق الصينية، حيث يقتصر الوصول إلى معالجات Nvidia المتقدمة بسبب العقوبات، والحاجة إلى قوة حسابية لنماذج اللغة الوطنية تتزايد فقط. من المهم فهم السياق: Sunrise لا تحاول إنشاء آلة عالمية لتدريب النماذج من الصفر. S3 هي "آلة" متخصصة بدقة للاستدلال، أي لتشغيل الشبكات العصبية المدربة بالفعل.

هذه هي المرحلة التي يتم فيها حرق معظم الأموال في أعمال الذكاء الاصطناعي الآن. إذا كان بإمكانك تقديم إجابات للمستخدمين بسعر أرخص 10 مرات من المنافسين، فإن نموذج عملك يبدأ فجأة في الظهور كقابل للحياة. في نهاية المطاف، سيعتمد نجاح S3 ليس فقط على "الأجهزة" بل أيضاً على الدعم البرمجي.

غالباً ما يتعثر المصنعون الصينيون بالفعل على التعريفات والتوافق مع المكتبات الشهيرة مثل PyTorch. ومع ذلك، فإن التركيز على DeepSeek—النموذج المفتوح الأكثر شهرة في المنطقة—يعطيهم منصة إطلاق ممتازة. يبدو أن عصر قياس قوة وحدات معالجة الرسومات فقط يتلاشى في الماضي، ليفسح المجال لعصر كفاءة الذاكرة.

النقطة الرئيسية: يثبت S3 من Sunrise أن التحسين للبنى المعمارية المحددة مثل DeepSeek والعمل مع ذاكرة LPDDR6 يمكن أن يوفر مكاسب كفاءة أكبر من مجرد السباق نحو النانومترات. هل يمكن لهذا النهج أن يصبح معياراً للاستدلال الاقتصادي في جميع أنحاء العالم?

ZK
Hamidun News
أخبار الذكاء الاصطناعي بدون ضوضاء. اختيار تحريري يومي من أكثر من 400 مصدر. منتج من جمال حميدون، رئيس الذكاء الاصطناعي في Alpina Digital.

هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟

AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.

ما رأيك؟
جارٍ تحميل التعليقات…