Jiqizhixin (机器之心)→ المصدر

نماذج اللغة بالانتشار تتحدى GPT: رقم قياسي للسرعة عند 892 توكن

اختراق تقني في مجال معماريات الشبكات العصبية: حقق نموذج لغة بالانتشار (DLM) يضم 100 مليار معلمة سرعة توليد مذهلة بلغت 892 توكنًا في الثانية. ويفند هذا…

معالج بواسطة الذكاء الاصطناعي من Jiqizhixin (机器之心)؛ بتحرير Hamidun News
نماذج اللغة بالانتشار تتحدى GPT: رقم قياسي للسرعة عند 892 توكن
المصدر: Jiqizhixin (机器之心). كولاج: Hamidun News.
◐ استمع للمقال

# نماذج اللغة بالانتشار تطعن GPT: رقم قياسي للسرعة بمعدل 892 رمز في الثانية

نماذج الانتشار تعيد كتابة القواعد: 100 مليار معامل، 892 رمز في الثانية

تلقت صناعة نماذج اللغة تحدياً غير متوقع. أثبت الباحثون أن أساليب الانتشار لتوليد النصوص، التي اعتبرت بطيئة وغير فعالة لفترة طويلة، لا تستطيع فقط أن تتنافس مع الهياكل المعمارية الكلاسيكية مثل GPT، بل يمكنها أن تفوقها في السرعة. حقق نموذج لغة بالانتشار بحجم 100 مليار معامل سرعة توليد قياسية تبلغ 892 رمز في الثانية — وهو رقم يطعن في الآراء الراسخة حول كيفية عمل نماذج اللغة الكبيرة الحديثة.

هذا الإنجاز مهم بشكل خاص لأن أساليب الانتشار ظلت على الهامش في سياق مهام معالجة النصوص لسنوات عديدة. في حين أن نماذج الانتشار في رؤية الحاسوب حققت سلطة وأحدثت ثورة في تركيب الصور، كان النموذج الانحداري التلقائي سائداً في معالجة النصوص — نفس النموذج الذي بُني عليه ChatGPT ومنافسوه. تتنبأ النماذج الانحدارية التلقائية بالرمز التالي بناءً على جميع الرموز السابقة، مما يتطلب مرورات متسلسلة عبر الشبكة العصبية ويبطئ العملية.

تعمل نماذج اللغة بالانتشار وفقاً لمبادئ مختلفة جوهرياً. بدلاً من توليد النص كلمة تلو الأخرى، تبدأ ببيانات مليئة بالضوضاء وتحسن تدريجياً الناتج من خلال عدة مراحل إزالة الضوضاء. التناقض: مع مثل هذا النهج، الذي يبدو أنه يتطلب عمليات حسابية أكثر، أظهر النموذج الجديد البالغ 100 مليار سرعة تبلغ 892 رمز في الثانية. هذا أسرع تقريباً بمرتين من مقاييس الأداء النموذجية للنماذج الانحدارية التلقائية الحديثة بحجم مشابه. يكمن الاختراق التقني في تحسين خوارزمية إزالة الضوضاء والهندسة المعمارية للشبكة، مما يسمح بمعالجة متوازية لمواضع متعددة في النص، بدلاً من انتظار اكتمال التنبؤ برمز واحد قبل الانتقال إلى التالي.

تمتد أهمية هذه النتيجة بعيداً عن مجرد تحقيق رقم قياسي في السرعة. يثبت التوسع الناجح لنموذج الانتشار إلى 100 مليار معامل أن هذا النهج ليس طريقاً مسدوداً من الناحية الهندسية. إذا كانت نماذج الانتشار يمكنها أن تعمل بمثل هذا الأداء، فإنها تفتح طرقاً جديدة للتحسين. يمكن للمصنعين تقليل الكمون، وتحسين إنتاجية الخوادم، وتقليل استهلاك الطاقة — وهي عوامل حرجة في عصر تكاليف الحوسبة السحابية.

بالنسبة للصناعة، هذا يعني أن مستقبل نماذج اللغة لا يجب أن يكون مرتبطاً بالهندسة المعمارية الانحدارية التلقائية. استثمرت OpenAI و Google DeepMind والمختبرات الأخرى موارد ضخمة في تحسين النهج الانحداري التلقائي، لكن ظهور بديل منافس قد يجبر على إعادة النظر في الاستراتيجيات. تحصل الشركات التي استثمرت في البحث عن أساليب الانتشار على ميزة ملموسة. بالنسبة للمستخدمين النهائيين، قد يعني هذا استجابات أسرع من مساعدات ذكية، وواجهات برمجية أرخص، ونماذج محلية أكثر كفاءة في استخدام الطاقة.

ومع ذلك، يجب توخي الحذر عند تفسير النتائج. سرعة توليد الرموز بعيدة كل البعد عن أن تكون المعيار الوحيد لجودة النموذج. جودة النص، والقدرة على التعامل مع التبعيات طويلة المدى، والاتساق المنطقي مهمة أيضاً. لا يزال يتعين فهم ما إذا كان نهج الانتشار يمكن أن يضاهي النماذج الانحدارية التلقائية من حيث ثراء المحتوى ودقة الإجابات في ظل موارد حسابية متساوية.

يرمز هذا الحدث إلى لحظة انتقالية في صناعة الذكاء الاصطناعي، عندما يبدأ النموذج السائد في الشعور بالمنافسة. إذا أكدت نماذج الانتشار جدواها على معاملات أخرى أيضاً، فقد نشهد تنوعاً معمارياً حقيقياً في الذكاء الاصطناعي السائد، لكل منها نقاط قوة خاصة به.

ZK
Hamidun News
أخبار الذكاء الاصطناعي بدون ضوضاء. اختيار تحريري يومي من أكثر من 400 مصدر. منتج من جمال حميدون، رئيس الذكاء الاصطناعي في Alpina Digital.

هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟

AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.

ما رأيك؟
جارٍ تحميل التعليقات…