@demishassabis→ المصدر

أطلقت Google DeepMind نموذج DiffusionGemma — وهو LLM قائم على الانتشار أسرع 4 مرات من نماذج Gemma 4 الأخرى

أعلنت Google DeepMind عن DiffusionGemma، وهو نموذج لغوي من فئة جديدة يستخدم الانتشار بدلًا من الانحدار الذاتي. ويعمل أسرع 4 مرات من النماذج الأخرى في عائلة…

معالج بواسطة الذكاء الاصطناعي من @demishassabis؛ بتحرير Hamidun News
أطلقت Google DeepMind نموذج DiffusionGemma — وهو LLM قائم على الانتشار أسرع 4 مرات من نماذج Gemma 4 الأخرى
المصدر: @demishassabis. كولاج: Hamidun News.
◐ استمع للمقال

قدمت Google DeepMind نموذج DiffusionGemma — نموذج لغة من فئة جديدة يطبق مبدأ الانتشار لتوليد النص بدلاً من النهج الانحداري المعياري. وفقاً للفريق، يعمل النموذج بسرعة 4 مرات أسرع من أي نموذج آخر من عائلة Gemma 4 مع الحفاظ على جودة مماثلة.

كيفية عمل نموذج اللغة القائم على الانتشار

تولد نماذج اللغة الكلاسيكية — GPT و Llama و Gemma — النص بشكل متسلسل: رمز تلو الآخر، من اليسار إلى اليمين. لتوليد 500 رمز، يتطلب 500 خطوة استدلال متتالية. هذا قيد معماري أساسي: كل رمز لاحق يعتمد على جميع الأسلاف السابقة، لذا فإن المعالجة المتوازية مستحيلة بطبيعة الانحدار الذاتي.

يعمل نهج الانتشار بشكل مختلف. نفس الفكرة التي تكمن وراء Stable Diffusion و DALL-E للصور يتم تطبيقها الآن على النص: يتعلم النموذج استعادة النص الأصلي من الضوضاء العشوائية، مما يعقد تدريجياً التسلسل بأكمله ككل — وليس من اليسار إلى اليمين، بل بشكل متكرر، بالتوازي عبر جميع المواضع في نفس الوقت.

  • الانحدار الذاتي: 500 رمز يتطلب 500 خطوة متتالية
  • الانتشار: يتم معالجة 500 رمز في 10-50 خطوة بغض النظر عن الطول
  • المكاسب في السرعة غير خطية — كلما كان النص أطول، كلما كانت الميزة أكثر وضوحاً

حاولت فرق عديدة إتقان الانتشار لتوليد النص منذ عام 2021. كانت المشكلة الرئيسية هي الجودة: نماذج النصوص القائمة على الانتشار كانت أداء ضعيف مقارنة بالنماذج الانحدارية لفترة طويلة، حيث فقد النص الترابط والدقة في الصيغة. بناءً على بيان Hasabis، تجاوزت DiffusionGemma هذه العقبة.

أعلن ديميس هاسابيس عن ذلك شخصياً

أعلن الرئيس التنفيذي لـ Google DeepMind عن النتيجة بنفسه — هذا غير عادي. عادة ما يروج المديرون من هذا المستوى المنتجات الكاملة أو الاتجاهات الاستراتيجية، لكنهم نادراً ما يبرزون حلولاً معمارية محددة كمناسبة منفصلة للاحتفال. هنأ Hasabis شخصياً الباحث Brian O'Donoghue والفريق بأكمله، واصفاً التطور بأنه 'سريع البرق'.

"ابتكار ممتاز في مجال انتشار النصوص.

DiffusionGemma سريعة البرق — أسرع 4 مرات من نماذج Gemma 4 الأخرى. لا أستطيع الانتظار لرؤية ما سيبنيه الناس معها!" — Demis Hasabis

سياق مهم: لا يتعلق الأمر بالمقارنة مع المعايير القديمة، بل مع عائلة Gemma 4 الحالية، والتي تُعتبر بحد ذاتها واحدة من الأكثر كفاءة في فئة النماذج المفتوحة. الزيادة الرباعية على هذا المستوى الأساسي هي نتيجة معمارية هامة.

اقتصاديات الاستدلال تتغير

تحدد سرعة التوليد كلاً من تكلفة واجهات برمجة التطبيقات والكمون الخاص بالمنتج النهائي. إذا كانت DiffusionGemma تولد بسرعة 4 مرات بجودة قابلة للمقارنة، فهذا يفتح سلسلة من الفرص العملية:

  • تقليل تكلفة الاستدلال — وقت GPU أقل لكل رد
  • سياقات طويلة بدون نمو أسي في الكمون
  • القدرة على المنافسة في السيناريوهات الحساسة للكمون: الروبوتات الحوارية والإكمال التلقائي وخطوط أنابيب الوكلاء
  • إمكانية التوحيد مع توليد الصور والصوت القائم على الانتشار

التآزر متعدد الأنماط مثير للاهتمام بشكل خاص: إذا تم الجمع بين انتشار النص مع نهج ناضجة بالفعل للصور والصوت، تظهر بنية واحدة تعالج جميع الأنماط من خلال مبدأ واحد. تتحرك Google بالفعل في هذا الاتجاه مع سلسلة Gemini — يبدو أن DiffusionGemma هي الخطوة الأولى نحو الانتشار متعدد الأنماط الكامل.

ما يعنيه ذلك

توقفت نماذج اللغة القائمة على الانتشار عن كونها تجربة أكاديمية. عندما يعلن الرئيس التنفيذي لواحد من أكبر مختبرات الذكاء الاصطناعي في العالم شخصياً عن اختراق معماري، يستجيب السوق. إذا تم تأكيد مقاييس سرعة DiffusionGemma في الاختبارات المستقلة، فقد يؤدي ذلك إلى إعادة تشكيل الأسعار في سوق استدلال نموذج اللغة الكبير وإجبار المنافسين على تسريع بحثهم الخاص عن الانتشار. للمطورين الذين لم يستكشفوا هذه البنية المعمارية بعد — حان الوقت الآن.

ZK
Hamidun News
أخبار الذكاء الاصطناعي بدون ضوضاء. اختيار تحريري يومي من أكثر من 400 مصدر. منتج من جمال حميدون، رئيس الذكاء الاصطناعي في Alpina Digital.

هل تحتاج إلى ذكاء اصطناعي يعمل داخل شركتك — وليس فقط في موجز الأخبار؟

أبني ذكاءً اصطناعياً جاهزاً للإنتاج للشركات — أنظمة CRM مخصّصة، أدوات داخلية، وكلاء مستقلون، أتمتة سير العمل. ملك لك، مصمّم وفق عمليتك، دون رسوم لكل مستخدم. من إعداد جمال خميدون، مدير المنتجات في AlpinaGPT (منصة ذكاء اصطناعي، أكثر من 6000 مستخدم).

ما رأيك؟
جارٍ تحميل التعليقات…