Google تقدم DiffusionGemma — نموذج بنهج بديل لتوليد النصوص
أطلقت Google نموذج DiffusionGemma — وهو نموذج ذكاء اصطناعي تجريبي يختلف بشكل أساسي عن أدوات المحادثة الحديثة. بدلاً من نهج المحول (Transformer) المعتاد، يستخدم
معالج بواسطة الذكاء الاصطناعي من 3DNews AI؛ بتحرير Hamidun News
أطلقت Google نموذجًا تجريبيًا يسمى DiffusionGemma، والذي يوضح نهجًا مختلفًا جذريًا لتوليد النص مقارنة بالنماذج التي تكمن وراء روبوتات الدردشة الحديثة.
كيفية عمل روبوتات الدردشة الآن
النماذج الحديثة للذكاء الاصطناعي للنصوص (GPT و Claude و Gemini) تستخدم بنية المحول (Transformer). مبدأها بسيط: ينقب النموذج النص من اليسار إلى اليمين ويتنبأ بالكلمة التالية واحدة تلو الأخرى. إنه مثل كتابة النص في الظلام — حرف تلو الآخر، بدون طريقة لإلغاء الخطوات السابقة. تعمل هذه الطريقة بلا عيب وأصبحت معيار الصناعة في السنوات الثلاث الماضية. ومع ذلك، فإن لديها قيد مدمج: لا يمكن للنموذج العودة وإعادة النظر في قراره. بعد توليد كل رمز (token)، يتقدم السياق فقط إلى الأمام. إذا أخطأ النموذج في الرمز الخمسين، فلا يمكنه إصلاح الخطأ.
النهج الانتشاري لـ DiffusionGemma
يستخدم DiffusionGemma منطقًا مختلفًا تمامًا — عملية انتشار استعارتها Google من توليد الصور. هناك أظهرت نتائج ممتازة منذ فترة طويلة (DALL-E و Midjourney و Stable Diffusion تعمل بهذه الطريقة). في نموذج الانتشار، لا يحدث كل شيء بالتسلسل بل بشكل متكرر. يبدأ النموذج بضوضاء عشوائية عبر كامل طول النص في نفس الوقت. في التكرار الأول، تظهر الخطوط العريضة الخام للمعنى. في الثانية، يتم صقل الهياكل النحوية. في الثالثة، تضاف التفاصيل الأسلوبية. إنه مشابه لكيفية عمل الفنان: أولاً رسمة بالفحم، ثم الألوان الرئيسية، ثم الضوء والظل، ثم الضربات النهائية. الفرق الرئيسي: في كل خطوة من خطوات توليد الانتشار، يمكن للنموذج مراجعة وتصحيح النص بأكمله مرة واحدة، بدلاً من مجرد اختيار الكلمة التالية في النهاية.
لماذا هذا أفضل نظريًا
للوهلة الأولى، يبدو نهج المحول أكثر كفاءة: لماذا إجراء تكرارات متعددة إذا كان يمكنك التوليد في ممر واحد؟ لكن البحث يظهر شيئًا غير متوقع. تعطي عملية الانتشار النماذج ميزتين أساسيتين:
- إعادة تقييم السياق — في كل تكرار، يمكن للنموذج تغيير القرارات التي اتخذها في السابق
- التوازي — تحدث تحديثات النص عبر الطول بأكمله في نفس الوقت، بدلاً من الرمز تلو الآخر
- تناقضات داخلية أقل — يرى النموذج النص بأكمله بشكل كلي ويمكنه التوفيق منطقيًا بين أجزاء مختلفة
- نموذج بحثي جديد — سؤال مفتوح حول الهياكل الممكنة في معالجة اللغة الطبيعية
في الممارسة العملية، يمكن لنماذج الانتشار أن تعمل بشكل أسرع في بعض المهام بفضل التوازي. بدلاً من انتظار الرمز N قبل البدء في صقل المواضع N+1 حتى N+50، يمكن للنظام تحسينها جميعًا في نفس الوقت.
الحالة: مختبر وليس إنتاج
DiffusionGemma ليس بديلاً عن ChatGPT. إنه نموذج بحثي أطلقت Google كمصدر مفتوح لتجارب المجتمع. النتائج حاليًا تتخلف عن حاملي الرقم القياسي في الهياكل الأساسية على المعايير القياسية. ومع ذلك، فهو أول تحدٍ خطير لاحتكار بنية المحول. يلاحظ الباحثون في Google إمكانية خاصة في نهج الانتشار للمهام التي تتطلب معالجة منطقية عميقة: الاستدلال متعدد الخطوات، والتفكير المعقد، والكتابة الإبداعية مع الاتساق الداخلي.
ماذا يعني هذا
ترسل Google إشارة واضحة: نموذج 'المحول هو الطريق الصحيح الوحيد' غير مكتمل. هناك هياكل بديلة يمكن أن تصبح تنافسية وحتى متفوقة في مجالات معينة. الاتجاه المحتمل للتطور هو نماذج هجينة تجمع بين سرعة المحول مع القدرة على المعالجة العميقة للمعلومات لنموذج الانتشار.
هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟
AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.