أطلقت Google نموذج Gemma 4 على Hugging Face: نماذج متعددة الوسائط للتشغيل المحلي
طرحت Google DeepMind نموذج Gemma 4 على Hugging Face وراهنت على التشغيل المحلي. تضم السلسلة أربعة نماذج متعددة الوسائط: من E2B وE4B لأجهزة edge إلى 26B A4B…
معالج بواسطة الذكاء الاصطناعي من Hugging Face Blog؛ بتحرير Hamidun News
كشفت Google DeepMind عن عائلة Gemma 4 على منصة Hugging Face، مركزة ليس على الحجم الأقصى للنموذج، بل على مزيج من القوة والقدرات متعددة الأنماط وإمكانية تشغيل النموذج محليًا. تتضمن السلسلة أربع نسخ: من النماذج المدمجة E2B و E4B للسيناريوهات الحافة إلى 26B A4B و 31B للمهام الأثقل على محطات العمل وأجهزة الخادم.
النسخ التي تم إطلاقها
تم الإطلاق في 2 أبريل 2026. أفادت منصة Hugging Face بأن Gemma 4 متاحة بصيغ أساسية وصيغ التعليمات، مع توزيع السلسلة بالكامل بموجب ترخيص Apache 2.0. حصلت النموذجان الأصغران على نافذة سياق بحجم 128K، بينما حصل النموذجان الأكبران على 256K. تقدم Google و Hugging Face السلسلة ليس فقط كنماذج دردشة، بل كأساس لسيناريوهات الوكيل والمساعدات المحلية والتطبيقات متعددة الأنماط، حيث يكون العمل مع النصوص والصور والفيديو وفي بعض التكوينات الصوت مهمًا.
- Gemma 4 E2B — 2.3B فعال، حوالي 5.1B مع التضمينات، سياق 128K
- Gemma 4 E4B — 4.5B فعال، حوالي 8B مع التضمينات، سياق 128K
- Gemma 4 26B A4B — نموذج MoE بـ 26B معاملات إجمالية وحوالي 4B نشطة، سياق 256K
- Gemma 4 31B — نموذج كثيف بـ 31B مع سياق 256K
وفقًا لـ Google، احتل النموذج 31B المرتبة الثالثة بين النماذج المفتوحة في تصنيف النصوص بواسطة Arena AI في وقت الإطلاق، بينما احتل 26B A4B المرتبة السادسة. بالنسبة لسلسلة مصممة أيضًا للنشر المحلي، هذا بيان قوي: تحاول Google التنافس ليس فقط في السحابة مع Gemini، بل أيضًا في قطاع النماذج المفتوحة، حيث يأتي التوازن بين الجودة والسرعة والذاكرة والاستقرار في الإنتاج ومرونة النشر.
ما الذي يمكن لـ Gemma 4 أن تفعله
يركز مدونة Hugging Face على الاختبارات العملية متعددة الأنماط. يمكن للنماذج العمل مع OCR والتعرف على الكلام واكتشاف الكائنات والتعرف على الإحداثيات في الصور. في مثال واحد، تعثر Gemma 4 على عنصر واجهة في لقطة شاشة من طلب نصي عادي وتعيد فورًا صناديق الحدود بصيغة JSON بدون محددات تنسيق إضافية. بالنسبة للمطورين، هذا مفيد: كود مساعد أقل حول النموذج، تجميع أبسط للوكلاء البصريين ومساعدي الواجهة.
لا ينتهي الأمر عند هذا الحد. يتم عرض Gemma 4 في مهام استعادة صفحة HTML من الصور، في استدعاءات الوظائف النصية فقط ومتعددة الأنماط، وكذلك في تصحيح الأكواد وإكمالها. يمكن للنماذج الأصغر E2B و E4B قبول الصوت، وفي مهام الفيديو يمكنها معالجة مقاطع الفيديو جنبًا إلى جنب مع المسارات الصوتية. تفهم النماذج الأكبر 26B A4B و 31B الفيديو بدون صوت. وفقًا لاختبارات Hugging Face، حتى بدون تدريب لاحق محدد على الفيديو، تتعامل النماذج بثقة مع وصف ما يحدث والعناوين للصور المعقدة.
لماذا هذا عملي
من الناحية التقنية، تم بناء Gemma 4 حول عدة حلول يجب أن تحسن الأداء في السياق الطويل وتقلل من تكلفة الاستدلال. من بينها التبديل بين انتباه نافذة الشريحة المحلي والانتباه الكامل للسياق العام، وتكوينات RoPE منفصلة للطبقات المختلفة، والتضمينات لكل طبقة، والذاكرة المؤقتة KV المشتركة. تتيح هذه التقنية الأخيرة إعادة استخدام حالات المفتاح والقيمة عبر الطبقات، وتوفر الذاكرة والحساب، وهو مهم بشكل خاص للإنشاء الطويل والتشغيل على جهاز.
ميزة عملية أخرى هي اتساع النظام البيئي بالفعل في يوم الإطلاق. تعلن منصة Hugging Face عن الدعم للمحولات و llama.cpp و MLX و transformers.
js مع WebGPU و Mistral.rs، بينما يتوفر TRL و Unsloth Studio للضبط الدقيق. هذا يعني أن Gemma 4 لا يقتصر على مكدس واحد: يمكن تجربة النموذج بسرعة في متصفح أو على جهاز كمبيوتر محمول أو على Mac أو في وكيل محلي أو في خط أنابيب Python المألوف.
بالنسبة لسوق النماذج المفتوحة، هذا لم يعد مكافأة لطيفة بل شرط ضروري للنشر الحقيقي.
ماذا يعني هذا
توضح Gemma 4 إلى أين يتجه سوق الذكاء الاصطناعي المفتوح في 2026: أقل من سباق لعدد المعاملات الخام وأكثر تركيزًا على القدرات متعددة الأنماط والسياق الطويل والنشر المحلي. إذا تم تأكيد الجودة في الاختبارات المستقلة وحالات الإنتاج، سيكون لدى المطورين نموذج أساسي قوي آخر للوكلاء والمنتجات غير المتصلة والسيناريوهات ذات الصلة حيث تكون خصوصية البيانات والكمون وتكلفة الاستدلال أكثر أهمية من الاعتماد على واجهات برمجة التطبيقات السحابية.
هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟
AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.