Google DeepMind Gemma 4 появились на Amazon Bedrock: три модели с MoE и мультимодальностью
На Amazon Bedrock появились три модели Gemma 4 от Google DeepMind: Gemma 4 31B, Gemma 4 26B-A4B (MoE) и Gemma 4 E2B. Все распространяются под Apache 2.0 и…
معالج بواسطة الذكاء الاصطناعي من AWS Machine Learning Blog؛ بتحرير Hamidun News
أضافت Amazon Bedrock ثلاث نماذج من عائلة Gemma 4 التي طورها Google DeepMind إلى كتالوجها — بأوزان مفتوحة ودعم إدخال متعدد الأنماط وبنية MoE. تتوفر النماذج عبر AWS API فوراً بعد الإعلان.
ثلاثة خيارات لمهام مختلفة
تم بناء Gemma 4 مع التركيز على الذكاء لكل معامل — الحد الأقصى من الكفاءة مع الحد الأدنى من المتطلبات الحسابية. تغطي العائلة نهجين معماريين: نماذج كثيفة وMoE، حيث يتم تفعيل جزء فقط من الشبكة العصبية لكل طلب. ثلاثة متغيرات instruction-tuned متاحة على Amazon Bedrock:
- Gemma 4 31B — نموذج كثيف كلاسيكي مع 31 مليار معامل، يمكن التنبؤ بسلوكه ومناسب للضبط الدقيق
- Gemma 4 26B-A4B — بنية MoE: 26B معامل في النموذج، لكن تم تفعيل 4B فقط لكل طلب
- Gemma 4 E2B — متغير خفيف الوزن للبيئات الحدية والموارد المحدودة
يتم توزيع الثلاثة جميعاً بموجب ترخيص Apache 2.0 — الاستخدام التجاري بدون قيود على الحجم أو عدد الطلبات.
ما الذي يمكن للنماذج القيام به مباشرة
تدعم جميع متغيرات Gemma 4 الإدخال متعدد الأنماط: يمكن تمرير النص والصور في طلب واحد. هذا يتيح التطبيقات في تحليل المستندات وQA البصري ومعالجة لقطات الشاشة والأنابيب المختلطة حيث يجب معالجة أنواع بيانات مختلفة في نقل واحد.
يسمح التفكير المدمج للنموذج باتخاذ خطوات وسيطة قبل تقديم الإجابة النهائية. هذا ملحوظ بشكل خاص في المهام الرياضية والمنطقية والمتعددة الخطوات المعقدة — تتحسن الدقة بدون هندسة موجهة إضافية.
يوفر استدعاء الدالة الأصلي التكامل المباشر مع أنظمة الوكلاء والأدوات الخارجية. لا يحتاج المطورون إلى اختراع حلول بديلة من خلال تنسيق الإخراج — النموذج يستدعي الدوال بشكل أصلي.
لماذا يهم MoE عملياً
Mixture-of-Experts هي طريقة حقيقية لتقليل تكاليف الاستدلال. لكل طلب، يتم تفعيل مجموعة فقط من كتل "الخبراء" المتخصصة، وليس الشبكة العصبية بأكملها. الحمل الحسابي يشبه نموذجاً صغيراً، والجودة تشبه نموذجاً كبيراً. بالنسبة إلى Gemma 4 26B-A4B يعني هذا: على الرغم من 26 مليار معامل، يعمل الاستدلال بفعالية مع 4 مليارات. في سيناريوهات الإنتاجية العالية حيث يهم سعر كل رمز، هذه ميزة كبيرة على النماذج الكثيفة المكافئة.
"تم تصميم العائلة مع التركيز على مجموعة واسعة من سيناريوهات النشر"، —
Google DeepMind في وصف بنية Gemma 4.
ما يعنيه هذا
يقلل وضع Gemma 4 على Amazon Bedrock من حاجز الدخول للشركات في نظام AWS البيئي: بدلاً من نشر الأوزان المفتوحة بنفسك — API جاهز مع بنية أساسية مدارة. لا تقيد Apache 2.0 أيضاً التوسع، مما يجعل العائلة جذابة لفرق المنتج التي تقدر القابلية للتنبؤ في شروط الترخيص.
هل تحتاج إلى ذكاء اصطناعي يعمل داخل شركتك — وليس فقط في موجز الأخبار؟
أبني ذكاءً اصطناعياً جاهزاً للإنتاج للشركات — أنظمة CRM مخصّصة، أدوات داخلية، وكلاء مستقلون، أتمتة سير العمل. ملك لك، مصمّم وفق عمليتك، دون رسوم لكل مستخدم. من إعداد جمال خميدون، مدير المنتجات في AlpinaGPT (منصة ذكاء اصطناعي، أكثر من 6000 مستخدم).
أهم ما في عالم الذكاء الاصطناعي — مرة كل أسبوع
سبع قصص مهمة فعلاً هذا الأسبوع، مختارة بعناية. بلا ضجيج ولا بيانات صحفية.
تم! تحقق من بريدك للتأكيد.