Google DeepMind Gemma 4 появились на Amazon Bedrock: три модели с MoE и мультимодальностью

На Amazon Bedrock появились три модели Gemma 4 от Google DeepMind: Gemma 4 31B, Gemma 4 26B-A4B (MoE) и Gemma 4 E2B. Все распространяются под Apache 2.0 и…

هيئة تحرير Hamidun News

رصد الذكاء الاصطناعي · AWS Machine Learning Blog

30 يونيو 2026· 2 د

معالج بواسطة الذكاء الاصطناعي من AWS Machine Learning Blog؛ بتحرير Hamidun News

Google DeepMind Gemma 4 появились на Amazon Bedrock: три модели с MoE и мультимодальностью — المصدر: AWS Machine Learning Blog. كولاج: Hamidun News.

◐ استمع للمقال

أضافت Amazon Bedrock ثلاث نماذج من عائلة Gemma 4 التي طورها Google DeepMind إلى كتالوجها — بأوزان مفتوحة ودعم إدخال متعدد الأنماط وبنية MoE. تتوفر النماذج عبر AWS API فوراً بعد الإعلان.

ثلاثة خيارات لمهام مختلفة

تم بناء Gemma 4 مع التركيز على الذكاء لكل معامل — الحد الأقصى من الكفاءة مع الحد الأدنى من المتطلبات الحسابية. تغطي العائلة نهجين معماريين: نماذج كثيفة وMoE، حيث يتم تفعيل جزء فقط من الشبكة العصبية لكل طلب. ثلاثة متغيرات instruction-tuned متاحة على Amazon Bedrock:

Gemma 4 31B — نموذج كثيف كلاسيكي مع 31 مليار معامل، يمكن التنبؤ بسلوكه ومناسب للضبط الدقيق
Gemma 4 26B-A4B — بنية MoE: 26B معامل في النموذج، لكن تم تفعيل 4B فقط لكل طلب
Gemma 4 E2B — متغير خفيف الوزن للبيئات الحدية والموارد المحدودة

يتم توزيع الثلاثة جميعاً بموجب ترخيص Apache 2.0 — الاستخدام التجاري بدون قيود على الحجم أو عدد الطلبات.

ما الذي يمكن للنماذج القيام به مباشرة

تدعم جميع متغيرات Gemma 4 الإدخال متعدد الأنماط: يمكن تمرير النص والصور في طلب واحد. هذا يتيح التطبيقات في تحليل المستندات وQA البصري ومعالجة لقطات الشاشة والأنابيب المختلطة حيث يجب معالجة أنواع بيانات مختلفة في نقل واحد.

يسمح التفكير المدمج للنموذج باتخاذ خطوات وسيطة قبل تقديم الإجابة النهائية. هذا ملحوظ بشكل خاص في المهام الرياضية والمنطقية والمتعددة الخطوات المعقدة — تتحسن الدقة بدون هندسة موجهة إضافية.

يوفر استدعاء الدالة الأصلي التكامل المباشر مع أنظمة الوكلاء والأدوات الخارجية. لا يحتاج المطورون إلى اختراع حلول بديلة من خلال تنسيق الإخراج — النموذج يستدعي الدوال بشكل أصلي.

لماذا يهم MoE عملياً

Mixture-of-Experts هي طريقة حقيقية لتقليل تكاليف الاستدلال. لكل طلب، يتم تفعيل مجموعة فقط من كتل "الخبراء" المتخصصة، وليس الشبكة العصبية بأكملها. الحمل الحسابي يشبه نموذجاً صغيراً، والجودة تشبه نموذجاً كبيراً. بالنسبة إلى Gemma 4 26B-A4B يعني هذا: على الرغم من 26 مليار معامل، يعمل الاستدلال بفعالية مع 4 مليارات. في سيناريوهات الإنتاجية العالية حيث يهم سعر كل رمز، هذه ميزة كبيرة على النماذج الكثيفة المكافئة.

"تم تصميم العائلة مع التركيز على مجموعة واسعة من سيناريوهات النشر"، —

Google DeepMind في وصف بنية Gemma 4.

ما يعنيه هذا

يقلل وضع Gemma 4 على Amazon Bedrock من حاجز الدخول للشركات في نظام AWS البيئي: بدلاً من نشر الأوزان المفتوحة بنفسك — API جاهز مع بنية أساسية مدارة. لا تقيد Apache 2.0 أيضاً التوسع، مما يجعل العائلة جذابة لفرق المنتج التي تقدر القابلية للتنبؤ في شروط الترخيص.

Hamidun News

أخبار الذكاء الاصطناعي بدون ضوضاء. اختيار تحريري يومي من أكثر من 400 مصدر. منتج من جمال حميدون، رئيس الذكاء الاصطناعي في Alpina Digital.

قناة Telegram RSS hamidun.com

هل تحتاج إلى ذكاء اصطناعي يعمل داخل شركتك — وليس فقط في موجز الأخبار؟

أبني ذكاءً اصطناعياً جاهزاً للإنتاج للشركات — أنظمة CRM مخصّصة، أدوات داخلية، وكلاء مستقلون، أتمتة سير العمل. ملك لك، مصمّم وفق عمليتك، دون رسوم لكل مستخدم. من إعداد جمال خميدون، مدير المنتجات في AlpinaGPT (منصة ذكاء اصطناعي، أكثر من 6000 مستخدم).

احجز استشارة مجانية →