Google Gemma 4 و Qwen 3.6 يتصدران قائمة أفضل النماذج المحلية للاستخدام المنزلي في 2026

Q: ما هو المصدر؟

نُشر أصلاً على Habr AI. يعالج Hamidun News المواد ويكيّفها بالذكاء الاصطناعي.

Q: متى نُشر؟

29 أبريل 2026. وقت القراءة: 3 دقيقة.

يمكن الآن تشغيل الشبكات العصبية المحلية بدون خادم مخصص: RTX 3060 و 32 GB من الذاكرة و SSD NVMe كافية لمساعد منزلي مفيد. في الأعلى — Gemma 4 و Qwen 3.6 و…

هيئة تحرير Hamidun News

رصد الذكاء الاصطناعي · Habr AI

29 أبريل 2026· 3 د

معالج بواسطة الذكاء الاصطناعي من Habr AI؛ بتحرير Hamidun News

Google Gemma 4 و Qwen 3.6 يتصدران قائمة أفضل النماذج المحلية للاستخدام المنزلي في 2026 — المصدر: Habr AI. كولاج: Hamidun News.

◐ استمع للمقال

الشبكات العصبية المحلية في عام 2026 لم تعد لعبة للمتحمسين الذين يمتلكون خوادم مكلفة. وفقًا لموقع Habr AI، حتى الجمع بين RTX 3060 و32 غيغابايت من الذاكرة العشوائية و NVMe SSD يسمح بإنشاء مساعد منزلي مفيد للنصوص والأكواد والمستندات وحتى نسخ الصوت.

الأجهزة أهم من الضجيج الإعلامي

الاستنتاج الرئيسي للمراجعة بسيط: في الذكاء الاصطناعي المنزلي، لا يتم التحديد من خلال جيل وحدة معالجة الرسومات، بل من خلال حجم الذاكرة. يمكن لوحدة المعالجة المركزية تشغيل نموذج صغير، لكن السرعة ستكون بضعة رموز في الثانية. على وحدة معالجة الرسومات، يتسارع النموذج نفسه عدة مرات، وأحيانًا بمقدار رتبة من حيث الحجم. يؤكد المؤلف بشكل خاص أن RTX 3090 القديمة بسعة 24 غيغابايت من الذاكرة تظل أكثر جاذبية من العديد من البطاقات الأحدث إذا كنا نتحدث تحديدًا عن الاستدلال المحلي وليس الألعاب.

"إذا كان النموذج مناسبًا في VRAM — يطير." إذا لم تناسب الأوزان في

ذاكرة الفيديو وانتقلت جزء من الطبقات إلى RAM عادية، يمكن أن ينخفض الأداء 50-100 مرة. لهذا السبب فإن اختيار الأجهزة هنا أقل توجهاً نحو "التسويق" بكثير مما هو عليه في الألعاب.

بالنسبة لأجهزة Windows الشخصية ومحطات العمل Linux، فإن نقطة الدخول المثالية هي RTX 3060 بسعة 12 غيغابايت أو 4060 Ti بسعة 16 غيغابايت، وللنماذج الأثقل — RTX 3090 أو 4090. يظل Apple Silicon أيضًا خيارًا بفضل الذاكرة الموحدة، لكنه يخسر أمام NVIDIA المنفصلة من حيث سرعة الإخراج.

8-12 غيغابايت VRAM كافية للنماذج 7B-14B وبعض المتغيرات المتعددة الوسائط المدمجة
16 غيغابايت VRAM تتسع بشكل ملحوظ للاختيار، بما في ذلك بعض نماذج MoE
32 غيغابايت RAM — الحد الأدنى العملي إذا كنت لا تريد الاصطدام بحدود ذاكرة النظام
NVMe SSD إلزامي: نقاط التفتيش تزن من عدة إلى عشرات الغيغابايتات

أي النماذج تتصدر

أصبح Gemma 4 من Google النجم المركزي للاختيار، الذي تم إطلاقه في 2 أبريل 2026. تبرز بشكل خاص نسخة 26B MoE: مع التكمية Q4، فهي تناسب حوالي 14 غيغابايت VRAM، لكن من حيث جودة التفكير، تكون أقرب إلى نماذج أكبر بكثير. بالإضافة إلى ذلك، فإن الخط كله متعدد الوسائط، والإصدارات الأصغر يمكنها التعامل مع الصوت. بالنسبة لمستخدمي المنزل، هذا مزيج نادر: متطلبات النظام الكافية، مستوى تفكير جيد ودعم الوسائط في نموذج واحد.

بالنسبة للمطورين، يوصي المؤلف بشكل خاص بـ Qwen 3.6 35B-A3B. بفضل معمارية MoE وتخطيط الطبقات المحدد، تمكنوا من تشغيلها على RTX 4070 بسعة 12 غيغابايت و32 غيغابايت من الذاكرة العشوائية، مع الاحتفاظ بجزء من الأوزان الثقيلة في RAM. في هذا الوضع، يعرض النموذج حوالي 42 رمز في الثانية ويظل قويًا بشكل خاص في البرمجة. إذا كنت بحاجة إلى حل أكثر عمومية في 8 غيغابايت VRAM، تمدح المقالة Qwen 3.5 9B: فهي تتمتع بسياق طويل، وتعدد الوسائط واستهلاك ثابت تقريبًا من الذاكرة بفضل Gated DeltaNet، وهو مفيد لملفات PDF الطويلة والملاحظات والتحليل البصري.

أصبح الفائزون في مجالات متخصصة منفصلة gpt-oss-20b كأقرب خيار إلى "ChatGPT محلي"، و Whisper كبديل عملي تقريبًا كامل لنسخ الصوت السحابي، و Phi-4 كنموذج عمل للأجهزة الضعيفة والمهام المنظمة. الفكرة من المراجعة هنا هي أنه لا يوجد نموذج "أفضل" واحد: للأكواد والمستندات والسياق الطويل والصوت والتحليل البصري، يقترح المؤلف خيارات مختلفة، وهذا بحد ذاته يبدو بمثابة أكثر علامات النضج وضوحًا في السوق.

كيفية تشغيل هذا

من حيث الأدوات، تهيمن أربع أغلفة على المراجعة. يُدعى LM Studio بأفضل واجهة مستخدم رسومية بالنسبة لمعظم الحالات: يمكنه إظهار ما إذا كان النموذج مناسبًا للأجهزة، واختيار التكمية ورفع واجهة برمجية متوافقة مع OpenAI محليًا. Ollama — الخيار لأولئك الذين يريدون تشغيل النماذج بأمر واحد وتوصيلها بسرعة بسكريبتاتهم. يتم وضع Jan كبديل محلي لـ ChatGPT بحد أدنى من العوائق، و ChatRTX من Nvidia — كـ RAG جاهز للمستندات الشخصية لأصحاب بطاقات RTX.

يوضح الاختبار العملي لثلاثة نماذج على RTX 3070 بسعة 8 غيغابايتات بشكل جيد كيف تغير السوق. أثبت Qwen 3.5 9B أنه الأفضل في موازنة الجودة ومتطلبات الأجهزة، وأظهر gpt-oss-20b قوة أكثر في الشروحات الهيكلية، و Gemma 4 E4B استطاع تحليل الصور بشكل أفضل. هذا تحول مهم: اختيار نموذج محلي يبدو الآن أقل شبهاً بالعشوائية وأكثر شبهاً بالمحاذاة الهندسية العادية للمهمة.

ماذا يعني هذا

أصبح الذكاء الاصطناعي المحلي في عام 2026 أخيرًا أداة عملية، وليس نادياً لعشاق البناء المخصص. بالنسبة للمستخدمين، يعني هذا المزيد من السيناريوهات غير المتصلة والاعتماد أقل على السحابة، وبالنسبة للشركات — القدرة على إبقاء الأكواد والمستندات والصوت ضمن محيطها الخاص. لكن الدرس الرئيسي من المراجعة مختلف: في المنزل، الفائز ليس النموذج الأحدث، بل الذي يناسب بصدق أجهزتك ويحل مهمتك المحددة.

Hamidun News

أخبار الذكاء الاصطناعي بدون ضوضاء. اختيار تحريري يومي من أكثر من 400 مصدر. منتج من جمال حميدون، رئيس الذكاء الاصطناعي في Alpina Digital.

قناة Telegram RSS hamidun.com

هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟

AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.

🎓 Academy — 7 أيام مجاناً استشارة مجانية