MarkTechPost→ المصدر

Google Gemma 4 و NVIDIA و OpenClaw: وكلاء ذكاء اصطناعي محلية بدون رسوم لكل رمز

تروج Google و NVIDIA لـ Gemma 4 كأساس لوكلاء الذكاء الاصطناعي المحليين. يمكن تشغيل النماذج على Jetson Orin Nano وأجهزة كمبيوتر RTX و DGX Spark، والتكامل مع…

معالج بواسطة الذكاء الاصطناعي من MarkTechPost؛ بتحرير Hamidun News
Google Gemma 4 و NVIDIA و OpenClaw: وكلاء ذكاء اصطناعي محلية بدون رسوم لكل رمز
المصدر: MarkTechPost. كولاج: Hamidun News.
◐ استمع للمقال

فكرة هذا المقال بسيطة: إذا كان يجب على وكيل ذكاء اصطناعي أن يعمل بشكل مستمر، ويرى الشاشة، ويقرأ الملفات المحلية، ويعالج الوثائق، وينفذ الإجراءات في الخلفية، فإن نموذجاً يتم فرض رسوم عليه لكل رمز عبر واجهة برمجة تطبيقات سحابية يصبح بسرعة كبيرة خدمة مكلفة. توفر Google و NVIDIA وأنظمة OpenClaw البيئية طريقاً مختلفاً - احتفظ بالنموذج بالقرب من البيانات، قم بتشغيله على الأجهزة المحلية، وبالتالي احذف ليس فقط التأخير، بل أيضاً منطق "الدفع مقابل كل خطوة" في عمل الوكيل نفسه. تشير "ضريبة الرموز" هنا ليس إلى تكاليف الدردشة الآلية لمرة واحدة، بل إلى التأثير التراكمي للمساعدات التي تعمل طوال الوقت.

تقرأ هذه الأنظمة السياق باستمرار: المراسلات، نوافذ التطبيقات، الأكواد، الوثائق، التقويم، المجلدات، والإخطارات. إذا تم إرسال كل ملاحظة، وكل استدلال وسيط، وكل إجراء عبر نموذج سحابي، يصبح التكلفة غير متوقعة بسرعة. بالنسبة للمساعد الشخصي، يؤثر هذا على الميزانية؛ بالنسبة لسيناريو المؤسسات، يضيف مخاوف الخصوصية: يجب إرسال البيانات الحساسة بانتظام للخارج.

لهذا السبب، يعتبر التنفيذ المحلي مهماً هنا ليس كأيديولوجية، بل كضرورة اقتصادية وتشغيلية. في هذا المخطط، يلعب Google Gemma 4، الذي تم الكشف عنه في 2 أبريل 2026، دوراً رئيسياً. أطلقت Google أربع متغيرات: E2B و E4B و 26B و 31B.

تم تصميم النماذج الأصغر للأجهزة الطرفية والسيناريوهات المحمولة، والأكبر حجماً للاستدلال والأكواد وسير عمل الوكلاء على محطات العمل، و 26B يستخدم بنية Mixture of Experts وينشط فقط 3.8 مليار معامل أثناء الاستدلال. يتمتع Gemma 4 بدعم أصلي استدعاء الدوال، ومخرجات JSON منظمة، وتعليمات النظام - كل ما يلزم لوكيل موثوق يستخدم الأدوات.

تعمل جميع النماذج مع الصور والفيديو، بينما يدعم E2B و E4B أيضاً إدخال الصوت الأصلي. تصل نوافذ السياق إلى 128K رمز للنماذج الطرفية و 256K للنماذج الأكبر. وفقاً لـ Google اعتباراً من 2 أبريل 2026، احتلت نسخة 31B المركز الثالث بين النماذج المفتوحة في Arena AI، واحتل 26B المركز السادس، مع تأكيد الشركة أن السطر يتفوق على النماذج الأكبر حجماً بشكل كبير.

من المهم أيضاً أن يتم توزيع Gemma 4 بموجب ترخيص Apache 2.0، وقد تجمع عائلة Gemma بأكثر من 400 مليون تنزيل وأكثر من 100 ألف متغير في النظام البيئي في وقت الإطلاق. يتعلق الجزء الثاني من القصة بالأجهزة وكومة التشغيل.

تروج NVIDIA لـ Gemma 4 كمجموعة نماذج تتسع من Jetson Orin Nano إلى GeForce RTX و RTX Pro و DGX Spark بدون تغيير تقريباً في النهج. للسيناريوهات الطرفية، يدعم Jetson Orin Nano E2B و E4B، مما يسمح ببناء أنظمة بصرية وصوتية مستقلة بتأخير منخفض مباشرة على الجهاز. بالنسبة لمحطات العمل المحلية والمساعدات الشخصية، ينتقل التركيز إلى 26B و 31B، والتي يمكن تشغيلها عبر Ollama و llama.

cpp و vLLM و Unsloth. DGX Spark مهم بشكل خاص هنا: تؤكد NVIDIA بشكل خاص على التكوين مع Superchip GB10 Grace Blackwell و 128 جيجابايت من الذاكرة الموحدة كنقطة دخول مريحة للنماذج الأولية المحلية والضبط الدقيق وتشغيل النماذج الكبيرة بدون السحابة. في هذا الوضع، يتحول OpenClaw من "غلاف فوق واجهة برمجة تطبيقات بعيدة" إلى وكيل محلي حقيقي يأخذ السياق من الملفات والتطبيقات وسير العمل مباشرة على جهاز المستخدم.

في الواقع، يجعل OpenClaw هذه القصة مفهومة على المستوى العملي. إنه وكيل محلي أولاً يمكن أن يعيش على الكمبيوتر بشكل دائم، والاتصال بالرسائل، وتذكر حالة المهام واستدعاء الأدوات. بالنسبة له، النموذج المحلي ليس مكافأة لطيفة بل شرط أساسي للاقتصاد الطبيعي.

إذا كان على وكيل قضاء اليوم كله في قراءة قاعدة الأكواد، وتتبع المشاريع، والرد في الدردشات، أو معالجة المستندات المالية، فإن فرض الرسوم على الرموز في السحابة يصبح القيد الأساسي. في الوقت نفسه، لا تحل الحليّة نفسها مسألة الأمان: الوكيل الذي يمكنه الوصول إلى الملفات والشبكات والحسابات يبقى كياناً محفوفاً بالمخاطر. لهذا السبب، تدفع NVIDIA في نفس الوقت NemoClaw - مكدس مفتوح مع OpenShell والحماية القائمة على السياسة التي يجب أن تقيد سلوك الوكلاء الذين يعملون طوال الوقت، وتعزل التنفيذ، وتحتفظ بالبيانات الحساسة داخل المحيط المحلي.

من الناحية العملية، هذا يعني تحولاً في نموذج استهلاك الذكاء الاصطناعي نفسه. لا يتعلق الأمر فقط بمدى ذكاء النموذج في الاختبارات، بل بما إذا كان يمكنك إبقاؤه يعمل طوال اليوم دون القلق بشأن التكلفة والتأخير وتسرب البيانات. يوضح الجمع بين Gemma 4 و NVIDIA RTX أو DGX Spark و OpenClaw أن السوق يتحرك نحو وكلاء شخصيين وموجهين للمؤسسات يعملون بالقرب من البيانات وبالقرب من المستخدم.

لن تختفي السحابة، لكن بالنسبة للمساعدات التي تعمل طوال الوقت والأكواد المحلية والعمليات الموثقة والروبوتات والملفات الحساسة، يتوقف الاستدلال المحلي عن كونه خياراً متخصصاً ويصبح البنية الأساسية.

ZK
Hamidun News
أخبار الذكاء الاصطناعي بدون ضوضاء. اختيار تحريري يومي من أكثر من 400 مصدر. منتج من جمال حميدون، رئيس الذكاء الاصطناعي في Alpina Digital.

هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟

AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.

ما رأيك؟
جارٍ تحميل التعليقات…