أطلقت NVIDIA Polar - إطار عمل لتدريب وكلاء الكود

Q: ما هو المصدر؟

نُشر أصلاً على MarkTechPost. يعالج Hamidun News المواد ويكيّفها بالذكاء الاصطناعي.

Q: متى نُشر؟

29 مايو 2026. وقت القراءة: 3 دقيقة.

أطلقت NVIDIA Polar - إطار عمل لتدريب agents الذكاء الاصطناعي التي تحل مشاكل الكود. يعمل كوسيط بين النموذج والنظام، دون الحاجة إلى تعديل أي منهما. استناداً…

هيئة تحرير Hamidun News

رصد الذكاء الاصطناعي · MarkTechPost

29 مايو 2026· 2 د

معالج بواسطة الذكاء الاصطناعي من MarkTechPost؛ بتحرير Hamidun News

أطلقت NVIDIA Polar - إطار عمل لتدريب وكلاء الكود — المصدر: MarkTechPost. كولاج: Hamidun News.

◐ استمع للمقال

قدمت NVIDIA Polar - إطار عمل جديد لتدريب agents اللغة باستخدام التعلم المعزز. الميزة أنه يعمل بدون تعديل أنظمة agents الموجودة، مما يجعله حلاً عالمياً لبيئات وبنى تحتية مختلفة.

كيف يعمل Polar

واحدة من أكبر التحديات في تدريب agents الذكاء الاصطناعي هي عدم التوافق بين خط أنابيب التدريب وأنظمة الإنتاج. غالباً ما يتعين الاختيار بين: إما تعديل النظام لمتطلبات التدريب، أو فقدان الوصول إلى أفضل طرق التعلم المعزز. يحل Polar هذه المشكلة بأناقة.

يعمل الإطار كوسيط API بين النظام وخادم الاستدلال. يلتقط جميع التفاعلات على مستوى الرموز ويعيد بناء المسارات منها، جاهزة تماماً للتدريب عبر GRPO. هذا يسمح باستخدام أحدث طرق التدريب مباشرة مع البيئات الموجودة مثل Codex و Claude Code و Pi، دون تعديل سطر واحد في أكوادها.

النتائج على SWE-Bench Verified

اختبر باحثو NVIDIA نموذج Polar استناداً إلى Qwen3.5-4B - نموذج مضغوط بـ 4 مليارات معامل. هذا نموذج صغير عن قصد لإظهار أن التحسين يعمل ليس فقط للنماذج اللغوية الكبيرة جداً، بل أيضاً للحلول الفعالة للموارد.

النتائج مثيرة للإعجاب:

تحت نظام Codex: +22.6 نقطة على SWE-Bench Verified pass@1
تحت نظام Claude Code: +4.8 نقاط
تحت نظام Pi: +6.2 نقاط

للسياق: SWE-Bench Verified - هو معيار قياسي يقيس مدى جودة أداء agent في حل مشاكل الترميز الحقيقية من طلبات السحب المفتوحة. هذا ليس اختباراً اصطناعياً بل كود حقيقي. القفزة بمقدار 22.6 نقطة تحت نظام Codex تمثل تحسناً كبيراً، خاصة بالنسبة لنموذج مضغوط.

التكامل مع النظام البيئي لـ NVIDIA

تم تسجيل الإطار كبيئة NeMo Gym، مما يسمح باستخدامه في النظام البيئي القياسي لـ NVIDIA. هذه خطوة مهمة لأنها تجعل Polar ليس مجرد أداة لمرة واحدة، بل جزءاً من منصة كبيرة.

تم نشر الكود في مستودع ProRL Agent Server تحت رخصة مفتوحة. هذا يعني أن أي مطور يمكنه الحصول على Polar وتثبيته وتدريب نموذجه على بيانته الخاصة باستخدام أجهزته الخاصة.

"هذا يدل على أن التدريب الفعال للوكلاء لا يتطلب تغيير بنية الإنتاج الأساسية".

ماذا يعني هذا

بالنسبة للمطورين والشركات، يفتح هذا مساراً عملياً لتحسين agents الذكاء الاصطناعي الخاصة بهم بسرعة دون إعادة بناء البنية الأساسية بأكملها. تُظهر NVIDIA أن حتى النماذج الصغيرة يمكن أن تتحسن بشكل كبير من خلال طريقة التدريب الصحيحة. هذا حاسم لنشر التطبيقات على أجهزة الحافة ولتوفير عام موارد الحوسبة.

Hamidun News

أخبار الذكاء الاصطناعي بدون ضوضاء. اختيار تحريري يومي من أكثر من 400 مصدر. منتج من جمال حميدون، رئيس الذكاء الاصطناعي في Alpina Digital.

قناة Telegram RSS hamidun.com

هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟

AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.

🎓 Academy — 7 أيام مجاناً استشارة مجانية