أطلقت NVIDIA Polar - إطار عمل لتدريب وكلاء الكود
أطلقت NVIDIA Polar - إطار عمل لتدريب agents الذكاء الاصطناعي التي تحل مشاكل الكود. يعمل كوسيط بين النموذج والنظام، دون الحاجة إلى تعديل أي منهما. استناداً…
معالج بواسطة الذكاء الاصطناعي من MarkTechPost؛ بتحرير Hamidun News
قدمت NVIDIA Polar - إطار عمل جديد لتدريب agents اللغة باستخدام التعلم المعزز. الميزة أنه يعمل بدون تعديل أنظمة agents الموجودة، مما يجعله حلاً عالمياً لبيئات وبنى تحتية مختلفة.
كيف يعمل Polar
واحدة من أكبر التحديات في تدريب agents الذكاء الاصطناعي هي عدم التوافق بين خط أنابيب التدريب وأنظمة الإنتاج. غالباً ما يتعين الاختيار بين: إما تعديل النظام لمتطلبات التدريب، أو فقدان الوصول إلى أفضل طرق التعلم المعزز. يحل Polar هذه المشكلة بأناقة.
يعمل الإطار كوسيط API بين النظام وخادم الاستدلال. يلتقط جميع التفاعلات على مستوى الرموز ويعيد بناء المسارات منها، جاهزة تماماً للتدريب عبر GRPO. هذا يسمح باستخدام أحدث طرق التدريب مباشرة مع البيئات الموجودة مثل Codex و Claude Code و Pi، دون تعديل سطر واحد في أكوادها.
النتائج على SWE-Bench Verified
اختبر باحثو NVIDIA نموذج Polar استناداً إلى Qwen3.5-4B - نموذج مضغوط بـ 4 مليارات معامل. هذا نموذج صغير عن قصد لإظهار أن التحسين يعمل ليس فقط للنماذج اللغوية الكبيرة جداً، بل أيضاً للحلول الفعالة للموارد.
النتائج مثيرة للإعجاب:
- تحت نظام Codex: +22.6 نقطة على SWE-Bench Verified pass@1
- تحت نظام Claude Code: +4.8 نقاط
- تحت نظام Pi: +6.2 نقاط
للسياق: SWE-Bench Verified - هو معيار قياسي يقيس مدى جودة أداء agent في حل مشاكل الترميز الحقيقية من طلبات السحب المفتوحة. هذا ليس اختباراً اصطناعياً بل كود حقيقي. القفزة بمقدار 22.6 نقطة تحت نظام Codex تمثل تحسناً كبيراً، خاصة بالنسبة لنموذج مضغوط.
التكامل مع النظام البيئي لـ NVIDIA
تم تسجيل الإطار كبيئة NeMo Gym، مما يسمح باستخدامه في النظام البيئي القياسي لـ NVIDIA. هذه خطوة مهمة لأنها تجعل Polar ليس مجرد أداة لمرة واحدة، بل جزءاً من منصة كبيرة.
تم نشر الكود في مستودع ProRL Agent Server تحت رخصة مفتوحة. هذا يعني أن أي مطور يمكنه الحصول على Polar وتثبيته وتدريب نموذجه على بيانته الخاصة باستخدام أجهزته الخاصة.
"هذا يدل على أن التدريب الفعال للوكلاء لا يتطلب تغيير بنية الإنتاج الأساسية".
ماذا يعني هذا
بالنسبة للمطورين والشركات، يفتح هذا مساراً عملياً لتحسين agents الذكاء الاصطناعي الخاصة بهم بسرعة دون إعادة بناء البنية الأساسية بأكملها. تُظهر NVIDIA أن حتى النماذج الصغيرة يمكن أن تتحسن بشكل كبير من خلال طريقة التدريب الصحيحة. هذا حاسم لنشر التطبيقات على أجهزة الحافة ولتوفير عام موارد الحوسبة.
هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟
AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.