Cursor Blog→ المصدر

Composer autoinstall: كيف تساعد الإصدارات الأقدم في تدريب الإصدارات الجديدة

طوّرت Cursor نظام Composer autoinstall، وهو نظام تُعدّ فيه الإصدارات الأقدم من النموذج البيئات تلقائيًا لتدريب الإصدارات الأحدث. وخلال تدريب Composer 2، استُخدم

Composer autoinstall: كيف تساعد الإصدارات الأقدم في تدريب الإصدارات الجديدة
المصدر: Cursor Blog. كولاج: Hamidun News.
◐ استمع للمقال

قدّم Cursor نظام Composer autoinstall — وهو نظام يستخدم الإصدارات الأقدم من نموذج Composer لتحضير البيئات تلقائياً لتدريب التعلم بالتعزيز. أثناء تطوير Composer 2، استخدمت الفريق الإصدار 1.5 لإدارة هذه العملية. الفكرة مستندة على تجربة Cursor cloud agents، لكنها تُطبّق على تدريب RL للنماذج ذاتها.

لماذا تقتل البيئات المكسورة التعلم

يتطلب تدريب RL بيئات عاملة. إذا لم يتم ترجمة المشروع، أو لم تُثبَّت المتعلقات، أو رفضت الإعدادات التشغيل، يهدر النموذج الرموز على تصحيح الأخطاء بدلاً من تعلم حل مشاكل البرمجة الحقيقية. في أسوأ الحالات، تجعل البيئة المكسورة المهمة غير قابلة للحل تماماً — لا يتلقى النموذج أي إشارة مكافأة وينفق الحسابات بلا جدوى. هذا مكلف وغير فعال.

عملية الإقلاع ذات المرحلتين

يعمل Autoinstall من خلال مخطط بسيط لكن عبقري. المرحلة 1: وكيل الاستطلاع يحدد الهدف. يتم إعطاء الإصدار الأول من النموذج (Composer 1.

5) مستودعاً في حالة ثابتة. يجب أن يقترح 10 أوامر وصفاً عالي المستوى لناتجها إذا تم تكوين البيئة بشكل صحيح. يدرس النموذج README و Makefile، ويحاول الأوامر الخاصة باللغة (`uv`، `npm install`، `clippy`، `pytest`)، ويستكشف هيكل المشروع.

النتيجة قائمة بأوامر الإعداد والاختبارات وملفات التشغيل. المرحلة 2: الوكيل الثاني ينفذها. يتلقى الإصدار الثاني (Composer 2) الحالة الأولية للمشروع بالإضافة إلى ثلاث أوامر مستهدفة مختارة من العشر المقترحة.

تتمثل مهمته في استدعاء الأدوات (البحث والترجمة والفحص)، واستكشاف الكود، وتكوين البيئة بحيث تعمل الأوامر الثلاثة والمخرجات تتطابق مع وصف المرحلة 1. إذا لم تتطابق — تكرر العملية. بعد خمس محاولات فاشلة، يتم رفض البيئة.

  • يستكشف النموذج الكود وينفذ أدوات البحث
  • يثبت المتعلقات من خلال مدير الحزم
  • ينفذ التكوين (الإعدادات ومتغيرات البيئة)
  • يتحقق من المخرجات مقابل الوصف المستهدف
  • يكرر حتى النجاح أو حد المحاولات

كيف يتغلب النموذج على المكونات المفقودة

Composer على استعداد للذهاب بعيداً لتحقيق بيئة عاملة. يحاكي النموذج الملفات المفقودة، وينشئ نعوتاً للصور، حتى جداول وهمية في قواعد البيانات. إذا احتاج المشروع إلى خدمات سحابية مثل S3 أو حاويات sidecar، ينشئ Composer نظائرها — تكوينات MinIO لـ S3، حاويات Docker للخدمات. بالنسبة للعمليات طويلة الأمد، ينشئ النظام نص بدء يطلق هذه المكونات في بداية جلسة RL.

"ستبذل نماذج اللغة الحديثة جهوداً كبيرة لتكوين البيئة بنجاح ومحاكاة المتعلقات والتحقق من عمل الإعداد"، كما تقول فريق

Cursor.

ما يعنيه هذا للمستقبل

الفكرة بسيطة، لكنها تحمل أهمية هائلة. يستخدم Composer إصداره الأقدم الخاص به كمساعد لتحضير الأساس الوظيفي للإصدار الجديد. هذا لا يوفر الحسابات فحسب، بل يحسّن أيضاً الإشارة للتعلم بالتعزيز. كل إصدار جديد من النموذج يقف الآن على أكتاف سابقيه. من المنطقي الافتراض بأنه في المستقبل، سيصبح مثل هذا الإقلاع معياراً في تدريب نماذج اللغة الكبيرة.

ZK
Hamidun News
أخبار الذكاء الاصطناعي بدون ضوضاء. اختيار تحريري يومي من أكثر من 400 مصدر. منتج من جمال حميدون، رئيس الذكاء الاصطناعي في Alpina Digital.
ما رأيك؟
جارٍ تحميل التعليقات…