Composer 2.5 من Cursor: تم تدريب وكيل الكود على العمل بشكل أفضل مع المهام طويلة الأمد
حدثت Cursor برنامج Composer 2.5 - وكيل الكود في بيئة التطوير المتكاملة. يعمل الآن بشكل أفضل مع المهام طويلة الأمد. الجزء الرئيسي: تم التدريب باستخدام طريقة تغذي
معالج بواسطة الذكاء الاصطناعي من Cursor Blog؛ بتحرير Hamidun News
أطلقت Cursor برنامج Composer 2.5 - تحديث وكيل الذكاء الاصطناعي الخاص بها للعمل مع الكود في بيئة التطوير المتكاملة. هذا قفزة كبيرة في القدرات الذهنية والسلوك مقارنة بالإصدار 2.
ما الذي تغير
يتعامل Composer 2.5 بشكل أفضل مع المهام طويلة الأمد، ويتبع التعليمات المعقدة بدقة أكبر، ويوفر تجربة عمل أكثر متعة. حسّن فريق Cursor النموذج من خلال زيادة حجم التدريب، وإنشاء بيئات تدريب معزز أكثر تعقيداً، وتطبيق طرق جديدة. لا تظهر جميع التحسينات في الاختبارات والمعايير. القياسات المهمة هي أسلوب التواصل والقدرة على معايرة الجهود. هذه الجوانب بالذات هي التي تجعل النموذج أكثر عملية في العمل الفعلي.
التغذية الراجعة الموجهة
الابتكار الرئيسي هو طريقة تدريب جديدة بتغذية راجعة نصية. المشكلة: عندما تأتي إشارة التعلم المعزز (RL) للتسلسل متعدد الخطوات بالكامل (مئات الآلاف من الرموز)، يصعب على النموذج فهم الحل الذي أدى إلى الخطأ. النتيجة النهائية - إشارة محتشة. الحل: إدراج تلميح في لحظة الخطأ بالضبط. على سبيل المثال، إذا حاول النموذج استدعاء أداة غير موجودة، يتم إضافة تلميح للسياق مثل 'الأدوات المتاحة: [القائمة]'. هذا يساعد النموذج على التصحيح فوراً وعدم تكرار الخطأ في المرة التالية.
'هذا يمنح النموذج إشارة تعليمية محلية للسلوك الذي نريد تغييره، مع
الحفاظ على مهمة التعلم المعزز الأوسع على كامل المسار.'
البيانات الاصطناعية والتوسع
- تم تدريب Composer 2.5 على كمية أكبر 25 مرة من المهام الاصطناعية
- يتم إنشاء المهام بشكل ديناميكي أثناء عملية التدريب
- يتم استخدام نهج حذف الميزات من قواعد الكود الحقيقية
- يختار النظام المهام المعقدة مباشرة أثناء تشغيل التدريب
أثناء التدريب، تنمو قدرة Composer على الترميز بشكل كبير بحيث تبدأ في حل معظم المهام. لمتابعة نمو الذكاء، يختار الفريق مهاماً أكثر تعقيداً ويخلقها بشكل ديناميكي طوال التشغيل.
الخطوات التالية
أساس Composer 2.5 هو نقطة تفتيش مفتوحة من Kimi K2.5 من Moonshot. لكن هذه خطوة انتقالية. بالتعاون مع SpaceX، تقوم Cursor بتدريب نموذج أكبر بكثير من الصفر، باستخدام 10 أضعاف حجم الحسابات. يمتلك Colossus 2 مليون معالج بمعادل H100. تتوقع Cursor أن يشكل النموذج الجديد قفزة ضخمة في القدرات.
ماذا يعني هذا
دخلت عملية توليد الأكواد مستوى جديداً. أصبحت الوكلاء ليسوا مجرد أدوات مساعدة، بل مساعدين كاملين في المشاريع طويلة الأمد. هذا يقرب اللحظة التي يمكن فيها للذكاء الاصطناعي قيادة تطوير المشروع بشكل مستقل تقريباً.
هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟
AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.