Ralph loop بحسب Huntley: لماذا لا ينبغي الخلط بين نهجي Anthropic وVercel
لم يعد Ralph loop يعني شيئًا واحدًا. في تحليل حديث، يُفكَّك هذا المصطلح إلى خمس معماريات: من دورات Anthropic التي تستخدم prompt نفسه إلى مخططات أكثر صرامة مع…
معالج بواسطة الذكاء الاصطناعي من Habr AI؛ بتحرير Hamidun News
أصبح مصطلح Ralph loop بسرعة مظلة لعمائر وكلاء مختلفة جداً. يُظهر التحليل الأخير أنه تحت اسم واحد اليوم يتم خلط ما لا يقل عن خمسة أنماط — من حلقة إعادة تشغيل نموذج بسيطة إلى أنظمة حيث يغير الوكيل تعليماته وعناصره الخاصة بين التكرارات.
لماذا نشأ النزاع
يبدأ مؤلف المقالة بسؤال بسيط: ما الذي يجب أن يعتبر حلقة Ralph حقيقية. لم يوضح البحث السريع عبر الخيوط العامة وملفات README والمدونات الصورة، بل أضاف المزيد من الالتباس فقط. يسمي البعض Ralph حلقة خارجية بسيطة تقوم بتشغيل نفس الموجه مرة أخرى، بينما يسميها آخرون نظام به مدقق منفصل، والبعض الآخر يسميها وكيل يتطور بشكل ذاتي تقريباً.
نتيجة لذلك، تحت نفس الاسم، بدأ الناس في مناقشة إنشاءات متشابهة في التصميم والمخاطر فقط عن بعد. لإحضار النظام، يقترح المؤلف عدم النظر إلى العلامة التجارية، بل إلى الخصائص المعمارية. الأسئلة الرئيسية هنا هي: أين يقع المدقق، من يعمل كنبي، أين تعيش معايير الإنجاز، وما الذي يتم نقله بالضبط بين المحاولات.
خط منفصل هو الحق في الطفرة: هل يمكن للوكيل فقط تغيير خطة العمل، أم يُسمح له بإعادة كتابة الفحوصات والمواصفات وحتى موجه النظام الخاص به. إن هذا الاختيار بالذات هو الذي يؤثر على أمان النظام بأكمله.
خمس نسخ من Ralph
تقدم المقالة تصنيفاً عملياً لخمسة أنماط تختفي اليوم غالباً تحت اسم Ralph. إنها متشابهة بالفعل على مستوى الواجهة: في كل مكان هناك حلقة، محاولة لمكافحة تدهور السياق، معايير النجاح، وآلية تحقق من نوع ما. لكن بمجرد أن تنظر أعمق، يتضح أنه في بعض الأنظمة يقرر النموذج بنفسه متى يتوقف، بينما في أنظمة أخرى يتم أخذ هذا الحق للخارج، وبين التكرارات لا يتغير فقط الإخراج بل أيضاً العناصر العاملة.
- Ralph نفس-الموجه بروح Anthropic: يتم تشغيل نفس الموجه مراراً وتكراراً حتى يقرر النموذج بنفسه قول DONE، والحلقة الخارجية فقط تلتقط إشارة التوقف.
- Ralph مدقق خارجي بنموذج Vercel: النموذج الخارجي verifyCompletion منفصل بالفعل عن حلقة الأداة الداخلية، لكن المبادرة للخروج من محاولة تبقى مع النموذج نفسه.
- Ralph تطور العناصر بالنسخة الأصلية من Geoffrey Huntley: بين التكرارات، لا تتغير السجلات فقط، بل أيضاً العناصر المفيدة مثل الخطة وقواعد العمل والدروس المتراكمة.
- Ralph تطور العناصر مع مدقق خارجي: نسخة أكثر صرامة حيث تتطور العناصر لكن معايير النجاح ثابتة، ويمكن للتحقق الخارجي أن يلغي التغييرات غير المصرح بها.
- وكيل يتطور بشكل ذاتي: فئة منفصلة تقريباً يمكن لعدة وكلاء فيها تحليل الفشل وإعادة كتابة الموجه وتعديل المحل الحل نفسه تدريجياً.
الخلاصة الأهم من هذا المقياس هي أن execution loop و evolution loop ليسا نفس الشيء. في الحالة الأولى، يقوم الوكيل ببساطة بمحاولات جديدة ضمن القواعد المعطاة. في الحالة الثانية، تتغير القواعد نفسها والعناصر أو حتى بنية الوكيل. لذلك، نفس كلمة Ralph تخفي درجة مختلفة تماماً من الحكم الذاتي والتكلفة والخطر. من الناحية العملية، هذا يغير أيضاً مستوى الثقة في النتيجة.
حيث يكمن الخطر الرئيسي
ينحصر الانتقاد الرئيسي في المقالة إلى ثلاثة أشياء. أولاً، عندما تبدو الحلقة الخارجية خارجية فقط، لكن النبي الحقيقي يبقى داخل النموذج. ثم يقرر الوكيل نفسه أن المهمة مغلقة ويخرج بسهولة مبكراً. ثانياً، انجراف المعايير: إذا سُمح للوكيل بإعادة كتابة معايير القبول أو الخطة أو طبقة التحقق، فيمكنه بدون أن يلاحظ أحد ضبط المهمة على حل مناسب لنفسه. ثالثاً، تراكم سياق القمامة، عندما يحدث كل التطوير في جلسة طويلة واحدة وتنخفض جودة التفكير.
"أي
Ralph بالضبط؟" يقترح المؤلف طرح هذا السؤال أولاً. قبل تشغيل معمارية تشبه Ralph، يجب عليك تحديد من يعلن النجاح، أين تُثبت المعايير فيزيائياً، ما الذي يتطفر بالضبط بين التكرارات، وما إذا كان النظام لديه تغذية راجعة رخيصة قابلة للتحقق من الآلة. هذا هو السبب في أن المؤلف يعتبر الحل الوسط الأكثر عملية هو الأنظمة حيث يمكن تراكم المعرفة والعناصر العاملة، لكن المدقق الخارجي ومعايير النجاح تبقى منفصلة وصارمة قدر الإمكان. وإلا فإن المصطلح يخفي حلولاً هندسية مختلفة جداً.
ماذا يعني هذا
بالنسبة للفرق التي تبني أنظمة وكلاء، المقالة مفيدة كقائمة تحقق ضد الالتباس. لا يمكن استخدام Ralph loop كعلامة عالمية بعد الآن: عليك أولاً تحديد ما إذا كنت تبني execution loop للتنفيذ الموثوق أو evolution loop مع طفرة محكومة، وفقط بعد ذلك تختار المعمارية.
هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟
AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.