Habr AI→ المصدر

Anthropic وETH Zurich: ملف CLAUDE.md الطويل يضعف أداء الوكيل ويرفع التكاليف

اختبرت ETH Zurich 138 مستودعًا وخرجت بخلاصة غير مريحة: ملفات CLAUDE.md وAGENTS.md الطويلة لا تساعد الوكلاء كثيرًا، بل تعيقهم. ومع التعليمات المُولدة…

معالج بواسطة الذكاء الاصطناعي من Habr AI؛ بتحرير Hamidun News
Anthropic وETH Zurich: ملف CLAUDE.md الطويل يضعف أداء الوكيل ويرفع التكاليف
المصدر: Habr AI. كولاج: Hamidun News.
◐ استمع للمقال

يعتبر CLAUDE.md و AGENTS.md بمثابة طريقة سريعة لشرح قواعد المشروع للوكيل، لكن بحثًا جديدًا يظهر: السياق الطويل يضر أكثر مما يساعد في أغلب الأحيان. على عينة من 138 مستودع Python، لاحظ الباحثون في ETH Zurich انخفاضًا في معدل النجاح وزيادة في التكاليف، خاصة بالنسبة للملفات المُنتَجة تلقائيًا.

ما أظهره البحث

أخذ مؤلفو الورقة البحثية Evaluating AGENTS.md: Are Repository-Level Context Files Helpful for Coding Agents? 138 مستودعًا حقيقيًا، وجمعوا 5694 طلب دمج، وأجروا المهام عبر أربعة نماذج: Claude Sonnet 4.5 و Codex GPT-5.2 و GPT-5.1 Mini و Qwen3-30B. قارنوا سيناريوهات بدون ملفات خاصة، مع تعليمات مُنتَجة بواسطة النموذج اللغوي، ومع ملفات AGENTS.md التي يحافظ عليها البشر. هذه نقطة مهمة: البحث لم ينظر إلى عروض توضيحية مجردة، بل إلى مهام حقيقية من قواعد أكواد نشطة.

انتهى الاستنتاج الرئيسي للملفات المُنشأة تلقائيًا ليكون محبطًا. انخفض معدل النجاح بمعدل 3% في المتوسط، وارتفعت تكلفة الاستدلال بأكثر من 20%. أظهرت الملفات التي يحافظ عليها البشر أداءً أفضل: رفعت النجاح بحوالي 4%، لكن التكلفة ارتفعت أيضًا بنحو 19%. بعبارة أخرى، لم يكن ملف السياق بمثابة معجل مجاني. حتى عندما يساعد، يبقى كسب الجودة متواضعًا مقارنة بالدفع الزائد المستمر للرموز والخطوات الإضافية للوكيل.

لماذا الملفات الطويلة تضر

الملاحظة الأكثر عكسية في الورقة: أوصاف هيكل المشروع تساعد الوكيل بالكاد على التنقل. الأقسام حول المجلدات والعمارة ومكدس التكنولوجيا تبدو مفيدة للبشر، لكن الوكلاء غالبًا يجدون كل شيء بأنفسهم من خلال grep و glob وقراءة الملفات. إذا كانت المعلومات موجودة بالفعل في pyproject.toml أو package.json أو إعدادات الفحص أو في بنية المستودع نفسه، فإن الشرح الطويل يكرر فقط ما يمكن للنموذج اكتشافه بسرعة بنفسه.

إذا كان بإمكان الوكيل تعلم هذا من الكود نفسه، من الأفضل حذفه من التعليمات.

لاحظ الباحثون أيضًا أن النماذج التي تحتوي على ملفات السياق تقوم بمزيد من الإجراءات أكثر من اللازم للمهمة المحددة. يعيدون قراءة التعليمات بشكل متكرر أكثر، وينفذون الاختبارات بشكل غير ضروري، ويستدعون بنشاط أكبر الأدوات التي تم ذكرها في الملف. تلاحظ الورقة بشكل منفصل زيادة في رموز التفكير لنماذج GPT. بعبارة أخرى، التعليمات لا تضيف المعرفة فحسب، بل تغير سلوك الوكيل: يبدأ في اتباع القواعد حتى في الحالات التي لا تساعده على حل المهمة الحالية.

ما الذي يجب الاحتفاظ به

لا يترتب على هذا البحث رفض كامل لـ CLAUDE.md أو AGENTS.md. بل الاستنتاج مختلف: يجب أن تكون مثل هذه الملفات قصيرة وتحتوي فقط على ما لا يستطيع الوكيل استنتاجه بشكل موثوق من الكود أو الإعدادات بنفسه. كلما قل النص الزخرفي، قل الخطر من أن يعلق النموذج في طقوس غير ضرورية بدلاً من تنفيذ الطلب المحدد.

  • أوامر الاختبار غير القياسية
  • مدير الحزم، إذا كان غير واضح
  • البرامج النصية المخصصة والأدوات وتفاصيل النشر
  • اتفاقيات التسمية، إذا كان من المستحيل استنتاجها بسرعة من الكود
  • رابط إلى .env.example أو ملف دخول حرج آخر

تتراكم صورة أخرى من البحث، حيث أظهر Codex مع AGENTS.md تسريعًا واستهلاكًا أقل للرموز. لكن هناك كانت العينة أصغر بكثير، وتم تقييم صحة النتائج بطريقة محدودة. لذا فإن الاستنتاج العام في الوقت الحاضر حذر: السياق القصير والعملي يساعد أحيانًا، في حين أن الملف الطويل الذي يراجع العمارة ومكدس التكنولوجيا والقواعد العامة يصبح بسهولة حملًا ثقيلًا مكلفًا. لا تعالج ETH Zurich أيضًا بالكاد قابلية الصيانة والامتثال لأسلوب المشروع، لذا فإن النقاش حول فائدة مثل هذه الملفات لم يُغلق بعد.

ماذا يعني هذا

الاستنتاج العملي بسيط: تعامل مع CLAUDE.md كقائمة بإصلاحات أخطاء الوكيل، وليس كموسوعة المشروع. إذا كانت التعليمات لا تساعد على تجنب فشل محدد، ولا تصف أمرًا غير قياسي، ولا تضيف سياقًا فريدًا، من الأفضل حذفها. بالنسبة للفرق التي تستخدم وكلاء البرمجة بنشاط، هذا دافع مباشر لتقليل ملفات السياق وتقليل نفقات الرموز والتحقق من مهامهم الخاصة أي الأسطر تحسن النتائج فعلاً وأيها يخلق فقط ضوضاء باهظة الثمن.

ZK
Hamidun News
أخبار الذكاء الاصطناعي بدون ضوضاء. اختيار تحريري يومي من أكثر من 400 مصدر. منتج من جمال حميدون، رئيس الذكاء الاصطناعي في Alpina Digital.

هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟

AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.

ما رأيك؟
جارٍ تحميل التعليقات…