المنظومة المحيطة بـ LLM تحقق مكاسب مضاعفة: ما الذي تغيّر بعد عام مع Claude Code
بعد عام ونصف مع Claude Code، خلص مهندس إلى أن الرافعة الأساسية لجودة LLM لا تكمن في الإصدارات الجديدة من النماذج، بل في المنظومة المحيطة به: system prompt وtool

بعد ثمانية عشر شهراً من العمل المكثف مع Claude Code، وتنفيذ العشرات من التجارب التجريبية والملاحظات عبر فرق الهندسة، توصل مطور متمرس إلى استنتاج غير متوقع: الرافعة الأساسية لتحسين جودة LLM ليست جيل النموذج أو الترقية إلى إصدار أحدث، بل نظام متطور من harness حول النموذج.
ما هو harness
في مجتمع الهندسة، يُطلق على هذا harness—دائرة كاملة يعمل فيها نموذج اللغة. إنه ليس ببساطة تعليمات يتم تمريرها في الدردشة، ولا قاعدة سلوك واحدة. إنه نظام معقد لتفاعل النموذج مع العالم الخارجي: قواعده وحدوده وأدواته المتاحة وعمق السياق المرئي. بدون هذه الدائرة، حتى النموذج الأقوى يعمل بكفاءة منخفضة—مثل حفار بدون أذرع له محرك لكن لا يملك شيئاً لينقب أو ينقل التراب به.
لماذا يعطي harness تحسناً أكبر من النماذج الجديدة
خلال عام من الملاحظة، اتضح أن الانتقال إلى إصدار نموذج جديد يعطي مكاسب في الجودة ملحوظة لكن محدودة. الانتقال من Claude 3 إلى Claude 4 هو تحسن، لكنه يمثل عدة نقاط مئوية فقط من مكسب الأداء. في الوقت نفسه، كل طبقة جديدة من harness حول نفس النموذج هو قفزة أسية. أضفنا تعليمات نظام توضح دور النموذج بصراحة—تقفز الجودة. وصلنا الأدوات التي يمكن للنموذج من خلالها التفاعل مع الواقع—قفزة أخرى. وسعنا السياق وأضفنا مهارات وضبطنا الأذونات—في كل مرة تنمو الجودة بشكل أسي. هذا يحول تركيز المهندسين بعيداً عن السعي للإصدارات الجديدة نحو بناء الدائرة التي يعمل فيها النموذج.
مكونات harness فعال
يتكون harness فعال من عدة طبقات رئيسية، كل منها يساهم بقيمتها الخاصة:
- تعليمات النظام — تعليمات صريحة تحدد السلوك وأسلوب التواصل والحدود
- الأدوات — وصول النموذج إلى واجهات برمجية خارجية وقواعد بيانات والمتصفحات والموارد الحسابية
- السياق — إدارة متطورة لما يراه النموذج ويتذكره ويمكنه الاعتماد عليه
- المهارات — أنماط مدربة مسبقاً وخوارزميات لحل المهام النمطية
- الخطافات — أحداث ومحفزات تنشط تحت ظروف معينة
- الأذونات — الحد الفاصل بين ما يمكن للنموذج فعله وما لا يمكنه، أي ملفات يمكنه قراءتها وكتابتها
- الذاكرة — احتفاظ طويل الأمد وقصير الأمد بسياق المشروع والقرارات والرؤى
يمكن تحسين كل من هذه الطبقات بشكل مستقل، مما يوفر تحسينات في الأداء لأنواع مهام محددة.
"هناك قوة، لكن لا يوجد شيء لاستخدامها"—هكذا يصف مهندس متمرس نموذجاً
بدون harness.
ماذا يعني هذا
ينتقل تركيز المطورين بعيداً عن السباق نحو نماذج أحدث وأقوى نحو بناء دائرة ذكية حول الموجودة. الاستثمارات في هندسة تعليمات النظام وإدارة السياق وتطوير المهارات وتحسين الأذونات تؤتي ثمارها بشكل أسرع وتعطي نتائج أكبر من انتظار الإصدار التالي من النموذج. وهذا يفتح إمكانيات جديدة للتخصيص حسب المهام والفريقات المحددة، دون الحاجة إلى ترقيات مكلفة للأجهزة أو الترخيصات.