LangChain Blog→ المصدر

حسّنت LangChain ‏Deep Agents لنماذج مختلفة: +10–20% في الأداء

أضافت LangChain إلى Deep Agents ملفات تعريف model-specific لـ OpenAI وAnthropic وGoogle. ويضبط النظام تلقائياً prompts والأدوات وmiddleware بحسب النموذج المختار

حسّنت LangChain ‏Deep Agents لنماذج مختلفة: +10–20% في الأداء
المصدر: LangChain Blog. كولاج: Hamidun News.
◐ استمع للمقال

أطلقت LangChain تحديثًا لـ Deep Agents — إطار عمل لبناء وكلاء ذكاء اصطناعي معقدة متعددة الخطوات. الآن يمكن للنظام أن يتكيف تلقائيًا مع نماذج لغة مختلفة: OpenAI و Anthropic و Google. هذا يعني أن الوكيل نفسه يمكن أن يعمل بشكل أفضل ببساطة من خلال اختيار نموذج مختلف. إنه مثل تغيير ناقل الحركة في السيارة — طريقة التحكم في السيارة تبقى كما هي، لكن الكفاءة تتغير بشكل جذري.

لماذا يلزم التكيف مع النماذج

تم تطوير Deep Agents في الأصل كنظام عام يعمل بشكل متساوٍ جيد مع جميع النماذج. كانت الفكرة واضحة: كتابة موجه واحد وتكوين الأدوات مرة واحدة والعمل مع الجميع. في الواقع، تبين أن هذا غير صحيح. تتمتع النماذج المختلفة بنقاط قوة وسيكولوجية وقيود مختلفة. نماذج OpenAI أفضل في سلاسل التفكير الطويلة لكنها تتطلب تعليمات محددة. Claude من Anthropic يحب التفكير بصوت عالٍ ويتعامل بشكل جيد جدًا مع السياقات الكبيرة جدًا. Google Gemini يمكنه سحب الأدوات بالتوازي ويعمل بسرعة أكبر. محاولة جعل الجميع يدخلون في قالب واحد مثل كتابة رمز يجب أن يعمل في نفس الوقت على Python 3.8 و Java و Rust. شيء ما يعاني دائمًا.

قبل هذا التحديث، كان Deep Agents يعمل، لكن ببطء ما — لم يتمكن النظام من الاستفادة الكاملة من جميع نقاط القوة في نموذج معين. كان على المطورين اختيار المحفزات والأدوات والمعاملات يدويًا لكل نموذج على حدة. كان هذا مثل الهواية بدلاً من حل المؤسسة الذي يتطلب تصحيح أخطاء جادة قبل الإنتاج.

ملفات تعريف خاصة بالنموذج — كيف يعمل

يضيف التحديث الجديد آلية ملفات تعريف تضبط تلقائيًا ثلاثة مكونات رئيسية من النظام لنموذج معين:

المحفزات — يعيد النظام صياغة التعليمات حسب النموذج المستهدف. يتم استخدام أسلوب تعليمات واحد لـ OpenAI وآخر لـ Claude وثالث لـ Google. إنه مثل كتابة مقال لأساتذة مختلفين — كل واحد يريد أن يرى أسلوبه. يعرف النظام هذه التفضيلات ويتكيف مع النص.

الأدوات — تتم معايرة مجموعة الأدوات وأوصافها لأسلوب عمل النموذج. على سبيل المثال، نماذج OpenAI تتعامل بشكل أفضل مع صيغة JSON للإخراج المنظم. Claude يفضل وصفًا نصيًا مع الأمثلة. يمكن لـ Google Gemini تحديد أدوات متعددة في نفس الوقت. تأخذ الملفات التعريفية هذا في الاعتبار عند تشكيل مجموعة الأدوات.

البرامج الوسيطة — تتكيف منطق معالجة خطوات الوكيل مع موثوقية وسرعة النموذج. إذا كان النموذج أبطأ لكنه أكثر دقة (مثل Claude)، يمكن للبرنامج الوسيط زيادة المهلة الزمنية والتعامل بشكل أفضل مع الأخطاء. إذا كان النموذج سريعًا (مثل Gemini Flash)، يمكن أن تكون المنطقية أكثر عدوانية في إعادة المحاولات وعدم الانتظار طويلاً.

أطلقت LangChain ملفات تعريف جاهزة لـ OpenAI GPT-4 و GPT-4o و Claude 3 (Anthropic) و Google Gemini. يختار المطور ببساطة النموذج الذي سيتم استخدامه في التكوين — والنظام يعيد تكوين المحفزات والأدوات والبرامج الوسيطة تلقائيًا. العمل اليدوي يختفي عمليا.

النتائج: +10–20% على المعيار

اختبرت LangChain الملفات التعريفية الجديدة على معيار مستقل tau2-bench — مجموعة من المهام المعقدة للوكلاء (الترجمة بين اللغات، الحسابات متعددة الخطوات، السلاسل المنطقية). النتيجة: أعطت الملفات التعريفية +10–20 نقطة تحسن مقارنة بالتكوين العام الأساسي. في بعض مجموعات فرعية من المهام، كان الفرق أكبر — حتى 25 نقطة. هذا ليس رقمًا ضخمًا، لكنه ملحوظ للأنظمة الإنتاجية. +15% دقة يعني 15% أقل في الأخطاء، 15% أقل في إعادة العمل، شكاوى أقل من المستخدمين في الدعم وحوادث أقل. بالنسبة للأنظمة الكبيرة ذات الملايين من المكالمات، هذا يعني ملايين الروبلات في توفير تكاليف التشغيل وضغط أقل على المهندسين.

ماذا يعني هذا للمطورين

أصبح Deep Agents أبسط وأكثر موثوقية للمطورين والشركات. قبل ذلك، إذا كنت تريد استخدام نماذج مختلفة في نظام واحد، كان عليك أن تكون خبيرًا — تختار المحفزات والمعاملات يدويًا وتعيد صياغة التعليمات وتغير منطق إعادة المحاولة. الآن النظام يفعل هذا من أجلك.

تختار ببساطة النموذج أثناء التهيئة — وانتهى الأمر. إنه مثل سيارة بتعليق متكيف يضبط نفسه تلقائيًا حسب سطح الطريق والسرعة. لا يحتاج السائق إلى تذكر أي تعليق يختار للتراب مقابل الأسفلت — السيارة تتولى الأمر.

نفس الشيء هنا: اختر النموذج — والنظام يعرف تلقائيًا كيفية استخدامه بشكل أفضل. بالنسبة للشركات التي تبني أنظمة ذكاء اصطناعي متعددة الخطوات (معالجة الطلبات، تحليل العقود، توليد الأكواد، التوثيق)، يوفر هذا أسابيع من تصحيح الأخطاء الإنتاجية ويقلل من خطر الانحدار عند تبديل النماذج.

ZK
Hamidun News
أخبار الذكاء الاصطناعي بدون ضوضاء. اختيار تحريري يومي من أكثر من 400 مصدر. منتج من جمال حميدون، رئيس الذكاء الاصطناعي في Alpina Digital.
ما رأيك؟
جارٍ تحميل التعليقات…