LangChain في الإنتاج: شرح Habr AI لماذا تنتقل الأنظمة متعددة الوكلاء إلى Python الخالص
تحليل لـ LangChain في الإنتاج: بنى الكاتب نظامًا متعدد الوكلاء على Python الخالص وأظهر أين يبدأ الإطار في إعاقة العمل. نقاط التعطل الأساسية هي تبديل النماذج…
معالج بواسطة الذكاء الاصطناعي من Habr AI؛ بتحرير Hamidun News
نُشر على Habr AI تحليل مفصل حول السبب في أن أنظمة الوكلاء المتعددة في الإنتاج لا تستفيد دائماً من LangChain. يصف المؤلف مكدس مكتوب بـ Python النقي ويوضح أين تتوقف الإجراءات المجردة العامة لـ LLM عن توفير الوقت وتبدأ في كسر القدرة على التنبؤ.
حيث تنهار الإجراءات المجردة
الانتقاد الرئيسي لـ LangChain في المقالة هو أن الوعد بـ "تبديل نموذج بسطر واحد" لا يعمل أبداً بهذه البساطة في الخدمة الحقيقية. في الواقع العملي، حتى النماذج من نفس المزود تتصرف بشكل مختلف: النسخة الباهظة الثمن ترجع JSON باستمرار، بينما النسخة الأرخص تبدأ في تغيير المفاتيح وتنسى التعليمات الأساسية وتشعر بالارتباك في أمثلة few-shot. إذا أضفت مزوداً آخر مثل YandexGPT إلى هذا، فإنه لا يكسر صيغة الاستجابة فحسب، بل أيضاً الفئات ذاتها، التي تعتمد عليها المنطق اللاحق.
"الإجراء المجرد يكون ضاراً عندما يتظاهر بأن الأشياء المختلفة متطابقة."
يؤدي هذا إلى فكرة ثانية: الرجوع من OpenAI إلى YandexGPT هو مهمة هندسية منفصلة، وليس مربع اختيار في الإعدادات. يحتاج كل وكيل إلى أسئلة منفصلة وجدول تحقق من التحقق الموحد ومجموعة اختبار من الطلبات الحقيقية. في النظام الموصوف، حد القبول لمزود النسخة الاحتياطية هو 85٪، وتمر كل نتيجة استدعاء عبر مخطط Pydantic قبل إرسالها إلى العميل. بالإضافة إلى ذلك، يضع المؤلف المزودين في واجهات Protocol بحيث يكون السلوك العام موحداً، بينما تبقى الفروقات في الأسئلة والتفويض والتنسيقات صريحة.
استرجاع المعلومات بدون سحر
قسم منفصل من المقالة مكرس لـ RAG، حيث تنتهي "ثلاثة أسطر من الرمز" أيضاً بسرعة. تغيير نموذج الدمج بدون إعادة فهرسة قاعدة المعارف يلغي بشكل أساسي الغرض من البحث المتجه: ينتهي الحال بالاستعلامات والمستندات في مساحات مختلفة، والنظام يستمر رسمياً في العمل، فقط يجد قطع النصوص الخاطئة. يحدث الشيء نفسه عند تغيير حجم الجزء: يتم تقسيم المستندات القديمة بطريقة واحدة والمستندات الجديدة بأخرى، وتصبح جودة البحث لعبة حظ يلاحظها المستخدمون قبل الفريق.
لذلك، في الإنتاج، وفقاً للمؤلف، ما يهم أكثر من السلسلة المريحة هو التحكم الكامل في خط أنابيب الاسترجاع. عندما تذهب الإجابة إلى عميل حقيقي، يحتاج الفريق إلى رؤية ليس فقط النص النهائي الجميل، بل كل الطريق إليه: ما هو المرشح الذي تم تطبيقه، أي أجزاء دخلت السياق، وما هي الدرجات ولماذا غلب مستند على آخر. بدون هذا الشفافية، يصبح التصحيح تخميناً، وتظهر المشاكل فقط بعد شكاوى المستخدمين.
- الدرجات والبيانات الوصفية لكل جزء
- المرشحين الذين لم ينجحوا في الاختيار
- التصفية حسب المنتج أو العميل أو السيناريو
- تحديثات قاعدة المعارف بدون وقت توقف
التحكم أهم من الوكيل
الجزء الأكثر هشاشة، وفقاً للمؤلف، هو استدعاء الأداة. يمكن للنموذج أن يختار الأداة الخاطئة أو يمرر معاملات غير صحيحة أو يرفض الاستدعاء بالكامل ويهلوس بثقة إجابة. توضح المقالة هذا بمثال بسيط: يسأل المستخدم عن جدوله الشخصي، لكن الوكيل يذهب ليس إلى نظام إدارة علاقات العملاء بل إلى قاعدة المعارف ويعيد وصفاً عاماً للدورة.
محاولة إصلاح مثل هذه الأخطاء بالأسئلة وحدها غالباً ما تؤدي إلى حالات حدودية جديدة، لأن النموذج يتخذ القرارات احتمالياً وليس حتمياً. لهذا السبب، في معماريته الخاصة، ينقل المؤلف التوجيه الحرج خارج LLM إلى مصنف يعتمد على القواعد، ويترك النموذج فقط للحالات الغامضة. فوق هذا توجد عقود صريحة للوكلاء وعملاء منفصلين لنظام إدارة علاقات العملاء وقاعدة المعارف والإجابات المكتوبة بأحرف وإعادة محاولة للأعطال المؤقتة والتصعيد إلى الإنسان إذا لم يتم الحصول على نتيجة صحيحة.
حجة إضافية هي الأمان: كلما كان الإطار وتبعياته الانتقالية أصغر، كلما كان سطح الهجوم أصغر وكان من الأسهل فهم ما يحمي النظام بالضبط. يعمل النظام الناتج على FastAPI ويستخدم SDK المزودين مباشرة و ChromaDB و Bitrix24 API، بدلاً من طبقة تنسيق عامة. في الإصدار مفتوح المصدر، يحتوي المشروع على حوالي 4500 سطر من الكود و 170 اختباراً و 84٪ من التغطية.
هذا عمل يدوي أكثر مما هو الحال في سيناريو يتضمن إطار عمل جاهز، لكن كل خطوة يمكن تسجيلها وإعادة إنتاجها والتحقق منها بشكل منفصل. بالنسبة للإنتاج، هذا هو المقايضة الرئيسية: سحر أقل وكود أكثر، لكن سلوك أكثر قابلية للتنبؤ في الأعطال والرجوع والطلبات غير القياسية.
ما يعنيه هذا
يلتقط تحليل Habr AI بشكل جيد التحول في تطوير LLM: لا تزال الإطارات مريحة للنماذج الأولية والعروض التوضيحية، لكن في الإنتاج، تنتقل القيمة نحو العقود الصريحة والتحقق والقابلية للمراقبة. كلما زاد عدد المزودين والتكاملات والمخاطر التجارية لنظام ما، كلما أصبح من الصعب إخفاء الاختلافات خلف إجراء مجرد واحد، وكلما أصبح من المهم السيطرة يدوياً على كل نقطة اتصال.
هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟
AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.