كروك يوضح كيف بنى مساعد RAG داخلي لبيانات المؤسسة
شارك كروك دراسة حالة لمساعد RAG داخلي للعمل مع معرفة المؤسسة في بيئة مغلقة. رفضت الشركة الخدمات الخارجية ونقلت التحكم في ACL إلى طبقة منفصلة وأمضت ما يقرب من…
معالج بواسطة الذكاء الاصطناعي من Habr AI؛ بتحرير Hamidun News
شرحت كرك كيف بنت مساعد RAG داخلي للعمل مع المعرفة المؤسسية في دائرة مغلقة. بدلاً من 'دردشة من أجل الدردشة'، أنشأت الشركة أداة تقلل الوقت المستغرق في البحث عن أجزاء ذات صلة في المستندات والويكيز والبوابات الداخلية.
لماذا اختاروا RAG
بدأ الفريق بمشكلة بسيطة: بينما توجد البحث المدمج في جميع الأنظمة الكبيرة للمؤسسات تقريباً، إلا أنه لا يسهل حياة الموظفين. المعلومات موزعة عبر عدة مستودعات، لكل منها قواعدها وهيكلها ومنطق إرجاع النتائج الخاص به. نتيجة لذلك، يتذكر الناس معنى المستند لكنهم ينسون الصيغة الدقيقة أو اسم الملف أو الموقع. يعتمد البحث القياسي على تطابق الكلمات بدلاً من السياق، وهنا حيث يبدأ بالفشل.
كما اختبروا نهجاً مباشراً مع GPT وتحميل المستندات، لكنه لم يعمل مع مجموعات البيانات الكبيرة. دخلت عدة قيود حيز التنفيذ: حجم نافذة السياق وعدم استقرار الإجابات وخطر تعريض المستندات الحساسة خارج بنية المؤسسة. لهذا السبب اختارت كرك نهج RAG: أولاً ابحث عن أجزاء ذات صلة من مصادر داخلية ثم مررها إلى نموذج لغة لتجميع الإجابة.
"كنا بحاجة إلى أداة ذكاء اصطناعي مفيدة وليس ذكاء اصطناعي موضة—مساعد
مؤسسي مدار." تم اختيار RAG في هذا المشروع لأربع أسباب عملية:
- المستندات تبقى داخل بنية المؤسسة;
- يتم نقل السياق الضروري فقط إلى النموذج وليس مجموعة البيانات بالكاملة;
- يمكن التحكم في الفهرسة والاسترجاع بشكل منفصل;
- خطر الهلوسة أقل لأن الإجابة تستند إلى مصادر حقيقية.
كيف تم تنظيم النظام
الحل يعتمد على دائرتين منفصلتين. الأولى تتعامل مع إنشاء المساعدين: يمكن للمستخدمين إضافة ملفات وروابط لبوابات أو مساحات قاعدة المعرفة من خلال برنامج المراسلة المؤسسي أو واجهة ويب تجريبية. يقوم نظام إدارة المساعدين بعد ذلك بفحص حقوق الوصول وتشغيل المحللات اللازمة وتحضير البيانات ثم إرسالها فقط إلى نواة RAG للفهرسة. بمجرد أن يكون الفهرس جاهزاً، يتلقى الموظف إشعاراً ويمكنه بدء حوار.
الدائرة الثانية هي دائرة الحوار. تمر طلبات المستخدم عبر ناقل LLM المؤسسي ومحرك RAG يختار مسبقاً السياق ذي الصلة. يتم فحص حقوق الوصول ليس مرة واحدة فقط أثناء التحميل بل مع كل استعلام مساعد. بسبب تعقيد قوائم التحكم في الوصول في الأنظمة المختلفة، قررت الفريق الابتعاد عن المساعدين المشتركين في بعض السيناريوهات والتحول إلى مساعدين شخصيين. هذا أقل ملاءمة لكنه يقلل من خطر رؤية الموظف لبيانات لا يجب أن يصل إليها.
كان عليهم بناء موصلات ومعالجة مسبقة لكل نوع من أنواع مصادر البيانات تقريباً. كانت البوابة المؤسسية وقاعدة المعرفة والملفات الشخصية وصفحات ويكي مختلفة جداً لتمرير مباشرة إلى نواة RAG واحدة جاهزة للاستخدام. لذا قاموا باستخراج تنظيف البيانات والتوحيد والتحضير في خدمات منفصلة. لنقطة الدخول الرئيسية اختاروا بريداً داخلياً قائماً على Express: كان Telegram يبدو مناسباً في البداية لكن استخدام خدمة خارجية للمعلومات الحساسة تم رفضه على الفور.
حيث نشأت المشاكل
أكثر التحديات الصعبة لم تأتِ من الواجهة بل من البيانات والعمليات. كانت ويكيز مع الترميز المعقد تتطلب تنظيفاً يدوياً واسع النطاق. أنتجت الجداول والبيانات الرقمية إجابات غير مستقرة. كسرت ملفات PDF مع الكشافات والرسومات التحليل الأساسي. كانت الهياكل المرئية مثل الرسوم البيانية للمنظمة أقل فهماً من النموذج من النص وكان يمكن أن تخلط بين العلاقات بين الأقسام والمديرين.
بالإضافة إلى ذلك، كان المستخدمون يتوقعون أن يوفر RAG بحثاً شاملاً عبر جميع التطابقات، على الرغم من أن النهج نفسه يميل إلى تصنيف السياق الأكثر احتمالاً بدلاً من ضمان قائمة كاملة من الحوادث. كانت التعاون مع الموردين متساوياً التحدي. اختبرت Croc عدة منصات على مجموعات المستندات الخاصة بها والاستعلامات النموذجية وأمضت ما يقرب من عام في صقل الحل مع موردها. أصبحت التحديثات مشكلة - كان يمكنها أن تغير بشكل جذري جودة الإجابة: أسقطت نسخة واحدة المقياس من 85% إلى 70%.
بسبب العلاقة غير الواضحة بين RAG و LLM المدمج، طلب الفريق واجهة منفصلة بينهما حتى يتمكنوا من اختيار النموذج بشكل مستقل وإدارة معالجة السياق اللاحقة. للتحكم في الجودة قدموا معايير وأسئلة مرجعية وفحوصات منتظمة وحتى قاضي LLM منفصل يقارن الإجابات الفعلية بالإجابات المتوقعة.
ما يعنيه هذا
توضح حالة كرك بشكل جيد أن الذكاء الاصطناعي المؤسسي اليوم لا يتعلق كثيراً باختيار نموذج بقدر ما يتعلق بالهندسة حول البيانات والوصول والاختبار. RAG وحده لا يحل المشكلة إذا لم تكن هناك موصلات وعزل المجموعات والتحكم في قوائم التحكم في الوصول والمقاييس الواضحة للجودة. لكن عندما يتم جمع كل هذا في نظام واحد يمكن لمساعد داخلي أن يقضي بالفعل على ساعات من البحث الروتيني ويجعل العمل مع المعرفة المؤسسية أسرع بشكل ملحوظ.
هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟
AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.