Habr AI→ المصدر

10 طرق RAG تعمل فعلاً في الإنتاج: من الأساسي إلى GraphRAG

جمع أحد المطورين على Habr قائمة عملية بنهج RAG المستخدمة فعلاً في الإنتاج. يوفر البحث الهجين (dense + BM25) باستمرار تحسناً بنسبة +15–30% في الدقة، وإضافة…

معالج بواسطة الذكاء الاصطناعي من Habr AI؛ بتحرير Hamidun News
10 طرق RAG تعمل فعلاً في الإنتاج: من الأساسي إلى GraphRAG
المصدر: Habr AI. كولاج: Hamidun News.
◐ استمع للمقال

قام مطور على Habr بتجميع قائمة عملية بنهج RAG التي تعمل فعلاً في الإنتاج — بناءً على الخبرة الشخصية وتحليل دراسات الحالات من جهات أخرى خلال العام الماضي من النمو النشط لكومة LLM.

من أين يبدأ الجميع

Naive RAG — نقطة الانطلاق لمعظم المشاريع. المخطط بسيط: يتم تقسيم المستندات إلى أجزاء، يتم فهرستها عبر embeddings، وعند الاستعلام يتم العثور على الأقرب حسب مسافة جيب التمام وتمريرها إلى LLM كسياق. يعمل على قواعس معرفية صغيرة مع أسئلة بسيطة ومستندات متجانسة. تبدأ المشاكل في المقياس: المستندات الطويلة لا تتسع جيداً في أجزاء ثابتة، الأسئلة المعقدة تتطلب عدة أجزاء في نفس الوقت، وصيغ المستخدم غالباً لا تطابق أسلوب المستندات. هنا تدخل النهج المتقدمة في الصورة.

البحث الهجين وإعادة الترتيب

البحث الهجين — الترقية الأولى التي تستحق دائماً تقريباً. الجمع بين المتجهات الكثيفة (البحث الدلالي) مع BM25 (البحث بالكلمات الرئيسية) يعطي باستمرار تحسن دقة +15–30٪ مقارنة بالبحث عن طريق embedding وحده. تلتقط المتجهات الكثيفة التشابه الدلالي، والمتجهات المتناثرة — التطابقات الدقيقة للمصطلحات والاختصارات والأسماء. إضافة إعادة ترتيب cross-encoder على أفضل 20 نتيجة ترفع الجودة بمقدار إضافي 10–15٪. معاد الترتيب هو نموذج أثقل، لكنه يعمل فقط على المجموعة النهائية من المرشحين، لذلك تبقى الكمون مقبولة للإنتاج.

تقنيات على مستوى الاستعلام

بعض مشاكل RAG تحل بشكل أكثر كفاءة قبل البحث — من خلال إعادة صياغة أو توسيع الاستعلام.

  • HyDE — يولد LLM وثيقة-إجابة افتراضية، يستخدم المتجه لها في البحث. مفيد بشكل خاص عندما يختلف أسلوب السؤال وأسلوب المستندات بشكل كبير.
  • Multi-query — من سؤال واحد، يتم إنشاء 3–5 إعادة صياغات، يحدث البحث بالتوازي على الجميع. يقلل الاعتماد على الصياغة الدقيقة للمستخدم.
  • Step-back prompting — قبل البحث، يعمم LLM الاستعلام إلى مستوى أعلى من التجريد. مفيد عندما يكون السؤال المحدد متخصصاً جداً لاسترجاع جيد.
  • Parent Document Retriever — يتم فهرسة أجزاء صغيرة (دقة عالية) وتمرير المستند الأب بالكامل إلى السياق. توازن جيد بين الدقة والتغطية.
  • Contextual compression — يستخرج LLM فقط الجزء الملائم من الجزء الموجود. يوفر الرموز وينخفض الضجيج في السياق.

المدفعية الثقيلة

عندما لا تكفي التقنيات البسيطة، يتم تفعيل نهج أكثر تعقيداً معمارياً.

RAPTOR ينشئ شجرة هرمية للمستندات: يجمع الأجزاء، يختص كل مجموعة، ثم يجمع الملخصات مرة أخرى. عند الاستعلام، يحدث البحث على مستوى التجريد المطلوب. يعمل بشكل جيد على المستندات الطويلة — الأدلة التقنية، التقارير المالية، الكتب بمستويات مختلفة من التفاصيل.

GraphRAG من Microsoft ينشئ رسم بياني للمعرفة: يستخرج الكيانات والعلاقات من النص، ينشئ ملخصات المجتمع لمختلف المجموعات الموضوعية. يتفوق باستمرار على RAG القياسي في الأسئلة التحليلية والمقارنة — "كيف يرتبط X بـ Y"، "ما الذي تغير منذ النقطة A" — وفي المهام التي تتطلب تجميع عبر مجمل المدونة.

Self-RAG و Corrective RAG يحولان النظام إلى وضع الوكيل: يقرر النموذج نفسه ما إذا كان البحث ضروري، يقيم ملاءمة ما تم العثور عليه وإعادة صياغة الاستعلام عند الضرورة. يضيف الكمون والتعقيد، لكن يرفع بشكل ملحوظ الجودة في المهام متعددة الخطوات والغامضة.

ما يعنيه هذا

المسار العملي: ابدأ بالبحث الهجين بالإضافة إلى إعادة الترتيب — هذا يغطي معظم المشاكل بأقل التكاليف. ثم أضف multi-query أو HyDE للاستعلامات المتنوعة. قم بتوصيل GraphRAG و Self-RAG فقط عندما تفشل التقنيات الأبسط: فهي تتطلب تكاليف تطوير وصيانة كبيرة. بالنسبة لمعظم منتجات B2B، الخطوتان الأوليان كافيتان.

ZK
Hamidun News
أخبار الذكاء الاصطناعي بدون ضوضاء. اختيار تحريري يومي من أكثر من 400 مصدر. منتج من جمال حميدون، رئيس الذكاء الاصطناعي في Alpina Digital.

هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟

AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.

ما رأيك؟
جارٍ تحميل التعليقات…