Habr AI→ المصدر

Microsoft GraphRAG و Ollama: أداء RAG المستند إلى الرسوم البيانية على النماذج المحلية

تم نشر تحليل عملي لـ Microsoft GraphRAG مدمجًا مع Ollama والنماذج اللغوية الكبيرة المحلية. بنى المؤلف رسم معرفي من "Johnny Mnemonic،" وقارن بين أساليب البحث…

معالج بواسطة الذكاء الاصطناعي من Habr AI؛ بتحرير Hamidun News
Microsoft GraphRAG و Ollama: أداء RAG المستند إلى الرسوم البيانية على النماذج المحلية
المصدر: Habr AI. كولاج: Hamidun News.
◐ استمع للمقال

ظهر تحليل تفصيلي لـ Microsoft GraphRAG بالاقتران مع Ollama والنماذج اللغوية الكبيرة المحلية. اختبر المؤلف ما إذا كان من الممكن تنفيذ RAG القائم على الرسوم البيانية دون بنية تحتية مكلفة، وقام بتشغيل النظام على قصة "Johnny Mnemonic" لويليام جيبسون لتقييم جودة الإجابات باستخدام مادة سايبربانك مألوفة.

كيفية إعداد الاختبار

ركز التجربة على سؤال عملي: هل يمكن للنهج القائم على الرسوم البيانية حقاً أن يحل محل البحث المتجهي التقليدي في أنظمة RAG للمؤسسات. للتحقق من ذلك، اختار المؤلف Microsoft GraphRAG والتنفيذ المحلي عبر Ollama ونصاً يبلغ حوالي 38,000 كلمة. كانت النتيجة ليس فقط فهرساً للبحث، بل رسم بياني معرفة كامل يحتوي على كيانات وعلاقات ومجتمعات.

أظهرت التصور من خلال Gephi أن النظام يمكنه تجميع هيكل غني جداً من نص خيالي واحد. من المهم ملاحظة أن GraphRAG يشكل ليس فقط الاتصالات الحرفية بين الأشياء، بل أيضاً مجموعات موضوعية. في التقارير، تم تجميع المجتمعات حول الياكوزا وجوني وموللي ميليونز وعناصر أخرى رئيسية من الحبكة.

ومع ذلك، برزت أيضاً قيود نمطية: لا تندمج الكيانات دائماً إذا اختلفت الأسماء في الشكل، لذا يتعين احتساب بعض التكرارات بشكل منفصل. للإجابات باللغة الروسية، قام المؤلف بتعديل تعليمات النظام، على الرغم من أنه يوصي بطرح الأسئلة باللغة الإنجليزية، وإلا انخفضت الدقة.

"باختصار، إنه يعمل حتى على نماذج 4B، وإن كان بشكل غير كامل."

كيفية استجابة النظام

قارنت الاختبار عدة أوضاع. يعمل Global search على أوصاف المجتمعات باستخدام منطق MapReduce وهو أنسب للأسئلة حول كامل المجموعة. يخلط Local search العلاقات من الرسم البياني مع أجزاء من النص الأصلي ويثبت أنه أكثر فائدة عند تحليل شخصية أو كائن أو حلقة محددة. هناك أيضاً BASIC—البحث العادي المستند إلى الأجزاء—و DRIFT، وهو وضع أكثر كثافة حسابية يشبه query expansion ويحاول توسيع السياق.

  • قام Global search بجمع المواضيع الرئيسية للعلم الخيالي في القصة: اندماج التكنولوجيا والبيولوجيا، المدينة الديستوبية، الصراعات الشركاتية واللامساواة التكنولوجية.
  • قدم Local search إجابة أكثر تفصيلاً حول الشخصية جوني وعلاقاته مع جوني وموللي والياكوزا.
  • استغرق DRIFT search على نفس السؤال حوالي أربعين دقيقة ولم يحقق قفزة ملحوظة في الجودة مقارنة بالوضع المحلي.
  • يظل BASIC نقطة تحكم مفيدة لأن البحث المتجهي لا يختفي داخل GraphRAG.

من هذا يستخلص المؤلف نتيجة عملية مهمة: في منتج حقيقي، سيكون هناك حاجة إلى وكيل منفصل أو جهاز توجيه لاختيار نوع البحث بناءً على صياغة السؤال وسجل الطلب. وإلا، يتعين تبديل جميع الأوضاع يدوياً. تفصيل آخر—تشير إجابات GraphRAG إلى human_readable_id من ملفات parquet، لذا لواجهة المستخدم يجب فك وتجهيز هذه الروابط إضافياً. هذا يحول GraphRAG من مجرد أداة بحث إلى طبقة يجب تكييفها مع سيناريوهات المستخدم الفعلية.

حيث برزت المشاكل

مع النماذج المحلية، أثبتت الصورة أنها غير متساوية. لم تستطع Mistral 7B من الأمثلة الموجودة التعامل مع global search بسبب مشاكل إخراج JSON المنظمة: استعلامات map تفشل ببساطة. احتفظت Gemma 3 في الإصدارات 4B و 12B بالكيانات الرئيسية لكنها بسطت الرسم البياني وشوهت الحقائق في بعض الأماكن، إلى درجة أن جوني أصبح إنسان بدلاً من دلفين.

كان الخيار الأكثر قابلية للعمل، وفقاً للمؤلف، هو Qwen3 14B. بالنسبة للتضمينات، تم استخدام نموذج user-bge-m3، الذي يعمل بشكل جيد باللغتين الروسية والإنجليزية. هناك أيضاً الكثير من الفروق الدقيقة في البنية التحتية.

يعتمد GraphRAG على LiteLLM، والمؤلف يحذر بشكل خاص من عدم الترقية فوق الإصدار 1.82.6، لأن الإصدارات 1.

82.7 و 1.82.

8 تم اختراقها. بالاقتران مع Ollama، يحدث خطأ 404 كاذب عند طلب معاملات النموذج، والاستدعاءات الطويلة قد تصل إلى انتهاء المهلة الزمنية للصف. تتصرف التضمينات بشكل أسوأ: يفشل bge-m3 من خلال Ollama أحياناً بسبب تسلسل Inf و NaN، لذا كان يجب نقل التضمين إلى وكيل منفصل على HuggingFace.

بالإضافة إلى ذلك، تحتاج إلى تحرير settings.yaml يدوياً، وتعيين api_base، وحجم المتجه 1024 وتفعيل graphml للتصور. حتى على آلة بها 16 جيجابايت من GPU، يستغرق فهرسة النصوص بهذا الحجم أكثر من ساعة واحدة.

ماذا يعني هذا

الخلاصة الرئيسية للمقالة هي أن Microsoft GraphRAG لا يبدو أنه بديل مباشر لـ RAG المتجهي التقليدي. بل هو مفيد حيث تكون عمق العلاقات الدلالية أكثر أهمية من سرعة الاستجابة: في التحليلات والأنظمة الخبيرة والمجموعات المعقدة من المستندات. في الوقت نفسه، تتمتع هذه النهج بالفعل بـ API وتطبيق اختبار ومسار واضح نحو MVP. لكن للحصول على إجابات أكثر صلة، يجب أن تدفع بوقت الفهرسة وهشاشة الأنابيب والتكوين الأكثر تعقيداً بشكل ملحوظ مقارنة بقاعدة البيانات المتجهة العادية.

ZK
Hamidun News
أخبار الذكاء الاصطناعي بدون ضوضاء. اختيار تحريري يومي من أكثر من 400 مصدر. منتج من جمال حميدون، رئيس الذكاء الاصطناعي في Alpina Digital.

هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟

AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.

ما رأيك؟
جارٍ تحميل التعليقات…