Qdrant و DRAG with KNEE: كيفية جعل RAG متكيفاً وتجنب هدر الرموز الإضافية

Q: ما هو المصدر؟

نُشر أصلاً على Habr AI. يعالج Hamidun News المواد ويكيّفها بالذكاء الاصطناعي.

Q: متى نُشر؟

30 أبريل 2026. وقت القراءة: 3 دقيقة.

نوضح كيفية حل المشكلة الأساسية في RAG التقليدي: إما سياق فارغ أو نص زائد للنموذج اللغوي. يقوم نهج DRAG with KNEE المستند إلى Qdrant و Python ببناء تسلسل هرمي…

هيئة تحرير Hamidun News

رصد الذكاء الاصطناعي · Habr AI

30 أبريل 2026· 3 د

معالج بواسطة الذكاء الاصطناعي من Habr AI؛ بتحرير Hamidun News

Qdrant و DRAG with KNEE: كيفية جعل RAG متكيفاً وتجنب هدر الرموز الإضافية — المصدر: Habr AI. كولاج: Hamidun News.

◐ استمع للمقال

خرج تحليل عملي حول كيفية جعل نظام RAG أقل استهلاكاً وأكثر دقة. في جوهره يوجد DRAG with KNEE، وهو نهج قائم على Qdrant و Python يختار حجم السياق بشكل ديناميكي، بدلاً من استخدام top_k ثابت.

لماذا يفشل static top_k

تقريباً أي شخص قام ببناء RAG فوق ملفات PDF طويلة واجه نفس المشكلة: إذا أخذت أقل عدد من الأجزاء، فإن النموذج يفقد السياق المهم ويبدأ في الاختلاق. إذا أخذت الكثير منها، يدخل الضوضاء إلى الإشارة، ومعها تأتي التكاليف المتزايدة والكمون والمخاطرة بأن تعلق نموذج اللغة الكبير بجزء عشوائي. محاولة معامل top_k واحد في هذا المخطط حل عدد كبير جداً من المشاكل المختلفة وتقريباً يفعل ذلك بشكل سيء.

يسمي المؤلف هذا التسويس نقطة ضعف أساسية في RAG الكلاسيكي. لا يأخذ العدد الثابت من المستندات في الاعتبار نوع الاستعلام، ولا هيكل الملف الأصلي، ولا كثافة المعلومات المفيدة داخل المجموعة. بالنسبة لحقيقة قصيرة، قد يكون عدد قليل من المقتطفات كافياً، لكن بالنسبة لسؤال معقد حول مستند متعدد الصفحات، فهو ليس كذلك.

نتيجة لذلك، إما أن يقلل النظام من إطعام النموذج بالسياق أو، على العكس من ذلك، يثقله بنص غير ذي صلة ويحرق ميزانية الرموز.

كيف يعمل DRAG

الفكرة من DRAG with KNEE هي ليس فقط البحث عن أجزاء متشابهة، بل أولاً النظر إلى المستندات كهرمية، ثم تقرير ديناميكي حول مكان إيقاف الاختيار. بدلاً من حد صارم، يحلل الخوارزمية توزيع الملاءمة ويبحث عن نقطة انعطاف—تلك الركبة التي بعدها تعطي الأجزاء المضافة فائدة أقل وأقل. كل ما يذهب إلى الذيل الطويل بعد هذه النقطة يمكن قطعه دون فقدان ملحوظ للمعنى.

من الناحية العملية، يبدو وكأنه استراتيجية أكثر تكيفاً لاستخراج السياق. النظام غير ملزم بإرجاع نفس عدد الأجزاء لكل استعلام: في حالة واحدة سيكون هناك ثلاثة، وفي حالة أخرى عشرة، وفي ثالثة عدة مجموعات ذات صلة من أجزاء مختلفة من المستند. بسبب ذلك، يتكيف RAG بشكل أفضل مع البنية الفعلية للمعرفة، بدلاً من ثابت مختار مسبقاً.

أولاً، يتم العثور على المرشحين من خلال التشابه المتجهي
بعد ذلك يتم تجميعهم وترتيبهم حسب المستندات والمستويات
بعد ذلك، تبحث الخوارزمية عن النقطة التي تبدأ فيها الفائدة في الانخفاض بشكل حاد
فقط الجوهر الملائم بدون الذيل الطويل من الضوضاء يدخل السياق النهائي

هذا النهج مفيد بشكل خاص حيث تكمن المعرفة ليس في قاعدة أسئلة وأجوبة منظمة، بل في تعليمات مبعثرة وتقارير وأنظمة وملفات PDF كبيرة. في هذه المجموعات، تخبر المسافات بين الأجزاء بقليل بحد ذاتها إذا لم تأخذ في الاعتبار كيفية اتصال هذه الأجزاء بعضها ببعض وكيفية سرعة انخفاض قيمتها للإجابة. هنا بالذات يتوقف التحليل الهندسي عن كونه زينة رياضية ويصبح مرشحاً عملياً.

لماذا Qdrant هنا

نقاط قوة منفصلة للمقالة هي أنها لا تنجرف نحو النظرية البحتة. يوضح المؤلف كيفية بناء مثل هذا خط أنابيب باستخدام Qdrant و Python، أي على مكدس مألوف يُستخدم بالفعل في العديد من مشاريع RAG. يتولى Qdrant البحث المتجهي والعمل مع المرشحين، بينما تضيف منطق DRAG with KNEE طبقة تكيف فوقه: ليس فقط البحث عن شيء متشابه، بل فهم مقدار المحتوى المتشابه الذي تحتاج فعلاً إلى إعطائه للنموذج الآن.

بالنسبة للفرق التي نشرت بالفعل الاسترجاع القياسي واصطدمت بمشاكل جودة الإجابات أو تكاليف الاستدلال، هذه إشارة مهمة. قد لا تكون المشكلة في التضمينات أو في نموذج اللغة نفسه، بل في الطريقة التي تقطع وتقدم بها السياق بالضبط. إذا استبدلت top_k الثابت بقطع ديناميكي من خلال نقطة الانعطاف، يمكنك في نفس الوقت تقليل الضوضاء وتحسين الدقة دون إعادة بناء الهندسة المعمارية بالكامل.

ماذا يعني هذا

ينتقل RAG تدريجياً بعيداً عن الضبط الخشن بروح معامل واحد لكل الحالات. توضح المادة حول DRAG with KNEE تحولاً بسيطاً لكن مهماً: المستوى التالي من الجودة ليس فقط بحثاً جيداً، بل القدرة على التوقف في الوقت المناسب بحيث تحصل نموذج اللغة على سياق كافٍ للإجابة، بدلاً من محاولة إرباك عشوائية بالنصوص.

Hamidun News

أخبار الذكاء الاصطناعي بدون ضوضاء. اختيار تحريري يومي من أكثر من 400 مصدر. منتج من جمال حميدون، رئيس الذكاء الاصطناعي في Alpina Digital.

قناة Telegram RSS hamidun.com

هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟

AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.

🎓 Academy — 7 أيام مجاناً استشارة مجانية