قدمت ZeroEntropy نموذج Zerank-2 — معيد ترتيب خفيف الوزن لتحسين دقة البحث
أطلقت ZeroEntropy نموذج Zerank-2 — وهو مُرمّز متقاطع يعتمد على Qwen3 بمجموع 4 مليارات معامل فقط — الذي يعيد ترتيب نتائج البحث بدقة عالية. يناسب أنظمة RAG…
معالج بواسطة الذكاء الاصطناعي من MarkTechPost؛ بتحرير Hamidun News
أطلقت ZeroEntropy نموذج Zerank-2، وهو مُرمّز متقاطع جديد لإعادة ترتيب نتائج البحث. يعتمد النموذج على Qwen3 ويضم 4 مليارات معامل فقط، لكنه يوفر دقة عالية في خطوط أنابيب retrieve-and-rerank ثنائية المرحلة لاسترجاع المعلومات وأنظمة retrieval-augmented generation (RAG).
معمارية البحث ثنائي المرحلة
يتكامل Zerank-2 في معمارية البحث القياسية، التي تتكون من مرحلتين. في المرحلة الأولى، يقوم محرك بحث سريع ثنائي الاتجاه أو مُسترجع خفيف الوزن (مثل BM25 أو Elasticsearch) بإرجاع أفضل K من المرشحين من قاعدة مستندات كبيرة. في المرحلة الثانية، يعيد Zerank-2 ترتيب هؤلاء المرشحين، مُعيداً تقييم صلة كل مستند بالاستعلام المحدد من المستخدم.
يعمل النموذج كمُرمّز متقاطع: فهو يقيّم أزواج الاستعلام والمستند كوحدة واحدة، مع الأخذ بعين الاعتبار التفاعل الدلالي والسياق. هذا أكثر تكلفة من ناحية الحسابات مقارنة بالمقارنة المتجهة، لكنه أدق بكثير. لهذا السبب، تعمل المُرمّزات المتقاطعة عادةً على مجموعة مختارة بالفعل، وليس على قاعدة البيانات بأكملها.
المميزات الرئيسية
- حجم مضغوط (4 مليارات معامل) — يناسب ذاكرة فيديو وحدة معالجة الرسومات (GPU) الواحدة من فئة المستهلك
- دقة عالية في إعادة ترتيب المستندات دون إبطاء النظام
- توفير الموارد — البحث ثنائي المرحلة أرخص من بحث واحد بطيء على قاعدة البيانات بأكملها
- التكامل السهل في أنظمة RAG الموجودة وتطبيقات البحث
- مفتوح المصدر وجاهز للاستخدام الفوري
متى يكون هذا مفيداً
يكون Zerank-2 فعالاً بشكل خاص للتطبيقات التي تحتاج إلى دقة بحث عالية، لكن لا توجد إمكانية لمسح قاعدة البيانات بأكملها باستخدام طريقة بطيئة. السيناريوهات النموذجية: البحث في مستندات الشركة، أنظمة الإجابة على الأسئلة، أنظمة التوصيات، المساعدات القائمة على RAG. يقوم المطورون بالفعل بدمج Zerank-2 في تطبيقات الإنتاج.
في الممارسة العملية، توفر معمارية البحث ثنائية المرحلة مع Zerank-2 تحسناً بنسبة 30-50% في الدقة مقارنة بالاسترجاع البسيط، مع إبطاء الاستعلام بمقدار 100-200 مللي ثانية فقط. يعمل النموذج مع أي مُسترجع — من BM25 إلى قواعد البيانات المتجهة مثل Pinecone أو Weaviate.
«مُرمّز متقاطع صغير ودقيق غالباً ما يكون أكثر فائدة من مُرمّز كبير»،
حسبما يكتب المطورون في التوثيق.
ماذا يعني هذا
تصبح أنظمة RAG أكثر عملية وكفاءة. بدلاً من الاختيار بين بحث سريع لكن غير دقيق وبحث بطيء لكن دقيق، يمكنك الحصول على كليهما: البحث السريع يجد المرشحين، و Zerank-2 يختار الأفضل. هذا مهم بشكل خاص لتطبيقات المؤسسات، حيث يُطلب السرعة والجودة معاً. يوضح Zerank-2 أن المُرمّزات المتقاطعة المتخصصة بحجم معتدل غالباً ما تكون أكثر فعالية من النماذج العامة الكبيرة في المهام الضيقة.
هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟
AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.