أظهر GLiNER 2 كيف تلحق المُرمِّزات المدمجة بنماذج LLM في NER والتصنيف
يواصل GLiNER 2 المسار الهادئ لتطور المُرمِّزات zero-shot: فبدلاً من نماذج LLM الثقيلة لمهام NER والتصنيف واستخراج البيانات، يطرح نموذجًا مدمجًا يضم 205…
معالج بواسطة الذكاء الاصطناعي من Habr AI؛ بتحرير Hamidun News
بينما يناقش السوق وكلاء الذكاء الاصطناعي ونماذج اللغات الكبيرة ذات الحجم المتزايد، اكتسبت فئة مختلفة من النماذج قوة بصمت في معالجة اللغات الطبيعية التطبيقية. تُظهر السلسلة UniNER → GLiNER → GLiNER 2 أنه بالنسبة لاستخراج الكيانات والتصنيف وتنظيم النصوص، يكون المرمز المُحكم كافياً غالباً—مرمز يعمل بسرعة أكبر وبتكلفة أقل ودون الاعتماد على واجهات برمجية خارجية.
لماذا هذا مهم
بالنسبة للعديد من فرق المنتج، المهمة ليست أن يستدل النموذج بأناقة، بل أن يعثر بموثوقية على الأسماء والتواريخ والشركات وفئات التذاكر أو الحقول في المستندات. في مثل هذه السيناريوهات، تبدو نماذج اللغات التوليدية غالباً مفرطة: فهي أكثر تكلفة في الاستدلال، وأبطأ في الاستجابة، وتدخل مخاطر تشغيلية مثل الاعتماديات على واجهات برمجية خارجية وإدارة ذاكرة التخزين المؤقت وزمن الاستجابة غير المتنبأ به. في هذا السياق، عاد الاهتمام بالمرمزات ذات الإطلاق الصفري—نماذج قادرة على حل مهام استخراج المعلومات الضيقة دون إعادة تدريب كاملة لكل نوع كيان جديد.
اتخذ UniNER الخطوة الأولى المهمة في هذا الاتجاه. استخدم المؤلفون ChatGPT كمصنِّف وأظهروا أن التقطير الصارم للتسميات يعمل ليس فقط لتقليل تكاليف التدريب، بل أيضاً لإنتاج نموذج متخصص صغير قادر على مضاهاة أو حتى تجاوز معلمه في تخصصه. ومع ذلك، احتفظ UniNER بمشكلة قديمة: ظل النموذج انحدارياً ذاتياً ويولد الإجابات في الأساس رمز برمجي تلو الآخر. لذا كان هناك كسب في الجودة، لكن التعقيد الإضافي للفك التشفير لم يختفِ أبداً.
من UniNER إلى GLiNER
اتخذ GLiNER الخطوة التالية، وثبت أنها أكثر أهمية من مجرد تحسين متري آخر. بدلاً من توليد النصوص، انتقل النموذج إلى مقارنة امتدادات النصوص بقائمة من التسميات في فضاء كامن مشترك. يتم ترميز النصوص والتسميات بواسطة محول ثنائي الاتجاه، وبعد ذلك يبحث النموذج عن تطابقات بين الامتدادات المرشحة ووصفات الكيانات. يزيل هذا الذيل التوليدي بالكامل: لا داعي لفك تشفير، لا توجد سلسلة رموز برمجية في الإخراج، لا حاجة للانتظار حتى ينهي النموذج إجابته. بالنسبة لمهام استخراج الكيانات في المجال المفتوح، يبدو هذا مثل حل هندسي نظيف جداً.
أظهر GLiNER الأصلي مع عمود DeBERTa أن مرمزاً مُحكماً بمئات الملايين من المعاملات يمكن أن ينافس نماذج اللغات الكبيرة الأثقل بكثير في استخراج الكيانات ذي الإطلاق الصفري. يؤكد المقال بشكل خاص أن العمارة ثبت أنها مفيدة ليس فقط لاستخراج الكيانات. حول العمارة، نمت مجموعة كاملة من الفروع المتخصصة بسرعة: لاستخراج العلاقات والربط بين الكيانات وتصنيف النصوص. أكد هذا الفكرة الأساسية لـ GLiNER: إذا كانت المهمة تختزل إلى مطابقة النصوص بمخطط تسميات، فغالباً لا تحتاج إلى نموذج توليدي كبير.
ما يغيره GLiNER 2
لا يحاول GLiNER 2 إعادة اختراع العمارة الأساسية—هدفه مختلف. يأخذ المؤلفون التعلم من النظام البيئي بأكمله ويجمعونه في واجهة واحدة موجهة بالمخطط، حيث يصف المستخدم الكيانات والحقول وخيارات القيم وهيكل النتيجة، ويعيد النموذج إخراجاً منظماً بالفعل في عملية واحدة. يحول هذا حديقة النماذج المشتتة إلى أداة واحدة لسيناريوهات الإنتاج حيث تكون البساطة والنشر المحلي والتكاليف المتنبأ بها مهمة.
- واجهة واحدة لاستخراج الكيانات والتصنيف واستخراج العلاقات والتحليل الهيكلي
- عملية نشر واحدة بدلاً من عدة سلاسل استدلال منفصلة
- سياق أطول لمعالجة المستندات الكبيرة وقوائم التسميات الطويلة
- دعم لأوصاف التسميات إذا كانت أسماء الكيانات غامضة أو خاصة بالمجال
- نموذج بـ 205 مليون معامل يمكن نشره محلياً بدون الاعتماد على واجهة برمجية خارجية
لكن مع التوحيد يأتي عائق مألوف. كلما حاولنا حشر المزيد من المهام والتسميات ودرجات التعميم في واجهة واحدة، زاد خطر فقدان الجودة في كل مهمة فرعية فردية. وفقاً للتحليل، يتفوق GLiNER 2 على نماذج اللغات الكبيرة الثقيلة في السرعة وراحة النشر، لكنه يتخلف عن GLiNER الأصلي في استخراج الكيانات ذي الإطلاق الصفري البحت، ولا يصل إلى مستوى GPT-4o في بعض معايير التصنيف. لا يجعل هذا النموذج ضعيفاً—بل يعكس مقايضة هندسية صادقة: ألم أقل في البنية التحتية وتكلفة أقل، لكن ليس الجودة القصوى المطلقة.
ما الذي يعنيه
يوضح GLiNER 2 أن سوق معالجة اللغات الطبيعية يبدأ في تقدير ليس فقط العمومية بل الكفاءة أيضاً. بالنسبة للفرق التي تعالج المستندات والتذاكر والاستطلاعات وتدفقات الأخبار بحجم كبير، يمكن لمثل هذه المرمزات أن تصبح بديلاً عملياً لواجهات برمجية نماذج اللغات: ليس بديلاً لجميع المهام، بل طبقة عمل سريعة حيث تكون السرعة والخصوصية والنتائج المتنبأ بها مهمة.
هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟
AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.