نموذج اللغة المفتوح المصدر للمحامين: تجربة Reg.cloud و Raft
Рег.облако и Raft провели эксперимент по использованию open-source LLM для анализа юридических документов. Статья рассматривает ограничения, инженерные решения

شهدت أتمتة العمل مع المستندات القانونية رحلة طويلة، بدءاً من التعبيرات العادية وحتى الشبكات العصبية الحديثة. ومع ذلك، كما تظهر الممارسة، إما أن جودة المعالجة كانت غير كافية للمهام التجارية الحقيقية، أو أن تكلفة تنفيذ وصيانة الحل كانت مرتفعة للغاية. بحثاً عن حل أمثل، منحت فريق Reg.cloud منحة لفريق Raft لإجراء تجربة باستخدام LLMs مفتوحة المصدر الحديثة على خوادم سحابية مزودة بمعالجات GPU من فئة A100. والهدف من التجربة هو تحديد مدى جودة تعامل LLMs مع المستندات القانونية الطويلة وما إذا كان من الممكن تطبيقها لاستخراج بيانات حرجة للأعمال على مستوى صناعي.
خلال التجربة، واجه فريق Raft عدداً من القيود. أولاً، تتمتع LLMs، حتى الأكثر حداثة منها، بقيود على طول السياق. المستندات القانونية غالباً ما تكون ضخمة جداً، وللمعالجة الفعالة من الضروري تقسيمها إلى أجزاء أو استخدام تقنيات توسيع السياق. ثانياً، يعتمد دقة استخراج البيانات بشكل مباشر على جودة تدريب النموذج وقدرته على فهم المصطلحات القانونية. قد تواجه النماذج المدربة على بيانات عامة صعوبات عند التعامل مع نصوص قانونية محددة.
لحل هذه المشاكل، طبق فريق Raft سلسلة من الحلول الهندسية. تم استخدام تقنيات التقسيم (chunking - تقسيم النص إلى أجزاء) والتلخيص (summarization - ضغط المعلومات) لمعالجة المستندات الطويلة. كما أجرى الفريق ضبط دقيق للنماذج على مجموعات بيانات قانونية متخصصة. تم إيلاء اهتمام خاص لاختيار معاملات النموذج المثلى وتكوين عملية استخراج البيانات.
أثبتت نتائج التجربة أنها واعدة، لكن ليست خالية من العيوب. أظهرت LLMs قدرة جيدة على استخراج المعلومات الرئيسية من المستندات القانونية، لكن دقة واكتمال الاستخراج تباينت تبعاً لنوع المستند وتعقيد المهمة. تم تحقيق أفضل النتائج عند استخدام نماذج تم ضبطها بدقة على بيانات متخصصة. ومع ذلك، حتى في هذه الحالة، كانت هناك حاجة إلى التحقق اليدوي من النتائج لضمان دقة عالية.
لهذه التجربة آثار مهمة على الصناعة القانونية. فهي توضح أن LLMs مفتوحة المصدر يمكن أن تكون أداة مفيدة لأتمتة معالجة المستندات القانونية، لكنها تتطلب ضبطاً دقيقاً وتكييفاً مع مهام محددة. في المستقبل، مع تقدم التكنولوجيا وظهور نماذج أكثر قوة، يمكننا أن نتوقع تحسنات كبيرة في النتائج وتطبيقاً أوسع لـ LLMs في الممارسة القانونية.
في الختام، أظهرت تجربة Reg.cloud و Raft إمكانات LLMs مفتوحة المصدر لأتمتة العمل مع المستندات القانونية. على الرغم من وجود قيود وتعقيدات معينة، تمكن الحلول الهندسية والضبط الدقيق للنماذج من تحقيق نتائج مقبولة. سيفتح البحث والتطوير الإضافي في هذا المجال فرصاً جديدة لتحسين الكفاءة وخفض التكاليف في القطاع القانوني.