أظهرت دراسة Microsoft مخاطر تفويض نماذج اللغة الكبيرة معالجة المستندات
أصدرت Microsoft توضيحات شاملة بشأن دراستها حول كيفية تشويه نماذج اللغة الكبيرة للمستندات عند تفويضها معالجة المهام. تشرح الدراسة ما أثبته فريق البحث بالفعل وأين
معالج بواسطة الذكاء الاصطناعي من Microsoft Research؛ بتحرير Hamidun News
أصدرت Microsoft Research شروحات مفصلة حول دراستها «LLMs Corrupt Your Documents When You Delegate»، التي كانت موضوع نقاش كثيف في المجتمع التقني مؤخراً. تريد الفريق توضيح ما تثبته دراستهم بالفعل وأين تحدث التفسيرات الخاطئة أو المتطرفة.
ما درسته الدراسة
تركز الدراسة على موثوقية نماذج اللغة في السيناريوهات التي تفوض فيها معالجة المستندات كجزء من عملية عمل أطول. على سبيل المثال، أتمتة معالجة العقود الواردة، إعداد التقارير بناءً على البيانات الأصلية، أو توجيه المستندات. الملاحظة الرئيسية: يمكن للنموذج أن يشوه المعلومات بطريقة غير ملحوظة.
لا يحدث هذا فقط لأن نموذج اللغة الكبير يخطئ، بل أيضاً لأنه غالباً ما «يحسّن» النص بشكل مستقل - يصحح القواعس النحوية، يعيد صياغة العبارات، حتى عندما لم يُطلب ذلك صراحةً. في كل خطوة من سلسلة طويلة، قد تتغير المعلومات قليلاً، وفي النهاية قد تختلف النتيجة بشكل ملحوظ عن البيانات الأصلية. طورت الدراسة طرقاً لتقييم هذه الموثوقية - أدوات تسمح بقياس مدى جودة الحفاظ على النظام للدقة عند سلسلة من العمليات.
هذه الطرق حاسمة الأهمية لأنه بدونها، لا تعرف الشركات ببساطة مدى المخاطرة باستخدام نماذج اللغة الكبيرة في العمليات الحرجة.
ما يتم تفسيره بشكل خاطئ عادة
تؤكد Microsoft على عدة نقاط يشوهها النقاد غالباً في النقاش:
- الدراسة ليست حكماً على جميع نماذج اللغة الكبيرة. الأمر لا يتعلق بأن نماذج اللغة غير موثوقة بشكل عام. بل يتعلق بمخاطر محددة في السيناريوهات طويلة الأمد لتفويض معالجة المستندات.
- ليست تأكيداً على «اللاعودة». تشير الدراسة إلى مشكلة، لكنها لا تقول إنه لا يمكن حلها. هناك مقاربات معمارية لتقليل المخاطر.
- ما يهم هو منهجية التقييم. الهدف من الدراسة هو توفير أدوات لقياس الموثوقية، وليس فقط اكتشاف خطأ في نموذج واحد.
يفسر بعض النقاد النتائج على أنها حظر كامل على استخدام نماذج اللغة الكبيرة في الإنتاج. هذا مبالغ فيه جداً ولا يتوافق مع استنتاجات الدراسة نفسها.
ما الذي يجب أن يفعله المطورون
بالنسبة لأولئك الذين ينفذون نماذج اللغة الكبيرة في عمليات العمل التي تتعامل مع المستندات، الاستنتاج عملي: هناك حاجة لآليات تحكم. يمكن:
- التحقق الدوري من النتائج المرحلية - عدم الاعتماد على تمرير واحد للنموذج
- إجراء مراجعة بشرية للخطوات الحرجة في العملية
- تسجيل جميع التغييرات التي أدخلها النموذج لرؤية ما تغير
- مقارنة النتيجة النهائية مع البيانات الأصلية في نهاية السلسلة
يجب على الشركات التي تستخدم بالفعل نماذج اللغة الكبيرة لمعالجة العقود أو التقارير أو غيرها من المستندات الحرجة أن تقيم ما إذا كان لديها مثل هذه الآليات. إذا لم يكن لديها - فهذه منطقة خطر.
ماذا يعني هذا
دراسة Microsoft ليست إشارة للذعر، بل هي دعوة علمية للمسؤولية الهندسية. يمكن لنماذج اللغة أن تعمل مع المستندات وتفوض أجزاء من المعالجة، لكن هذا يتطلب بنية معمارية تتضمن فحصاً في كل خطوة رئيسية. بالنسبة للصناعة، هذا يعني أن موثوقية أنظمة الذكاء الاصطناعي طويلة الأمد ليست مسألة نظرية، بل هي مهمة هندسية لا يمكن تجاهلها.
هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟
AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.