سيفرض ArXiv حظرًا لمدة عام على المؤلفين بسبب محتوى AI غير المُراجع في الأوراق
يفرض ArXiv حظرًا لمدة عام على محتوى AI غير المُراجع في الـ preprints. وأعلن السياسة الجديدة Thomas Dietterich، رئيس قسم علوم الحاسوب في المستودع. وتعتمد المنصة

أعلنت ArXiv، وهي مستودع مفتوح للمقالات الأولية الذي خدم كمعيار لنشر الأبحاث العلمية في علوم الحاسوب والرياضيات والفيزياء لأكثر من ثلاثة عقود، عن تطبيق سياسة صارمة لمكافحة المحتوى المولد بالذكاء الاصطناعي بدون سيطرة. سيتلقى المؤلفون الذين أرسلوا مقالات بها علامات واضحة للمحتوى المولد بالذكاء الاصطناعي بدون سيطرة حظراً لمدة سنة واحدة. وأيدت القرار توماس ديتريش، رئيس قسم علوم الحاسوب في المستودع.
موجة من القمامة الذكية في العلم
خلال السنتين الماضيتين، واجهت المجتمع العلمي تدفقاً غير مسبوق من المقالات الأولية منخفضة الجودة التي توليدها الشبكات العصبية دون أي مراجعة بشرية. يتم تحميل أكثر من 10000 مقالة أولية إلى ArXiv يومياً — وهو رقم نما بشكل أسي منذ ظهور أدوات الذكاء الاصطناعي المتاحة مثل ChatGPT. فريق المراقبين في المنصة لا يستطيع مواكبة جميع الحالات، والمستودع نفسه يخاطر بتحول إلى مكب نفايات للقمامة المولدة آلياً. أصبحت المشكلة حرجة جداً بحيث بدأ التشويش على الإشارة في الفضاء العلمي يجعل من الصعب العثور على الأبحاث الحقيقية القيمة والمبتكرة. عندما تكون قاعدة البيانات مليئة بالنصوص المكتوبة بنماذج القمامة، تضيع الأعمال الجديدة في الضوضاء ولا تحصل على الاهتمام الذي تستحقه.
كيف تضر القمامة الذكية المجتمع العلمي
تنتهك القمامة الذكية عدة جوانب رئيسية من العملية العلمية:
- تسد البحث: يضيع الباحثون ساعات في قراءة القمامة الواضحة بدلاً من العثور على الأعمال ذات الصلة
- تشوش على المراجعة من قبل الأقران: عندما ينمو الحجم، ينخفض جودة المراجعة — لا يوجد ببساطة مراجعون كافون
- تقوض الثقة: عندما يكون هناك الكثير من القمامة في المستودع، يبدأ المجتمع العلمي بفقدان الثقة في سلطة المنصة
تكون المشكلة حادة بشكل خاص في المجالات الجديدة مثل تطبيقات نماذج اللغة الكبيرة، حيث يجرب كل باحث مع GPT ويحمل النتائج إلى المستودع.
كيف سيتم اكتشاف المنتهكين
تركز السياسة الجديدة على تحديد "العلامات الواضحة" — المصنوعات الواضحة للذكاء الاصطناعي، والأخطاء الصيغية، والأنماط الغريبة والمتكررة، والبيانات الرقمية السخيفة في الجداول أو غياب التجارب الحقيقية. لا تستخدم ArXiv عن قصد كاشفات الذكاء الاصطناعي الآلية لأنها غير موثوقة وتنتج الكثير من الإنذارات الكاذبة. بدلاً من ذلك، تعتمد المنصة على الحكم البشري للمراقبين والمجتمع العلمي. الحظر لمدة سنة واحدة عقوبة خطيرة بما يكفي لثني المؤلفين عن تحميل الأعمال الضعيفة. سيُطلب من المؤلفين أيضاً إضافة ملاحظة حول أدوات الذكاء الاصطناعي المستخدمة في بحثهم.
ماذا يعني هذا
هذا إشارة إلى أن المنصات العلمية الكبرى تبدأ بالدفاع الجاد عن نفسها ضد النفايات الرقمية. بالنسبة للباحثين الشرفاء، هذا نعمة — لن تضيع الأعمال القيمة في الضوضاء. بالنسبة للمؤلفين الذين كانوا يأملون في النشر التلقائي المجاني، الواقع الجديد قاس. تراهن ArXiv على رهان تاريخي مهم: المراجعة من قبل الأقران والمسؤولية البشرية تبقى أساس العلم، رغم ثورة الذكاء الاصطناعي.