كيف تفادى الباحثون الحماية في نماذج الذكاء الاصطناعي: بسيط وخطير
أظهر الباحثون نتيجة محبطة: القيود المدمجة في نماذج الذكاء الاصطناعي الرسمية على إصدار محتوى محظور يتم تجاوزها بسهولة من خلال تعديل بسيط للنظام. وهذا يطرح…
معالج بواسطة الذكاء الاصطناعي من 3DNews AI؛ بتحرير Hamidun News
أظهر الباحثون ثغرة جدية في أمان أنظمة الذكاء الاصطناعي الحديثة: يمكن تجاوز القيود المدمجة على إصدار محتوى محظور بسهولة من خلال تعديل بسيط للنموذج.
كيفية عمل القيود الحالية
يقوم مطورو الذكاء الاصطناعي بتكوين النماذج بحيث ترفض الطلبات الموجهة للحصول على معلومات حول صنع الأسلحة أو العقاقير أو المتفجرات أو محتوى خطير آخر. يتم هذا على عدة مستويات: في مرحلة التدريب، تتعلم النموذج المواضيع المحرمة، وفي مرحلة الاستخدام، يتم تفعيل عوامل تصفية إضافية تحجب الطلبات المريبة. أصبح هذا النهج ممارسة معيارية لجميع أنظمة الذكاء الاصطناعي الكبرى، من GPT و Claude إلى النماذج المحلية. تستثمر الشركات موارد كبيرة للتأكد من أن النماذج آمنة وأخلاقية.
كيف تفادى الباحثون الحماية
غير أنه يتضح أن الحماية ليست موثوقة بالقدر الذي بدا. اكتشف الباحثون أن تعديلاً بسيطاً للنموذج يسمح برفع هذه القيود. بدلاً من إعادة تدريب النظام بأكمله، يكفي تغيير معاملات معينة أو استخدام تقنيات خاصة تجعل النموذج يتجاهل التعليمات الأمنية المدمجة. وهذا يشير إلى أن الحماية ليست سمة معمارية عميقة، بل هي بالأحرى طبقة خارجية يمكن تجاوزها.
- تعديل أوزان ومعاملات النموذج
- موجهات خاصة تتجاوز التعليمات
- التلاعب بالسياق وإعادة صياغة الطلبات
- استخدام الإصدارات المفتوحة من النماذج
المخاطر الأمنية
يخلق هذا الاكتشاف تحدياً جدياً للصناعة بأكملها. إذا كان يمكن تجاوز القيود في الإصدارات الرسمية من النماذج بسهولة، فهذا يعني أنه لا يوجد نظام محمي بالكامل. واستخدام الإصدارات المفتوحة أو المعدلة من النماذج يكون أكثر عرضة للخطر - حيث يمكن إدخال أي تعديلات إليها.
«إن تعديل هذه النماذج يسمح بإزالة جميع هذه القيود بسهولة معقولة»، كما
خلص الباحثون.
تثير هذه المسألة قلق الهياكل الحكومية والجهات التنظيمية: الاستخدام الأخلاقي للذكاء الاصطناعي يتطلب ليس فقط الحظر، بل حماية معمارية موثوقة لن يتم كسرها في غضون أيام أو أسابيع قليلة.
ماذا يعني هذا
تظهر نتائج الدراسة أن النهج الحالي لأمان الذكاء الاصطناعي يتطلب إعادة تفكير شاملة. ما نحتاجه ليس مجرد مرشحات على المدخلات والمخرجات، بل معمارية نموذج جديدة تماماً، حيث تكون القيود مدمجة على مستوى أساسي. وإلا فلن يتم حل المشكلة - بل ستزداد تعقيداً مع انتشار النماذج المفتوحة والإصدارات المحلية.
هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟
AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.