Anthropic Blog→ المصدر

Anthropic تحدّث سياسة التوسع المسؤول — نظام حماية مرن لنماذج الذكاء الاصطناعي المتنامية

نشرت Anthropic تحديثًا جوهريًا لسياسة إدارة مخاطر الذكاء الاصطناعي (سياسة التوسع المسؤول). بدلاً من اتباع نهج موحد، تقدم الشركة نظام حماية متناسب ومرن: مستويات

معالج بواسطة الذكاء الاصطناعي من Anthropic Blog؛ بتحرير Hamidun News
Anthropic تحدّث سياسة التوسع المسؤول — نظام حماية مرن لنماذج الذكاء الاصطناعي المتنامية
المصدر: Anthropic Blog. كولاج: Hamidun News.
◐ استمع للمقال

نشرت Anthropic تحديثًا لسياسة التوسع المسؤول — سياسة إدارة المخاطر عند تطوير أنظمة ذكاء اصطناعي قوية. يمثل هذا التحديث الجوهري نهجًا أكثر مرونة وتفصيلاً، مع الحفاظ على المبدأ الأساسي: لن تقوم الشركة بتدريب أو نشر نماذج إلا بعد التأكد من أن المخاطر في مستوى مقبول.

لماذا تم تحديث السياسة

نشرت Anthropic قبل عام الإصدار الأول من سياسة التوسع المسؤول، التي طورتها لإدارة مخاطر أنظمة الذكاء الاصطناعي المتنامية. لكن عام من التطبيق العملي أظهر الحاجة إلى نهج أكثر مرونة. تراقب الشركة ليس فقط القدرات التقنية للنماذج، بل أيضًا مخاطرها المحتملة وعواقبها.

تراقب Anthropic عدة فئات من التهديدات بشكل متزامن. هذه تشمل مشاكل كلاسيكية مثل نشر المعلومات المضللة والتحريض على العنف والاحتيال — وكلها مغطاة بسياسة الاستخدام الخاصة بالشركة. لكن سياسة التوسع المسؤول تركز على سيناريوهات كارثية أكثر طموحًا قد تنشأ عندما تصل النماذج إلى مستوى معين من الاستقلالية والقدرة على المناورات المعقدة.

تأخذ السياسة المحدثة في الاعتبار الخبرة العملية والنهج المطبقة في صناعات أخرى عالية المخاطر — الطيران والطاقة النووية والعقاقير. يسمح هذا بالاستعداد بشكل أفضل لسرعة تطور الذكاء الاصطناعي المتسارعة وبناء أنظمة حماية تتسع مع التكنولوجيا.

كيفية تشكيل مستويات ASL

يشكل مبدأ الحماية المتناسبة أساس النظام الجديد: يجب أن تنمو تدابير الأمان مع المخاطر. أدخلت Anthropic معايير مستويات سلامة الذكاء الاصطناعي (معايير ASL) — مجموعات متدرجة من المتطلبات التقنية والإجرائية، مستوحاة من معايير السلامة البيولوجية الدولية التي تُستخدم في المختبرات للعمل مع المواد الخطرة. يبدأ النظام بـ ASL-1 للنماذج ذات القدرات الأساسية (على سبيل المثال، روبوتات متخصصة للشطرنج أو البحث السريع عن المعلومات) ويرتفع إلى ASL-2 و ASL-3 وما بعده مع نمو الإمكانيات والمخاطر المحتملة. يتطلب كل مستوى أعلى متطلبات أكثر صرامة:

  • المراقبة والتسجيل المحسّن لجميع العمليات التي تجريها النموذج
  • اختبارات أمان أولية أكثر صرامة قبل النشر
  • طبقات تحكم إضافية في الوصول والعزل والتجزئة
  • عمليات تدقيق مستقلة إلزامية والفحوصات من قبل خبراء الأمان الخارجيين
  • إعادة تقييم متكررة للمخاطر المحتملة مع ظهور بيانات جديدة

في الوقت الحالي، تعمل جميع نماذج Anthropic بموجب معيار ASL-2، الذي تعتبره الشركة انعكاسًا لأفضل الممارسات في الصناعة اليوم.

عتبات القدرات — متى تكون الاستعدادية الكاملة ضرورية

بدلاً من المعايير الغامضة والذاتية، حددت Anthropic عتبات محددة، أو عتبات القدرات — قدرات محددة للنموذج، عند الوصول إليها تتطلب تدابير أمان أكثر قوة ومستوى ASL جديد. حتى الآن، تم تحديد عتبتين رئيسيتين. الأولى هي البحث والتطوير المستقل للذكاء الاصطناعي: إذا تمكنت النموذج من إجراء مهام بحثية معقدة بشكل مستقل في مجال الذكاء الاصطناعي، والتي عادة ما تتطلب خبرة بشرية وحدس، فقد يؤدي ذلك إلى تسريع تطور الذكاء الاصطناعي بطرق غير متوقعة. يتم ذكر العتبة الثانية في الوثيقة الأصلية، لكن وصفها الكامل لم يتم الكشف عنه حتى الآن. تترك الشركة إمكانية توسيع هذه القائمة مع فهمها بشكل أفضل للتأثير الفعلي للقدرات الجديدة عمليًا.

ما يعنيه هذا

تثبت Anthropic أن أمان الذكاء الاصطناعي لا يجب أن يكون إما حصارًا غير عقلاني أو غياب تام للسيطرة. بدلاً من ذلك، تبني الشركة نظامًا قابلاً للتوسع ينمو مع التكنولوجيا ويتكيف مع المخاطر الفعلية. مثل هذا النهج مهم لمطورين آخرين أيضًا. إذا حصلت أفكار Anthropic على اعتراف واسع في المجتمع، فقد تصبح معيارًا قياسيًا فعليًا للصناعة. هذا مهم بشكل خاص للمنظمين الذين يبحثون حاليًا عن أطر عملية لمراقبة أنظمة الذكاء الاصطناعي.

ZK
Hamidun News
أخبار الذكاء الاصطناعي بدون ضوضاء. اختيار تحريري يومي من أكثر من 400 مصدر. منتج من جمال حميدون، رئيس الذكاء الاصطناعي في Alpina Digital.

هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟

AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.

ما رأيك؟
جارٍ تحميل التعليقات…