سلامة الذكاء الاصطناعي (AI Safety)
سلامة الذكاء الاصطناعي هي المجال المتعدد التخصصات الذي يهدف إلى ضمان عمل أنظمة الذكاء الاصطناعي بشكل موثوق وقابل للتنبؤ وبدون إلحاق ضرر غير مقصود، يشمل البحث التقني والسياسة والحكومة.
سلامة الذكاء الاصطناعي هي المجال الواسع المعني بتحديد وقياس وتخفيف الأخطار الناشئة عن أنظمة الذكاء الاصطناعي. وهي تشمل المشاكل قصيرة الأجل — مثل متانة النموذج والتحيز والإساءة للاحتيال أو نشر المعلومات المضللة — والمخاوف طويلة الأجل بشأن أنظمة الذكاء الاصطناعي القادرة الغاية التي تتصرف بطرق ضارة للإنسانية على نطاق واسع. يعتمد المجال على التعلم الآلي والعلوم المعرفية والفلسفة والسياسة العامة، وهو متميز لكن مرتبط ارتباطاً وثيقاً بتوافق الذكاء الاصطناعي.
يشمل بحث السلامة التقنية للذكاء الاصطناعي القابلية للتفسير (فهم الحسابات التي تؤديها النماذج بشكل داخلي ولماذا)، والمتانة (ضمان تصرف النماذج بشكل صحيح في ظل تغيير التوزيع والمدخلات المعادية)، والتوافق (ضمان متابعة الأنظمة للأهداف المقصودة)، وتقييمات القدرات — بروتوكولات الفريق الأحمر المنظمة التي تكشف عن قدرات خطيرة مثل مساعدة الهجمات السيبرانية أو توجيه تجميع الأسلحة البيولوجية قبل النشر. على جانب الحكومة، يشمل العمل على السلامة بطاقات النموذج والتدقيق من قبل جهات خارجية وسياسات النشر والأطر الدولية للتنسيق.
اكتسبت سلامة الذكاء الاصطناعي زخماً مؤسسياً بعد إطلاق نماذج اللغات الكبيرة مثل GPT-3 (2020) و ChatGPT (2022)، والتي أوضحت أن الذكاء الاصطناعي القادر يمكن إساءة استخدامه للاحتيال ونشر المعلومات المضللة وإنشاء محتوى ضار على نطاق واسع. بدأت الحكومات في الولايات المتحدة والاتحاد الأوروبي والمملكة المتحدة بفرض تقييمات السلامة لأنظمة الذكاء الاصطناعي الحدودية بين عامي 2023 و 2025، مستشهدة بمخاطر الإساءة قصيرة الأجل وسيناريوهات المخاطر الكارثية طويلة الأجل.
بحلول عام 2026، تعمل فرق سلامة الذكاء الاصطناعي المخصصة في جميع مختبرات الذكاء الاصطناعي الكبرى. يقوم معهد سلامة الذكاء الاصطناعي في المملكة المتحدة ومعهد سلامة الذكاء الاصطناعي في الولايات المتحدة (AISI) بتقييمات طرف ثالث لنماذج الحدود قبل النشر وبعده. تنشر كونسرتيا البحث المفتوح مجموعات تقييم مشتركة، وتُطلب تقييمات السلامة الرسمية قبل نشر الذكاء الاصطناعي عالي القدرات في قطاعات البنية التحتية الحرجة بما في ذلك الرعاية الصحية والطاقة والمالية في عدة ولايات قضائية.