أطلقت Anthropic Claude Mythos 5 و Fable 5 مع حماية من الهجمات السيبرانية
أطلقت Anthropic نسختين من Claude: Mythos 5 للشركاء الموثوقين و Fable 5 للجمهور العام. تأتي Fable 5 مع حماية مدمجة من الهجمات السيبرانية — حيث يتم دمج القيود…
معالج بواسطة الذكاء الاصطناعي من Wired؛ بتحرير Hamidun News
قدّمت Anthropic نسختين جديدتين من Claude: Mythos 5 للمنظمات الموثوقة و Fable 5 للجمهور العام. تم تطوير النسخة الثانية بشكل خاص مع آليات تعيق استخدامها في الهجمات السيبرانية.
التقسيم حسب الغرض
تسير Anthropic في طريق تقسيم نماذج الذكاء الاصطناعي الخاصة بها حسب الجمهور المستهدف والمخاطر المحتملة. Claude Mythos 5 مخصصة للشركاء الموثوقين، بما في ذلك شركات الأمن السيبراني والمنظمات البحثية والعملاء المؤسسيين الذين يحتاجون إلى الإمكانيات الكاملة للنموذج اللغوي بدون قيود. Claude Fable 5 متاحة للوصول المفتوح للجمهور العام. دمجت الشركة في هذه النسخة قيوداً خاصة موجهة نحو منع استخدام النموذج في الهجمات السيبرانية وأغراض ضارة أخرى. هذه استراتيجية تتيح لـ Anthropic تقديم أداة ذكاء اصطناعي قوية، لكنها تقلل المسؤولية المباشرة عن استخدامها المحتمل بشكل غير قانوني.
الحماية المدمجة في المعمارية
الفرق الرئيسي في Fable 5 هو أن آلية الحماية لا تعتمد على مجرد تعليمات أو حظر على مستوى واجهة برمجة التطبيقات (والتي يسهل تجاوزها)، بل على تغييرات في معمارية النموذج وعملية التدريب نفسها. تعتقد Anthropic أن هذا النهج أكثر موثوقية وديمومة من أنظمة التحكم على مستوى التطبيق.
- قيود مدمجة في عملية تدريب النموذج
- تغييرات معمارية تعيق فئات معينة من المهام
- إمكانية وصول عام بدون حواجز ترخيص، لكن مع قيود
على عكس المرشح البسيط الذي يمسك الطلبات الضارة في الوقت الفعلي، فإن القيود المدمجة تغير سلوك النموذج على المستوى الأساسي. هذا يعني أنه حتى عند محاولات التحايل، ستكون النظام أقل فائدة للهجمات السيبرانية.
الضغط المتزايد على الصناعة
يعكس قرار Anthropic الضغط المتزايد من المنظمين والسياسيين والجمهور الذين يطالبون شركات الذكاء الاصطناعي بتحمل المسؤولية عن الضرر المحتمل. على خلفية النقاشات حول إمكانية استخدام النماذج اللغوية الكبيرة في الهجمات السيبرانية، يبدو إطلاق نسخة «آمنة» كحركة استراتيجية. تواجه شركات أخرى، بما في ذلك OpenAI و Google، ضغوطاً مماثلة وتطور نهجها الخاص في التحكم. ومع ذلك، لا يوجد معيار موحد في الصناعة حتى الآن. يبدو نهج Anthropic ذو التقسيم ثنائي المستويات عملياً: إعطاء الشركاء الموثوقين وصول كامل، وتقديم نسخة محدودة لكن آمنة للجمهور.
ماذا يعني هذا
توضح Anthropic أن أمان الذكاء الاصطناعي بدأ ينظر إليه كخط منتج منفصل وليس كوحدة إضافية. قد يصبح هذا اتجاهاً في الصناعة: بدلاً من نموذج واحد للجميع، ستقدم الشركات عدة نسخ بمستويات قيود مختلفة. ومع ذلك، تبقى أسئلة حول الفعالية العملية للقيود المدمجة وما إذا كان المستخدمون سيوافقون على القيود مقابل وعود الأمان.
هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟
AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.