وزارة الخزانة الأمريكية تسعى للوصول إلى نموذج Mythos من Anthropic لاختبار الثغرات الأمنية
تريد وزارة الخزانة الأمريكية الوصول إلى نموذج Mythos من Anthropic لبدء البحث عن الثغرات. هذا ليس عن التنفيذ من أجل الكفاءة، بل عن اختبارات الأمان: تريد…
معالج بواسطة الذكاء الاصطناعي من Bloomberg Tech؛ بتحرير Hamidun News
يسعى قسم الخزانة الأمريكية للحصول على إمكانية الوصول إلى نموذج Mythos من Anthropic لبدء البحث عن الثغرات الأمنية في النظام قبل نشره على نطاق أوسع في سيناريوهات حساسة. إن حقيقة مثل هذا الطلب نفسه تدل على أن وكالات الحكومة الأمريكية تنتقل من نقاشات عامة حول الذكاء الاصطناعي إلى الاختبار العملي لنماذج محددة من حيث الموثوقية والسيطرة والمقاومة للإساءة. وفقاً للمعلومات المتاحة، يحاول فريق التكنولوجيا في قسم الخزانة الحصول على الوصول إلى Mythos.
يبدو أن الهدف ليس تطبيق النموذج من أجل الإنتاجية، بل تحديداً تدقيق أمني: يريد المتخصصون فهم مكان فشل النظام، وكيف يتصرف تحت الاستعلامات غير النمطية، وما إذا كان يمكن إجباره على تجاوز حدوده الخاصة. لم يتم الكشف عن التفاصيل الرسمية حول صيغة الاختبار حتى الآن، كما لا توجد تأكيدات بأن Anthropic قد منحت الوصول بالفعل. لم يتم الكشف أيضاً عن المواصفات التقنية لنموذج Mythos نفسه، لذا من السابق لأوانه الحكم على ما إذا كان المقصود منتجاً داخلياً أو متخصصاً أو قيد الإعداد للنشر على نطاق أوسع.
بالنسبة للحكومة الأمريكية، يبدو مثل هذا العمل منطقياً. كلما أخذت الوكالات الحكومية الذكاء الاصطناعي في الاعتبار بشكل أكثر نشاطاً لتحليل البيانات وإعداد المستندات ودعم الموظفين وأتمتة العمليات الداخلية، كلما ارتفعت تكلفة الأخطاء. في حالة الأنظمة الفيدرالية، قد تكون المشاكل أكثر من مجرد سمعة.
قد تحدث تسريبات للمعلومات الحساسة أو التحايل على آليات الحماية أو توليد توصيات غير موثوقة أو سلوك النموذج الذي يمكن استثارته بشكل متعمد. لذلك، الوصول إلى النموذج في مرحلة مبكرة مهم تماماً مثل الوعود العامة للمطور بشأن الأمان. إذا بدأ فريق الخزانة فعلاً الاختبار، فسيبحث على الأرجح عن الثغرات النمطية في الأنظمة التوليدية الحديثة.
يتضمن مثل هذا الاختبار عادة محاولات تجاوز القيود المدمجة والحصول على إجابات خطيرة واستخراج التعليمات المخفية واختبار المقاومة لهجمات حقن المطالبات وتقييم كيفية تعامل النموذج مع البيانات السرية وسيناريوهات السياق الطويل. هذا لا يعني أن مثل هذه المشاكل قد تم اكتشافها بالفعل في Mythos. بل يتعلق الأمر بمجموعة معيارية من الأسئلة التي تنطبق اليوم على أي نموذج متقدم، خاصة إذا كان من المحتمل أن تستخدمه منظمات ذات مسؤولية عالية.
يستحق اختيار الشركة اهتماماً خاصاً. لقد بنت Anthropic منذ فترة طويلة سمعة كمطور يعطي الأولوية للأمان والسلوك المنضبط للنماذج. إذا كانت حتى مثل هذه الأنظمة تثير الطلب الحكومي على الوصول المباشر للاختبار المستقل للإجهاد، فهذا يؤكد معياراً جديداً في العلاقات بين السلطات وشركات الذكاء الاصطناعي: الضمانات العامة غير كافية؛ الاختبار الفعلي من قبل العميل أو المنظم ضروري.
بالنسبة للمطورين أنفسهم، هذا يعني ضغطاً إضافياً—يجب أن يستعدوا ليس فقط للمنافسة في السوق بل أيضاً للتدقيق التقني المتزايد صرامة. تهم القصة أيضاً لأنها تغير منطق الاهتمام الحكومي بالذكاء الاصطناعي نفسه. حتى وقت قريب، كان المسؤولون يناقشون في الأساس القواعد والمخاطر والأساليب الإطارية.
الآن ينزاح التركيز نحو النماذج المحددة والسيناريوهات المحددة والثغرات المحددة. هذه مرحلة أكثر عملية: بدلاً من التنظيم المجرد، هناك محاولات لفهم كيف يتصرف النظام في ظروف الإجهاد الحقيقية. بالنسبة للسوق، يشير هذا إلى أن الثقة في النماذج المتقدمة سيتم بناؤها بشكل متزايد ليس على العروض التقديمية بل على نتائج الاختبارات المستقلة.
الخلاصة الرئيسية بسيطة: تبدأ الحكومة في التعامل مع أنظمة الذكاء الاصطناعي المتقدمة بنفس الطريقة التي تتعامل بها مع التكنولوجيا الأخرى الحرجة—أولاً الوصول، ثم الاختبار، وفقط بعد ذلك النشر الممكن. بالنسبة لـ Anthropic، قد يصبح هذا اختباراً لنضج نهجها في الأمان، وبالنسبة لكل السوق—علامة على أن عصر الوعود غير الرسمية ينتهي وعصر التحقق الإلزامي يبدأ.
هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟
AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.