Wired→ المصدر

أوقفت Meta تعاونها مع Mercor بعد تسرب بيانات عن تدريب نماذج AI

تحقق عدة من أكبر مختبرات AI في حادث أمني لدى مزود البيانات Mercor، وقد أوقفت Meta بالفعل تعاونها مع الشركة. وتشمل البيانات المهددة معلومات سرية عن أساليب…

معالج بواسطة الذكاء الاصطناعي من Wired؛ بتحرير Hamidun News
أوقفت Meta تعاونها مع Mercor بعد تسرب بيانات عن تدريب نماذج AI
المصدر: Wired. كولاج: Hamidun News.
◐ استمع للمقال

وجدت شركة Mercor، وهي مزود بيانات رائد في صناعة الذكاء الاصطناعي، نفسها في قلب حادث أمني خطير. بدأت عدة مختبرات ذكاء اصطناعي كبرى تحقيقات داخلية، وأعلنت Meta — إحدى العملاء الرئيسيين للشركة — عن تعليق التعاون. كانت البيانات السرية المتعلقة بأساليب تدريب نماذج الذكاء الاصطناعي معرضة للخطر: معلومات تحرس شركات التكنولوجيا بعناية باعتبارها أهم أصل تنافسي لها.

Mercor عبارة عن منصة تربط شركات الذكاء الاصطناعي بآلاف المتخصصين في تصنيف وتعليق البيانات في جميع أنحاء العالم. البيانات المصنفة بدقة — النصوص المختارة بعناية والحوارات والصور المزودة بعلامات الجودة — هي التي تشكل أساس تدريب نماذج اللغة الحديثة. بدون تعليق عالي الجودة، لن توجد GPT-4 ولا Claude ولا Llama.

كانت Mercor تخدم اللاعبين الرئيسيين في الصناعة وأصبحت على مدار عدة سنوات أحد أبرز الموردين في هذا القطاع. السؤال الرئيسي للحادث هو ما الذي قد يتم الكشف عنه بالضبط. لا يتعلق الأمر بمجرد تسرب قاعدة بيانات العملاء أو البيانات الشخصية.

تعليمات للمعلقين وفئات البيانات وأنظمة التفضيل — علامات RLHF التي تدرب النماذج على تقديم الإجابات المرغوبة — كل هذا يكشف بشكل غير مباشر القرارات المنهجية لشركة معينة. يكلف تطوير مثل هذه العمليات مئات الملايين من الدولارات ويتطلب سنوات من الخبرة المتراكمة. إن حل هذه البيانات مقارن في القيمة بتسرب الكود المصدري.

ردت Meta بسرعة وبشكل وقائي — علقت العمل مع Mercor في انتظار توضيح كامل للحادث. هذا هو البروتوكول القياسي عند الاشتباه في اختراق سلسلة التوريد: الاستمرار في نقل البيانات الحساسة إلى مورد بحالة أمان غير معروفة هو مخاطرة غير مبررة. خاصة أن Meta تستثمر عشرات المليارات في أنظمة الذكاء الاصطناعي الخاصة بها، بما في ذلك عائلة نماذج Llama المفتوحة ومساعد Meta AI.

تجري مختبرات الذكاء الاصطناعي الأخرى التي عملت مع Mercor أيضاً مراجعاتها الخاصة. يبقى غير واضح: ما الذي تم اختراقه بالضبط وفي أي حجم، وما إذا كان الحادث نتيجة هجوم سيبراني خارجي أو خطأ أمني داخلي. لم تكشف Mercor ولا الشركات المعنية بعد التفاصيل التقنية لما حدث.

يكشف الحادث عن ثغرة نظامية في صناعة الذكاء الاصطناعي. يعني الاستعانة بمصادر خارجية على نطاق واسع لتصنيف البيانات أن في سلسلة الإنتاج لكل نموذج ذكاء اصطناعي كبير تشارك عشرات وأحياناً مئات من شركات الوسطاء. تحصل كل واحدة منها على إمكانية الوصول إلى أجزاء من المنهجية السرية لعملائها.

وفي الوقت نفسه، لا توجد معايير أمان موحدة للصناعة لمثل هؤلاء الموردين: لا توجد عمليات تدقيق إلزامية ولا متطلبات تشفير ولا بروتوكولات إشعار الحوادث. بالنسبة إلى Mercor، هذه أزمة سمعة. يقوم عمل الشركة بالكامل على ثقة مختبرات الذكاء الاصطناعي، وهذه الثقة الآن موضع تساؤل.

حتى إذا أظهر التحقيق أن الضرر الفعلي كان محدوداً، فإن مجرد حدوث الحادث والرد العام من Meta سيغير الموقف التفاوضي للشركة في السوق. يجب أن يسرع هذا الحادث النقاش حول معايير الأمان الإلزامية لموردي البيانات. المنهجية التدريبية هي سلاح تنافسي رئيسي في سباق الذكاء الاصطناعي.

لا يمكن بعد الآن التعامل مع موردي البيانات كمقاولين عاديين: يجب أن يتطابق مستوى التفتيش والمراقبة مع مستوى الوصول إلى المعلومات السرية. لم يتم الكشف بعد عن نطاق الحادث والقائمة الكاملة بالشركات المتأثرة. ستصبح تفاصيل التحقيق معروفة في الأيام القادمة.

ZK
Hamidun News
أخبار الذكاء الاصطناعي بدون ضوضاء. اختيار تحريري يومي من أكثر من 400 مصدر. منتج من جمال حميدون، رئيس الذكاء الاصطناعي في Alpina Digital.

هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟

AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.

ما رأيك؟
جارٍ تحميل التعليقات…