Merriam-Webster وEncyclopedia Britannica تقاضيان OpenAI بسبب 100 ألف مقال
رفعت Merriam-Webster وEncyclopedia Britannica دعوى قضائية ضد OpenAI. وتقولان إن الشركة استخدمت من دون إذن نحو 100 ألف مقال محمي بحقوق الطبع والنشر لتدريب…
معالج بواسطة الذكاء الاصطناعي من TechCrunch؛ بتحرير Hamidun News
قدمت قاموس مريام ويبستر وموسوعة بريتانيكا دعوى قضائية ضد شركة أوبن إيه آي، متهمة الشركة بانتهاك ضخم لحقوق النشر. وفقاً للمدعين، استخدمت أوبن إيه آي ما يقرب من 100 ألف مقالة محمية بحقوق النشر لتدريب نماذج اللغة الكبيرة الخاصة بها دون إذن أو تعويض. يعتبر قاموس مريام ويبستر من أقدم وأكثر قواامسات اللغة الإنجليزية سلطة، وقد تأسس عام 1831.
ظهرت موسوعة بريتانيكا في وقت أبكر: نُشرت منذ عام 1768 وظلت على مدى قرنين ونصف الموسوعة الرئيسية باللغة الإنجليزية في العالم. خلال هذا الوقت، أنشأ محررو كلا المؤسستين أحد أشمل المجموعات النصية المرجعية والتي تم التحقق منها بدقة شديدة. إن هذا النوع من البيانات بالذات—الدقيقة والمراجعة عدة مرات والمرتبطة بتعريفات وتواريخ محددة—مفيد بشكل خاص عند تدريب نماذج اللغة التي يجب أن تقدم إجابات موثوقة من الناحية الحقائقية.
تكمن جوهر الادعاءات فيما يلي: أدرجت أوبن إيه آي بشكل منهجي مواد من هذه المنشورات في مجموعات بيانات التدريب الخاصة بها لأنظمة النماذج اللغوية الكبيرة دون إبرام اتفاقيات ترخيص. وفقاً للدعوى القضائية، يتعلق الأمر بما يقرب من 100 ألف مقالة—ليست عينة عشوائية من الشبكات المتاحة للعموم، بل اقتراض موجه واسع النطاق لمحتوى تم إنشاؤه بشكل احترافي. تطلبت عملية إنشاء هذه المواد سنوات من العمل من قبل آلاف علماء المعاجم والباحثين والمحررين العلميين والخبراء القطاعيين.
يتم الآن استخدام كل هذا العمل بشكل أساسي كوقود لمنتج تجاري—دون دفع وبدون موافقة. تندرج الدعوى ضمن موجة أوسع من المطالبات القانونية ضد أوبن إيه آي. في السابق، قدمت مطالب مماثلة صحيفة نيويورك تايمز ووكالات أدبية كبرى ورابطة المؤلفين الأمريكيين وجمعيات الصحفيين المستقلين وعدد من الكتاب المشهورين.
تبقى المنطق العام لجميع هذه الدعاوى متسقة: بنت شركات الذكاء الاصطناعي عملاً تجارياً تبلغ قيمته مليارات الدولارات على أساس العمل الفكري للآخرين—دون دفع فلس واحد أو طلب إذن. يتنامى حجم المطالبات: إذا كان في السابق يقدمها مؤلفون أفراد، فإن المؤسسات التي ترتبط علاماتها التجارية ارتباطاً مباشراً بالموثوقية والسلطة الأكاديمية تدخل الآن الساحة. لم يعد الأمر مجرد قصة عن حقوق النشر—بل إنها قصة حول من يملك سمعة الموثوقية في عصر الذكاء الاصطناعي.
ترد شركة أوبن إيه آي تقليدياً بنفس الحجة: التدريب على البيانات المتاحة للعموم يندرج ضمن مبدأ الاستخدام العادل (fair use) بموجب قانون حقوق النشر الأمريكي. حجة إضافية من الشركة: لا تعيد إنتاج النصوص الأصلية حرفياً، بل فقط تدرب الأنماط الإحصائية عليها. لم تحصل أي من هذه الحجج بعد على تأكيد قضائي نهائي.
تقع معظم القضايا في مراحل مبكرة، ولم تضع المحاكم بعد موقفاً موحداً حول مكان رسم خط الحدود لمبدأ الاستخدام العادل فيما يتعلق بنماذج اللغة الكبيرة. إن مشاركة ناشري القواامسات والموسوعات هي ما يجعل هذه الدعوى ذات أهمية خاصة. منتجهم ليس أخباراً مكتوبة تحت ضغط الموعد النهائي، وليس مدونات منشورة لكسب الوصول.
إنه معرفة مرجعية يتم إنشاؤها ببطء وبتكلفة عالية: مُتحقق منها وموثقة بدقة مع معايير تحريرية صارمة. تشكل هذه البيانات أساس الإجابات التي يقدمها الذكاء الاصطناعي كحقائق. لا يمكن أن يكون من قبيل المصادفة أن تم تضمينها في مجموعة بيانات التدريب.
وليس من قبيل المصادفة أنها تجد نفسها الآن في قلب الإجراءات القانونية الأكثر مبدئية في تاريخ الذكاء الاصطناعي التوليدي. ستحدد نتائج هذه القضايا قواعد اللعبة لكامل الصناعة. ستلزم نصرة أصحاب الحقوق شركات الذكاء الاصطناعي برخصة البيانات المستخدمة في التدريب بأثر رجعي—مع عواقب مالية غير متوقعة.
ستنشئ نصرة مبدأ الاستخدام العادل سابقة تحرم المؤلفين فعلياً من النفوذ في عصر الذكاء الاصطناعي التوليدي. بينما تبقى النتيجة غير واضحة، فإن شيئاً واحداً واضح: لا يمكن للصناعة أن تبني المستقبل إلى الأبد على ماضي الآخرين—دون الاتفاق على شروط معينة.
هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟
AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.