The Verge→ المصدر

دعوى من ناشرين ضد Meta: تدريب Llama على نسخ غير قانونية من الكتب والمجلات

رفع ناشرون دعوى ضد Meta بسبب تدريب Llama على نسخ غير قانونية. وتتّهم خمس دور نشر كبرى (Macmillan, McGraw Hill, Elsevier, Hachette, Cengage) والكاتب Scott Turow

دعوى من ناشرين ضد Meta: تدريب Llama على نسخ غير قانونية من الكتب والمجلات
المصدر: The Verge. كولاج: Hamidun News.
◐ استمع للمقال

تمت مقاضاة ميتا من قبل خمسة ناشرين كبار والكاتب سكوت توروو. الاتهام خطير: يُزعم أن الشركة ارتكبت "أحد أكبر انتهاكات حقوق النشر في التاريخ" عند تدريب نموذج Llama على نسخ مقرصنة من الكتب والمجلات العلمية.

كيف دربت ميتا Llama

قامت ميتا بنسخ الكتب والمجلات العلمية بشكل متعمد من مواقع القرصنة (LibGen و Anna's Archive و Sci-Hub و Sci-Mag وغيرها) واستخدمت هذه المادة لتدريب Llama بدون إذن من المؤلفين وأصحاب الحقوق. يؤكد الناشرون في الدعوى أن هذا تم بقصد، وليس عن طريق الصدفة. كان المنطق بسيطاً: توفر مواقع القرصنة المحتوى مجانياً، بينما تكلف الترخيصات المال. اختارت ميتا حلاً عقلانياً من الناحية الاقتصادية - تجاوز القنوات القانونية لاستحواذ المحتوى والتنزيل مباشرة من مصادر غير قانونية. لم تكن هذه حادثة منعزلة. نحن نتحدث عن عملية منهجية: البحث عن مواقع القرصنة والتنزيل والرفع إلى مجموعة بيانات التدريب. كانت الشركة تعلم ما كانت تفعله، وفعلت ذلك بشكل متعمد.

من رفع الدعوى

رفعت الدعوى خمسة من أكبر ناشري العالم:

  • ماكميلان — الأدب والكتب المدرسية والمنشورات العلمية
  • ماكجراو هيل — الأدب المهني والمحتوى التعليمي
  • إلسيفير — المجلات العلمية في جميع أنحاء العالم
  • هاشيت — واحدة من "الخمسة الكبرى" للناشرين الأمريكيين
  • سينجيدج — المحتوى التعليمي والكتب المدرسية

بالإضافة إلى الكاتب سكوت توروو، مؤلف الكتب الأكثر مبيعاً "The Burden of Proof" و "Presumed Innocent". هذه لحظة مهمة: هذا ليس مجرد نزاع شركة حول المال. في الدعوى، هناك صوت منفصل لمؤلف، مما يعطي المطالبات الشرعية والوزن العاطفي. القضية لا تتعلق فقط بأرباح الشركات، بل بحقوق المبدعين الفرديين.

لماذا هذا مهم

على السطح، هذا نزاع قانوني حول المال وحقوق النشر. في الواقع، يتعلق الأمر بقواعد اللعبة في عصر الذكاء الاصطناعي. السؤال بسيط: إذا كانت ميتا تستطيع تنزيل محتوى الآخرين من مواقع القرصنة والتدريب عليها بدون عواقب، فلماذا يجب على المؤلفين والناشرين أن يثقوا بحماية أعمالهم؟

تضع الدعوى سابقة: لا تستطيع شركات الذكاء الاصطناعي الاستيلاء على المحتوى الإبداعي دون عقاب.

"هذا أحد أكبر حالات انتهاك حقوق النشر في التاريخ"، تقول الدعوى.

كيف سيتطور الأمر

قد تستمر المحاكمة لسنوات. ستدافع ميتا على الأرجح عن نفسها بالاستشهاد بالاستخدام العادل أو بحجة أن المحتوى من مواقع القرصنة موجود بالفعل في المجال العام. لكن هذه الحجج ضعيفة في هذا السياق: اختارت الشركة بشكل متعمد مصدر محتوى غير قانوني، وكانت تعلم ذلك ولم تحاول التفاوض. حتى لو طالت المحاكمة، فإنها تغير بالفعل ديناميكيات السوق. ستبدأ شركات الذكاء الاصطناعي الأخرى (OpenAI و Google و Microsoft و Anthropic) على الأرجح في الابتعاد عن استخدام المحتوى غير القانوني بوضوح والتحول إلى الترخيص. سيطالب الناشرون بتعويض عن استخدام أعمالهم في تدريب نماذج اللغة الكبيرة.

ماذا يعني هذا

هذه الدعوى رمز لنهاية حقبة من "التدريب المجاني" الصامت على محتوى الآخرين. في السابق، كانت مثل هذه الأشياء تحدث في الظل، الآن هي على الملأ. من المرجح أن يحدث شيئان في نفس الوقت: ستتفاوض بعض الشركات مع الناشرين والمؤلفين (وستدفع مقابل البيانات)، بينما ستخسر أخرى في المحكمة (وستدفع أكثر). نتيجة لذلك، سيتم إعادة هيكلة السوق وفقاً لقواعد جديدة. الذكاء الاصطناعي لن يكون تكنولوجيا "مجانية"، بل سيتطلب ترخيصاً ومدفوعات. قد يؤدي هذا إلى تباطؤ تطور الذكاء الاصطناعي، لكنه عادل لأولئك الذين يتم استخدام عملهم في التدريب.

ЖХ
Hamidun News
أخبار الذكاء الاصطناعي بدون ضوضاء. اختيار تحريري يومي من أكثر من 400 مصدر. منتج من جمال حميدون، رئيس الذكاء الاصطناعي في Alpina Digital.
ما رأيك؟
جارٍ تحميل التعليقات…