كلود ومليون كتاب ميت: كيف التهم الذكاء الاصطناعي تراثنا
هل تتذكر ذلك شهر نوفمبر الهادئ في عام 2022، عندما لم يكن العالم يعرف بعد ما هي هلوسات الشبكات العصبية؟ لم تطلق OpenAI منتجًا فحسب في ذلك الوقت، بل أطلقت…
معالج بواسطة الذكاء الاصطناعي من The Verge؛ بتحرير Hamidun News
هل تتذكر ذلك شهر نوفمبر الهادئ في عام 2022، عندما لم يكن العالم يعرف بعد ما هي هلوسات الشبكات العصبية؟ لم تطلق OpenAI منتجًا فحسب في ذلك الوقت، بل أطلقت رصاصة البداية، وهي دعوة جعلت كل عمالقة وادي السيليكون يتخلون عن أكوانهم الافتراضية المريحة ويهرعون. في هذا السباق، أصبح Claude من Anthropic أحد المتنافسين الرئيسيين على التاج. لكن خلف الواجهة اللامعة لذكاء اصطناعي مهذب وآمن يكمن مقبرة ملايين الكتب التي لم يأذن لأحد باستخدامها. لنكن صرحاء: Claude موجود في شكله الحالي فقط لأن الصناعة قررت تجاهل قواعد اللياقة من أجل السرعة.
تشبه صناعة الذكاء الاصطناعي اليوم عصر الرأسمالية الهمجية، حيث بدلاً من مناجم الذهب هناك مصفوفات بيانات ضخمة. عندما أصبح من الواضح أن ChatGPT ليست مجرد لعبة، بل أساس اقتصاد جديد، تراجعت مسألة الأخلاقيات إلى الخلفية. لتعليم نموذج التفكير، لا يكفي النصوص من Reddit أو Wikipedia. يحتاج إلى هياكل معقدة ومفردات غنية وسياقات عميقة لا توجد إلا في الأدب عالي الجودة. وهكذا تحولت ملايين الكتب المحمية بحقوق التأليف والنشر إلى "بيانات تدريبية" دون موافقة منشئيها. ألم تعتقد أن الشبكات العصبية تتعلم من حكايات الأطفال الخيالية من المجال العام؟
تضع Anthropic نفسها غالبًا على أنها "الرجال الطيبون" في عالم الذكاء الاصطناعي، مع التركيز على السلامة والأخلاق. لكن المفارقة هي أن حتى النماذج الأكثر "أماناً" مبنية على أساس من المحتوى المريب. أصبحت مجموعات البيانات مثل Books3، التي تحتوي على مئات الآلاف من العناوين من المكتبات السرية، هي المكون السري الذي سمح لـ Claude بمواكبة وفي بعض الحالات تجاوز تطورات سام ألتمان. بالنسبة للشركات، كانت هذه رياضيات بسيطة: إما أن تستخدم كل ما هو متاح، أو سيفعلها منافسك أولاً ويسيطر على السوق. في هذا المنطق، الكتب مجرد فحم لتغذية موقد التقدم.
لماذا يهم هذا الآن؟ نحن نقترب من لحظة ستنفد فيها البيانات "البشرية" ببساطة. قد قرأت الشبكات العصبية بالفعل تقريبًا كل شيء كتبناه على مدى القرون الماضية. والآن يكتشف المؤلفون - من الروائيين إلى كتاب تقنيين - أن سنوات عملهم أصبحت وقوداً مجانياً لأنظمة قد تحل محلهم في المستقبل. هذا ليس مجرد سرقة محتوى، بل تحول أساسي في فهم الملكية الفكرية. إذا كنت تشتري كتابًا لقراءته من قبل، فإن الشركات الآن تأخذها لتعليم آلة محاكاة أسلوبك ومنطق تفكيرك.
الدعاوى القضائية من مؤلفين مثل سارة سيلفرمان أو جورج مارتن هي مجرد غيض من فيض. المشكلة هي أن النظام القانوني بطيء، بينما تتحرك صناعة الذكاء الاصطناعي بسرعة الضوء. بينما ستقضي المحاكم سنوات في البت في ما إذا كان تدريب شبكة عصبية "استخداماً عادلاً"، فقد تم تدريب النماذج بالفعل وحفظت الأوزان والتزمت مليارات الدولارات من الاستثمار. راهنت Anthropic واللاعبون الآخرون على أن الفائزين لا يحاكمون. أو على الأقل أن العقوبات لانتهاك حقوق الطبع والنشر ستكون قطرة في المحيط مقارنة برأس المال السوقي المستقبلي.
في النهاية، لدينا تعايش غريب. يستطيع Claude تحليل وثيقة قانونية معقدة لك أو كتابة مقالة بأسلوب بروست بالضبط لأنه "ابتلع" آلاف النصوص المماثلة دون السؤال. حصلنا على أداة رائعة، لكن ثمن إنشاؤها هو تخفيف قيمة العمل البشري كما هو. لم تخدم الكتب كمجرد أساس، بل تم تحويلها إلى هاش رقمي، من الذي تم تشكيل واجهات جديدة مريحة للاستهلاك. والآن يتعين علينا العيش مع هذا، واستخدام ثمار هذا الاستيلاء الفكري.
النقطة الأساسية: بنت Anthropic و OpenAI إمبراطورياتهما على بيانات لا تمتلكانها، والآن لا عودة للوراء. هل ستتمكن الصناعة من البقاء إذا كان عليها فعلاً الدفع مقابل كل كتاب "تم قراءته"؟
هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟
AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.