Wired→ المصدر

مؤسس AlphaGo أسس شركة يونيكورن لبناء متعلمي ذكاء اصطناعي فائقين

ديفيد سيلفر، العالم الذي كان نظامه AlphaGo أول نظام يهزم بطل العالم في لعبة جو عام 2016، أسس شركة جديدة بتقييم مليار دولار. الهدف: إنشاء "متعلمين…

معالج بواسطة الذكاء الاصطناعي من Wired؛ بتحرير Hamidun News
مؤسس AlphaGo أسس شركة يونيكورن لبناء متعلمي ذكاء اصطناعي فائقين
المصدر: Wired. كولاج: Hamidun News.
◐ استمع للمقال

ديفيد سيلفر، العالم الذي أنشأ خوارزمية AlphaGo التي أصبحت في عام 2016 الأولى في التاريخ في هزيمة بطل العالم في لعبة Go، أعلن عن تأسيس شركة جديدة بقيمة تبلغ حوالي مليار دولار. الهدف منها هو بناء ما يسميه سيلفر بـ "المتعلمين الفائقين": أنظمة الذكاء الاصطناعي القادرة على إتقان المجالات المعقدة من المعرفة بشكل مستقل دون الاعتماد على مجموعات بيانات من صنع الإنسان. هذا تحدٍ مباشر للنموذج السائد في الصناعة، حيث يراهن جميع اللاعبين الرئيسيين على توسيع نماذج اللغة.

سيلفر هو أحد المهندسين الرئيسيين للذكاء الاصطناعي الحديث، وسيرته الذاتية تتحدث عن نفسها. أدى عمله في Google DeepMind إلى AlphaGo وفيما بعد إلى AlphaZero—خوارزمية أتقنت من الصفر لعبة الشطرنج والشوغي و Go دون رؤية حتى لعبة بشرية واحدة. بدلاً من التعلم من أمثلة جاهزة، كان النظام ينتج ويحلل بشكل مستقل ملايين الأوضاع الممكنة، ويكتشف استراتيجيات وصفها لاعبون محترفون بأنها فوق إنسانية.

هذه التجربة تشكل اقتناعه بما يجب أن يكون عليه الذكاء الاصطناعي من الجيل القادم.

الفكرة المركزية لسيلفر بسيطة وجذرية في آن واحد: نماذج اللغة الكبيرة—ChatGPT و Claude و Gemini وغيرها—محدودة بشكل أساسي بحقيقة أنها تتعلم حصرياً من نصوص وبيانات ينتجها البشر. وهذا يخلق سقفاً لا يمكن تجاوزه: الذكاء الاصطناعي لا يستطيع أن يتفوق على القدرات المعرفية لمبدعيه إذا كان يتغذى فقط على معرفتهم وأخطاؤهم. مجرد زيادة عدد المعاملات وحجم بيانات التدريب، كما يقول، لا يحل هذه المشكلة الأساسية—بل يوسعها فحسب.

البديل هو التعلم المعزز (reinforcement learning, RL). على عكس التعلم الخاضع للإشراف، حيث يتعلم النموذج استنساخ الإجابات الصحيحة من مجموعة بيانات مصنفة مسبقاً، يسمح التعلم المعزز لوكيل بالاستكشاف المستقل لفضاء الإمكانيات: تجربة الإجراءات والحصول على إشارات المكافأة وبناء استراتيجية تدريجياً. وهذا هو بالضبط كيفية عمل AlphaGo—وهذا النهج، كما هو مقتنع سيلفر، يفتح الطريق نحو ذكاء اصطناعي يتفوق على البشر في طيف واسع من المهام، وليس فقط في الألعاب المحددة مسبقاً.

لهذا الموقف حجج جادة تدعمه. تتحرك شركة OpenAI جزئياً في هذا الاتجاه مع نماذج التفكير في سلسلة o، التي تستخدم عناصر من التعلم المعزز للتحقق الذاتي من الإجابات. يستمر Google DeepMind في إجراء الأبحاث الأساسية في هذا المجال.

ومع ذلك، فإن الجزء الأكبر من موارد الصناعة لا يزال مركزاً على توسيع نماذج اللغة، وهو بالضبط ما يقف سيلفر في مواجهة مباشرة ضده بموقف معارض علنياً. تكمن الصعوبة الرئيسية مع التعلم المعزز خارج المهام الضيقة والمحددة بوضوح. بالنسبة للشطرنج، من البسيط تحديد دالة المكافأة: إذا فزت تحصل على مكسب.

لكتابة نص مقنع أو اتخاذ قرار عملي متوازن أو إجراء بحث علمي أصلي، فإن دالة المكافأة ليست واضحة. هذه بالضبط هي مشكلة الذكاء غير القابل للتعبير التي يجب على الشركة الجديدة حلها. التقييم بقيمة مليار دولار بدون منتج واحد في السوق يتحدث عن ثقل سمعة المؤسس.

في المناخ الاستثماري الحالي، عندما يدعي كل شركة ناشئة متخصصة في الذكاء الاصطناعي أهمية تاريخية، فإن اسم مبتكر AlphaGo هو في الوقت ذاته إثبات جاهز للمفهوم وتأمين للمستثمرين غير المستعدين للانتظار سنوات.

إذا كان سيلفر محقاً، فإن المرحلة التالية من سباق الذكاء الاصطناعي ستبدو مختلفة بشكل أساسي: بيانات بشرية أقل، تعلم ذاتي مستقل أكثر، محاكاة أقل—اكتشاف أكثر. الأنظمة القادرة على تشكيل المعرفة بشكل مستقل تتجاوز ما تعرفه البشرية—هذا هو رؤيته للمتعلمين الفائقين. ما إذا كانت الفكرة ستتجسد في منتج حقيقي، سيكشف الوقت. لكن حقيقة أن أحد المهندسين الرئيسيين للذكاء الاصطناعي الحديث يراهن علنياً ضد النموذج السائد هي بحد ذاتها إشارة ذات دلالة لكامل الصناعة.

ZK
Hamidun News
أخبار الذكاء الاصطناعي بدون ضوضاء. اختيار تحريري يومي من أكثر من 400 مصدر. منتج من جمال حميدون، رئيس الذكاء الاصطناعي في Alpina Digital.

هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟

AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.

ما رأيك؟
جارٍ تحميل التعليقات…