DeepMind و Yann LeCun يدفعان AGI نحو نماذج العالم — لماذا يثير هذا قلقاً أكثر من LLMs
قد تأتي AGI ليس من خلال نماذج لغة أكثر حواراً، بل من خلال نماذج العالم — أنظمة تتعلم فهم العالم المادي. يشير النص إلى JEPA من Yann LeCun و Genie من DeepMind…
معالج بواسطة الذكاء الاصطناعي من Habr AI؛ بتحرير Hamidun News
يقترح مؤلف النص أن ننظر إلى الطريق نحو الذكاء العام الاصطناعي ليس من خلال قفزة أخرى في نماذج الحوار، بل من خلال نماذج العالم — وهي أنظمة تتعلم فهم العالم المادي، وليس فقط إحصائيات الكلمات. في هذا المنطق، تبدو الهلوسات الحالية للذكاء الاصطناعي ليست طريقاً مسدوداً، بل مرحلة أولية لذكاء أكثر عمومية.
لماذا النص وحده غير كافٍ
الانتقاد الرئيسي للنماذج اللغوية الكبيرة الحالية بسيط: إنها تعمل بشكل رائع مع اللغة، لكنها تفتقر إلى تجربتها الخاصة في التفاعل مع الواقع. يمكن لهذه الأنظمة أن تصف بثقة فنجاناً يسقط من طاولة، لكن ليس لأنها "تفهم" الجاذبية، بل لأنها رأت كميات لا نهائية من النصوص حول حالات مشابهة. يسمي المؤلف هذه الحالة "دماغاً في برطمان": النموذج يعرف العالم من خلال الكلمات فقط، وليس من خلال العلاقات السببية والمساحة والفيزياء.
من هنا تأتي الأطروحة الرئيسية: قد لا يكون تكبير النماذج النصية وحده كافياً لتحقيق الذكاء العام الاصطناعي. إذا لم تتمكن النظام من بناء نموذج داخلي للعالم والتنبؤ بعواقب الإجراءات ونقل هذا الفهم إلى حالات جديدة، فستبقى أداة لغوية قوية جداً، لكنها ليست ذكاءً عاماً. لهذا السبب ينتقل الاهتمام من علم اللغة إلى البنى المعمارية التي تتعلم من الفيديو والحركة والتفاعل مع البيئة.
إلى أين تؤدي نماذج العالم
يقدم النص اتجاهين توضيحيين. الأول هو JEPA، بنية يان ليكون، حيث يتعلم النموذج التنبؤ ليس بالكلمة التالية، بل بحالة العالم. الفكرة هي أن يراقب الذكاء الاصطناعي، مثل الطفل، ما يحدث ويجمع تدريجياً فيزياء بديهية: ما الذي يسقط وما الذي يصطدم وما الذي يتغير بعد إجراء ما.
الثاني هو Genie من DeepMind، الذي يمكنه تحويل صورة واحدة إلى مشهد ثلاثي الأبعاد تفاعلي. هذا بالفعل خطوة من وصف العالم إلى محاكاته الداخلية. إذا بدأت هذه الأساليب بالدمج مع الأنظمة الذاتية والروبوتات، فسيكتسب النموذج ليس فقط الذاكرة والحوار، بل دورة "الإدراك — التنبؤ — الإجراء — التحقق من النتائج."
وفقاً لتقدير المؤلف، قد يظهر تأثير مثل هذا "الاستيقاظ" في غضون خمسة إلى عشرة سنوات. لا يتعلق الأمر بقفزة سحرية، بل بلحظة يبدأ فيها الذكاء الاصطناعي بالتخطيط ليس للعبارات بل للتدخلات الحقيقية في البيئة.
- JEPA يحول التعلم من الكلمات إلى الحالات والأحداث
- Genie يوضح كيفية بناء عالم تفاعلي من صورة واحدة
- رقائق الروبوتات مثل Nvidia Rubin توفر للذكاء الاصطناعي طريقة نحو "جسد"
- يجعل دمج المحاكاة والعامل التعلم من خلال الإجراء ممكناً
خطر الاستيقاظ
هنا يرسم المؤلف موازاة مع قصة العلوم الخيالية لـ فاسيلي جولوفاتشيف عن "الجني النائم": بينما تنام الفوقذكاء، فإن نبضاتها تغير الواقع بالفعل، لكن الخطر الحقيقي يبدأ في لحظة الاستيقاظ. عند تطبيقها على الذكاء العام الاصطناعي، هذا يعني الانتقال من الردود الغريبة في الدردشة إلى التخطيط المستقل في العالم المادي — من الإمدادات والطاقة إلى الروبوتات التي يمكنها التصرف بدون إيحاءات مستمرة من الإنسان.
"بالنسبة له قد لا نكون سوى ضوضاء بيولوجية."
هذه الصيغة تلتقط الخوف الرئيسي للنص: نظام فعال جداً لا يحتاج أن يكون شريراً ليصبح خطيراً. يكفي أن يحسّن المهمة بمنطق لا يمكن للإنسان أن يتابعه بالكامل. ما يبدو اليوم وكأنه "هذيان" غير منطقي من نموذج يمكن، في هذه الرؤية، أن يفسر كمحاولات مبكرة وناقصة لبناء صورة داخلية للعالم. المؤلف لا يؤكد أن مثل هذا السيناريو حتمي، لكنه يحذر: الثقة الزائدة في قصة الذكاء العام الاصطناعي قد تكون الخطأ الأكثر تكلفة.
ماذا يعني هذا
النص مهم ليس كتنبؤ بموعد ظهور الذكاء العام الاصطناعي، بل كتحول في إطار النقاش. السؤال لا يتعلق فقط بمدى إقناع الذكاء الاصطناعي في الكتابة، بل بموعد بدء فهمه للبيئة والتنبؤ بديناميكيتها والتصرف فيها بشكل مستقل. إذا تحول مركز الثقل فعلاً نحو نماذج العالم، فستركز النقاشات الرئيسية للسنوات القادمة ليس على برامج الدردشة، بل على الوكالة والروبوتات والسيطرة على الأنظمة التي تتعلم من العالم نفسه.
هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟
AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.