Google DeepMind تفوز بالفضية: الذكاء الاصطناعي يحل مسائل الأولمبياد، لكن بأي ثمن؟
بينما ينقسم العالم كله حول ما إذا كان ChatGPT سيتعلم يوماً عدم الخطأ في وصفات الكعك، قررت Google DeepMind محاولة شيء مقدس: الأولمبياد الدولي للرياضيات (IMO)…
معالج بواسطة الذكاء الاصطناعي من Jiqizhixin (机器之心)؛ بتحرير Hamidun News
بينما ينقسم العالم كله حول ما إذا كان ChatGPT سيتعلم يوماً عدم الخطأ في وصفات الكعك، قررت Google DeepMind محاولة شيء مقدس: الأولمبياد الدولي للرياضيات (IMO). أثارت نتائج AlphaProof و AlphaGeometry 2 الرعب في الصناعة: حلت الأنظمة أربع مسائل من ست، وهو ما يتوافق مع مستوى الفائز بالميدالية الفضية. بدا أنه لحظة التفرد، عندما هزم السيليكون أخيراً الكربون في المنطق النقي.
لكن إذا نظرنا عن كثب إلى التفاصيل، يبدو الانتصار أشبه بنصر بطولي على الظروف بدلاً من نزهة سهلة. كانت الرياضيات دائماً نقطة ضعف نماذج اللغة. تعمل نماذج اللغة الكبيرة العادية على الاحتمالات، محتملة الكلمة التالية، وهو ما في عالم الإثباتات الصارم يؤدي إلى هلوسات حتمية.
لحل هذه المشكلة، اتخذ مهندسو DeepMind مسار التهجين. يجمع AlphaProof بين مرونة التعلم المعزز مع الانضباط القاسي للغة التحقق الرسمية Lean. يسمح هذا للذكاء الاصطناعي ليس فقط بتخمين الإجابة، بل بكتابة كود يتحقق من نفسه في كل خطوة منطقية.
AlphaGeometry 2، بدوره، تلقى حقن قوي في شكل نموذج Gemini، مما سمح له بحل الألغاز الهندسية بسرعة تزيد عشرات المرات عن سلفه. لكن وراء بريق الميدالية الفضية تكمن حقيقة قاسية. بينما حل المشاركون الأحياء في الأولمبياد المسائل في جلستين مدة كل منهما أربع ساعات ونصف، احتاج الذكاء الاصطناعي إلى عدة أيام من الحسابات المستمرة لبعض الإثباتات.
يسلط هذا الضوء على المشكلة الرئيسية للأنظمة الحديثة: فهي غير فعالة بشكل هائل مقارنة بالدماغ البشري. نرى مثالاً كلاسيكياً على قطف الثمار الدانية. نعم، تعلم الذكاء الاصطناعي العمل ضمن الإطارات الصارمة للغات الرسمية، لكنه لا يزال ينفق موارد حسابية ضخمة حيث كل ما يحتاجه مراهق موهوب هو ورقة وساعتان من التفكير.
يبقى الفجوة في كفاءة الطاقة بين الذكاء البيولوجي والرقمي ضخمة. لماذا هذا مهم الآن؟ نحن نشهد تحولاً أساسياً في استراتيجية تطوير الذكاء الاصطناعي. أدركت الصناعة أن مجرد توسيع نطاق البيانات لم يعد يوفر مكاسب متفجرة في الجودة في المهام المعقدة حقاً.
المستقبل للأنظمة التي يمكنها التفكير والتحقق من استنتاجاتها. تقوم Google بجوهر بإنشاء ما يسمى النظام 2 للذكاء الاصطناعي: التفكير البطيء والمتعمد الذي يكمل التفكير السريع والحدسي للنظام 1 من روبوتات الدردشة العادية. هذا حاسم ليس فقط للرياضيات النقية، بل أيضاً للبرمجة والأمن السيبراني وتصميم أنظمة الهندسة المعقدة، حيث أن خطأ بت واحد قد يؤدي إلى كارثة.
مع ذلك، يعترف Demis Hassabis وفريقه بصراحة: عملية تدريب وتشغيل هذه النماذج لا تزال مؤلمة. لكي يعمل AlphaProof، يجب ترجمة المسائل يدويا إلى لغة Lean: الذكاء الاصطناعي لا يزال غير قادر على تفسير شروط المسائل بشكل مستقل باللغة الطبيعية بدقة كافية. حصلنا على أداة قوية لا تزال تتطلب جيش كامل من مهندسي الترجمة للعمل.
هذا يذكرنا بأول الحواسيب، التي احتلت قاعات كاملة وتطلبت بطاقات مثقوبة. الإمكانات ضخمة، لكن سيستغرق الأمر سنوات قبل ظهور عالم رياضيات في جيبك قادر على إجراء اكتشافات في الوقت الفعلي. الخلاصة: أثبتت Google DeepMind أن الذكاء الاصطناعي يمكنه التعامل مع المنطق من الدرجة الأعلى بدون أخطاء، لكن سعر هذا العصمة لا يزال فاحشاً.
هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟
AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.