تفوقت AI من Google على أبطال الأولمبيادات في اختبار الرياضيات FirstProof
حقق قسم Google DeepMind قفزة مهمة في مجال الإثبات الآلي للنظريات. وسجل نموذج AI الجديد رقماً قياسياً في الاختبار الرياضي FirstProof، الذي تقارن صعوبته بمسائل…
معالج بواسطة الذكاء الاصطناعي من Jiqizhixin (机器之心)؛ بتحرير Hamidun News
اعتُبرت الرياضيات دائماً آخر حصن للذكاء البشري — مجال تتشابك فيه الحدس والتفكير الإبداعي والمنطق الصارم بشكل وثيق جداً، بحيث يبدو إعادة إنتاج هذه العملية بآلة مهمة فلسفية تقريباً. غير أن فريق Google DeepMind أثبت للتو أن هذا الحصن يسقط سريعاً. حقق نظام الذكاء الاصطناعي الذي طوروه رقماً قياسياً جديداً في اختبار FirstProof — أحد أصعب الاختبارات لمثبتات النظريات الآلية، وتتطابق مستويات صعوبة مهامها مع مسائل الأولمبياد الدولي للرياضيات. فائزو هذه المسابقات هم نخبة الرياضيات العالمية، أفضل العلماء من الطلاب والمدارس. الآن لديهم منافس لا يحتاج إلى النوم ولا يعرف قلق الرياضيين أمام الصفحة البيضاء.
لتقييم حجم ما حدث، من المهم فهم كيف يختلف FirstProof عن الاختبارات الأكاديمية المألوفة. إنه ليس مسابقة لتخمين الإجابات ولا سباق سرعة حسابية. يتطلب FirstProof من النظام ليس فقط تسمية النتيجة الصحيحة، بل بناء إثبات تم التحقق منه رسمياً — سلسلة من الخطوات المنطقية، يمكن التحقق من كل منها تلقائياً ولا تسمح بأي غموض. هذا هو بالضبط حيث تعثرت معظم نماذج اللغة تقليدياً: كانت قادرة على التفكير بشكل معقول، لكن ليس بشكل لا تشوبه شائبة. الفجوة بين «تقريباً صحيح» و«مثبت رياضياً» في هذا المجال ضخمة جداً.
كان الحل التقني الأساسي الذي أتاح النقلة هو دمج نهجين معماريين مختلفين بشكل أساسي. تم ربط نموذج لغة — قادر على التفكير المرن والاستكشافي — مع نظام التحقق الرسمي، الذي يلعب دور الحكم الصارم. الأول يولد فرضيات واستراتيجيات إثبات وخطوات وسيطة. الثاني يرفض فوراً السلاسل غير المنطقية. النتيجة تشبه تعايشاً بين عالم رياضيات مبدع ومراجع دقيق يعملان في الوقت الفعلي. طور الباحثون هذا النهج منذ فترة طويلة، لكن DeepMind هو من عثر على المقياس والمعمارية اللتين يعزز فيهما النظامان بعضهما البعض بدلاً من تعطيلهما.
تتجاوز أهمية هذا الإنجاز التصنيفات الأكاديمية بكثير. إثبات النظريات الآلي هو أداة أساسية مطلوبة في مجالات مختلفة عديدة. في هندسة البرمجيات، يسمح التحقق الرسمي بضمان صحة الكود رياضياً — وهذا حاسم بشكل خاص للأنظمة التي تدير الطائرات والأجهزة الطبية أو البنية التحتية المالية. في التشفير، يؤكد موثوقية بروتوكولات الأمان. في الرياضيات البحتة، يمكن لمثل هذه الأنظمة أن تساعد الباحثين على التحقق من التراكيب المعقدة التي تتطلب سنوات من التحقق اليدوي. حتى الآن، كانت كل هذه التطبيقات مقيدة بقيد واحد: تتطلب الأدوات الموجودة جهداً خبيراً ضخماً لـ«ترجمة» الأفكار الرياضية إلى لغة رسمية. يغير الذكاء الاصطناعي القادر على العمل بشكل مستقل على هذا المستوى المعادلة بشكل أساسي.
بالنسبة للصناعة الأوسع، تعمل هذه النتيجة كإشارة مهمة عن اتجاه التطور. بعد سنوات من هيمنة نماذج اللغة القادرة على الكتابة والتفكير بإقناع، لكنها غالباً ما تخطئ في الخطأ المنطقي الأولي، يبحث الباحثون بشكل متزايد عن معماريات هجينة حيث تعمل الشبكات العصبية جنباً إلى جنب مع المدققات الحتمية. تؤكد نتيجة DeepMind: هذا المسار يعمل، ويعمل بشكل مثير للإعجاب. يجري OpenAI و Anthropic والمختبرات الأكاديمية في جميع أنحاء العالم أبحاثاً مماثلة، لكن Google هي التي تضع المعيار اليوم في الاختبار الرياضي الأكثر رسمية.
بطبيعة الحال، النصر في معيار لا يعني أن الذكاء الاصطناعي مستعد لاستبدال الرياضيين — حتى على مستوى الأولمبياد. صياغة مشاكل جديدة واختيار اتجاهات البحث والقفزة البديهية إلى الفرضية الصحيحة — كل هذا يبقى منطقة بشرية. لكن الحدود تتحرك بثبات. ما أثبتته Google DeepMind في FirstProof ليس محاكاة للتفكير الرياضي، بل معادله الوظيفي في ظروف محددة بدقة. وعندما تتسع هذه الظروف، ستتحول الأسئلة من «هل يمكن للذكاء الاصطناعي إثبات النظريات» إلى «أي النظريات سيثبتها الذكاء الاصطناعي أولاً".
هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟
AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.