Google Gemini 3 Deep Think: رقم قياسي جديد في اختبارات الذكاء العام
أعلنت Google عن تحديث لـ Gemini 3 Deep Think يركز على العلوم والهندسة. وكان الإنجاز الأبرز تحقيق 84.6% على معيار ARC-AGI-2، الذي يُعد "الامتحان الأخير" على…
معالج بواسطة الذكاء الاصطناعي من MarkTechPost؛ بتحرير Hamidun News
تعبر Google حدوداً جديدة في تطوير الذكاء الاصطناعي. أعلنت الشركة عن تحديث Gemini 3 Deep Think، الذي يحقق نسبة 84.6% في معيار ARC-AGI-2 — وهو اختبار يعتبره العلماء آخر عقبة جدية قبل تحقيق الذكاء العام. هذا ليس مجرد تحسن إضافي للنموذج، بل تحول أساسي في كيفية قيام الشبكات العصبية الاصطناعية بحل المشاكل المعقدة. بدلاً من مجرد توليد النصوص، يستخدم النظام الآن نمط التفكير العميق مع التحقق الداخلي، مما يسمح للآلة بفحص منطقها الخاص في الوقت الفعلي.
لفهم أهمية هذه الخطوة، يستحق تذكر ما حدث في الصناعة على مدى السنوات الماضية. تتفوق نماذج اللغة الكبيرة مثل GPT و Claude في توليد النصوص، لكنها غالباً ما تتعثر في المهام التي تتطلب استدلالاً منطقياً متعدد الخطوات والتحقق من النتائج. تم تصميم ARC-AGI-2 خصيصاً من قبل الباحثين كاختبار يقاوم مجرد توسيع النماذج — إنها مجموعة من مهام المنطق والتفكير المجرد التي تتطلب تفكيراً حقيقياً، وليس مجرد التنبؤ بالكلمة التالية. تعني نسبة 84.6% أن Gemini 3 Deep Think يحل أربعاً من كل خمس من هذه المهام بشكل صحيح، وهو ما كان مستحيلاً سابقاً حتى بالنسبة لأقوى الأنظمة.
تقنياً، يتم تحقيق ذلك من خلال آلية جديدة للتفكير الداخلي. لا يسرع النموذج بعد الآن لتقديم إجابة، بل يمر بعدة مراحل من التداول، مفتشاً كل خطوة من خطوات المنطق قبل صياغة الإجابة النهائية. إنه يشبه الطريقة التي لا يعلن فيها عالم الرياضيات ببساطة الإجابة، بل يعمل من خلال المسألة خطوة بخطوة، مدققاً في كل حساب. قام Google بدمج القدرة على التحقق الذاتي في النموذج، مما يقلل بشكل جذري من احتمالية الأخطاء المنطقية. هذا النهج قابل للتطبيق ليس فقط على الألغاز المجردة، بل أيضاً على مهام البحث العلمي والهندسة الحقيقية التي تتطلب تحليلاً عميقاً والتحقق من الفرضيات.
هذا بالذات هو السبب في أن Google يضع هذا التحديث كأداة للعلوم والهندسة، بدلاً من الترفيه. أصبح النموذج الآن قادراً على مساعدة الباحثين في تصميم الأنظمة المعقدة، والتحقق من الفرضيات العلمية، وحل مشاكل الهندسة التي تتطلب تحليلاً متعدد المستويات. قد يسرع ذلك تطوير مواد جديدة وأدوية وهندسات معالجات دقيقة وأنظمة معقدة أخرى، حيث يكلف كل خطأ وقتاً وأموالاً كبيرة.
ماذا يعني هذا لمستقبل AGI — الذكاء الاصطناعي العام؟ نسبة 84.6% في ARC-AGI-2 ليست خط النهاية، بل إشارة واضحة بأننا نتحرك ليس نحو مولدات نصوص أكثر قوة، بل نحو أنظمة قادرة على تفكير حقيقي. هذا نموذج يختلف عن ما يهيمن على السنوات الماضية. قد يكون الانتقال من التوسع إلى تريليونات من المعاملات إلى تطبيق آليات التحقق والتفكير خطوة بخطوة هو بالضبط ما نحتاجه للمزيد من التقدم.
ومع ذلك، يجب أن نكون حذرين مع صياغتنا. النسبة العالية في معيار واحد لا تعني أن AGI موجود بالفعل. يختبر ARC-AGI-2 نوعاً محدداً من الذكاء — التفكير المنطقي المجرد. سيتطلب الذكاء العام الحقيقي النجاح على جبهات عديدة أخرى: فهم السياق، والتعامل مع عدم اليقين، والتكيف مع حالات جديدة. غير أن إنجاز Google يدل على أن الطريق إلى ذلك يصبح أوضح. تتعلم النماذج ليس فقط التوليد، بل التفكير والتحقق والتبرير.
هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟
AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.