MarkTechPost→ المصدر

Google تدعو إلى التفكير بعمق أكبر لا لمدة أطول — وتخفض تكاليف الاستدلال إلى النصف

تشكك دراسة مشتركة من Google وجامعة فيرجينيا في الفرضية الأبرز خلال السنوات الأخيرة: كلما طالت سلسلة الاستدلال (Chain-of-Thought)، كانت إجابة النموذج أفضل…

معالج بواسطة الذكاء الاصطناعي من MarkTechPost؛ بتحرير Hamidun News
Google تدعو إلى التفكير بعمق أكبر لا لمدة أطول — وتخفض تكاليف الاستدلال إلى النصف
المصدر: MarkTechPost. كولاج: Hamidun News.
◐ استمع للمقال

على مدى السنوات الماضية، عاشت صناعة نماذج اللغات الكبيرة وفقاً لقاعدة غير معلنة: إذا كنت تريد إجابة أكثر دقة من النموذج على سؤال معقد، فاجعله يفكر لفترة أطول. أصبحت تقنية Chain-of-Thought، حيث يبني النموذج سلسلة من التفكير خطوة بخطوة قبل الإجابة النهائية، المعيار الذهبي. كان المطورون يطيلون طول هذه السلاسل، ويوسعون نوافذ السياق، وينفقون مزيداً من الموارد الحسابية على كل طلب. لكن بحثاً جديداً أجرته جامعة فيرجينيا وجوجل معاً يؤكد: لقد كنا نخلط بين الإطناب والذكاء طوال هذا الوقت.

الفكرة التي يقوم عليها العمل بسيطة خادعة. تساءل الباحثون: هل يقترب كل رمز إضافي في سلسلة التفكير فعلاً النموذج من الإجابة الصحيحة؟ أم أن جزءاً كبيراً من هذه الرموز هو ضوضاء معلومات وتكرار ووقوف في نفس المكان؟ للإجابة على هذا السؤال، قدمت الفريق مقياساً جديداً — نسبة التفكير العميق (Deep-Thinking Ratio)، أو معامل التفكير العميق. بدلاً من قياس طول التفكير بالرموز، يقيّم هذا المقياس ما نسبة التفكير التي تحتوي فعلاً على خطوات منطقية منتجة — تلك التي تقود إلى حل المشكلة بدلاً من ملء المساحة فقط.

كانت النتائج حاسمة. أظهر التحليل أنه في سلاسل التفكير الطويلة النموذجية لنماذج اللغات الكبيرة الحديثة، يحمل جزء ضخم من الخطوات الوسيطة أي حمل دلالي حقيقي. يمكن للنموذج أن يعيد صياغة نفس الفكرة عشرات المرات، ويعود إلى مراحل مغطاة بالفعل، ويولد شروحات زائدة عن الحاجة — وكل هذا يكلف أموالاً حقيقية. كل رمز إضافي في مرحلة الاستدلال — هذا وقت معالج الرسومات والكهرباء والتأخير للمستخدم النهائي. على نطاق الخدمات الكبيرة التي تعالج مليارات الطلبات، نتحدث عن مبالغ هائلة.

الإنجاز الرئيسي للبحث هو أنه من خلال تحسين عملية التفكير مع الأخذ في الاعتبار نسبة التفكير العميق، تمكنوا من تحقيق شيئين في نفس الوقت يعتبران عادة متعارضين. تحسنت دقة إجابات النموذج — لأن قطع الخطوات غير المنتجة يقلل فعلاً احتمال أن يتيه النموذج في تفكيره الخاص ويصل إلى استنتاج خاطئ. وانخفضت تكاليف الاستدلال الإجمالية بحوالي النصف — لأن النموذج يولد رموزاً أقل بكثير لكل طلب. هذا ليس تنازلاً بين الجودة والتكلفة، بل حالة نادرة حيث يحسن تحسين معامل واحد كليهما.

لفهم نطاق هذا الاكتشاف، يجدر تذكر السياق. تكلفة الاستدلال هي أحد الصداع الرئيسي للصناعة. تنفق شركات OpenAI وجوجل وAnthropics وغيرها مليارات الدولارات على البنية التحتية الحسابية، وجزء كبير من هذه النفقات يقع على توليد الإجابات للمستخدمين. تم تصميم نماذج مثل o1 و o3 من OpenAI، بالإضافة إلى Gemini مع التفكير الموسع من جوجل، بشكل خاص لسلاسل طويلة من التفكير. إذا اتضح أن نصف هذه التفكيرات يمكن حذفه دون مشاكل — أو بتعبير أدق، تعليم النموذج عدم توليدها في المقام الأول — فإن الأثر الاقتصادي سيقاس بمئات ملايين الدولارات سنوياً.

هناك أيضاً جانب نظري أعمق. يطرح البحث فعلياً الفكرة الأساسية لنموذج تحسين الاستدلال الذي هيمن في 2024-2025. إذا كان «التفكير لفترة أطول» لا يساوي «التفكير بشكل أفضل»، فإن السباق لتوسيع نوافذ السياق وزيادة الميزانيات الحسابية للتفكير هو طريق مسدود. بدلاً من ذلك، قد تحتاج الصناعة إلى التركيز على جودة كل خطوة تفكير بدلاً من عددها. هذا يعكس كيفية عمل التفكير البشري: يحل الخبير المشكلة ليس لأنه يفكر لفترة أطول من المبتدئ، بل لأن كل خطوة من خطوات تفكيره أكثر قصداً.

قد تظهر العواقب العملية للمطورين والمستخدمين بسرعة كبيرة. نسبة التفكير العميق هي مقياس يسهل نسبياً دمجه في خطوط أنابيب تدريب وتقييم النماذج الموجودة. يمكن توقع أن تبدأ المختبرات الكبرى في استخدام نهج مماثلة أثناء الضبط الدقيق، وسيستخدمها موفرو السحابة لتحسين تكاليف استدعاءات API. بالنسبة للمستخدمين النهائيين، هذا يعني إجابات أسرع وأكثر دقة بنفس السعر أو أقل.

يذكر بحث جوجل وجامعة فيرجينيا الصناعة بحقيقة مهمة من السهل نسيانها في سباق التوسع: الكفاءة لا تتعلق بـ «المزيد»، بل بـ «الأكثر دقة». نماذج المستقبل على الأرجح لن تكون تلك التي تفكر لفترة أطول، بل تلك التي تعرف كيفية التفكير بموضوعية.

ZK
Hamidun News
أخبار الذكاء الاصطناعي بدون ضوضاء. اختيار تحريري يومي من أكثر من 400 مصدر. منتج من جمال حميدون، رئيس الذكاء الاصطناعي في Alpina Digital.

هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟

AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.

ما رأيك؟
جارٍ تحميل التعليقات…