Implicit CoT: كيف تعلمت الشبكات العصبية التفكير دون فتح الفم
عندما قدمت OpenAI نموذج o1، واجه العالم للمرة الأولى حقاً مفهوم Chain of Thought. اعتدنا على أن الشبكات العصبية تنتج إجابات فوراً، لكن o1 أجبرتنا على…
معالج بواسطة الذكاء الاصطناعي من Jiqizhixin (机器之心)؛ بتحرير Hamidun News
عندما قدمت OpenAI نموذج o1، واجه العالم للمرة الأولى حقاً مفهوم Chain of Thought. اعتدنا على أن الشبكات العصبية تنتج إجابات فوراً، لكن o1 أجبرتنا على الانتظار بينما تهمس لنفسها، تعمل عبر الاحتمالات المختلفة. بدا الأمر وكأنه سحر، لكن لهذا السحر ثمن عالي: وقت انتظار واستهلاك ضخم للرموز في الاستدلال الداخلي الذي قد لا يراه المستخدم أبداً. هذا ما يُسمى Explicit CoT، والذي أصبح عكازة مؤقتة للنماذج التي تحاول محاكاة المنطق البشري.
ومع ذلك، يعد البحث الجديد في مجال الاستدلال الضمني (Implicit CoT) بتحريرنا من هذه الزيادة. تساءل الباحثون: هل تحتاج النماذج حقاً إلى «التعبير عن» كل خطوة منطقية للوصول إلى الاستنتاج الصحيح؟ اتضح أنها لا تحتاج. من خلال التدريب المتخصص وتقطير المعرفة، يمكن تعليم الشبكات العصبية إخفاء هذه المراحل الوسيطة داخل حالاتها المخفية (hidden states). هذا يغير النموذج بشكل أساسي: بدلاً من إنفاق الموارد الحسابية على توليد نصوص لا يقرأها أحد، يوجه النموذج هذه الموارد نحو تشكيل الإجابة الصحيحة مباشرة.
لفهم حجم التغيير، تخيل الفرق بين طالب يحل معادلة بكتابة كل خطوة وأستاذ يرى الحل على الفور. OpenAI o1 هو طالب مجتهد. تكنولوجيا Implicit CoT هي محاولة لتنمية أستاذ منه. نقل الاستدلال من الإخراج النصي إلى مجال الحساب الداخلي يسمح بتحقيق نفس الدقة في المهام الرياضية والمنطقية، لكن مع توفير هائل للموارد. بالنسبة للصناعة، هذا يعني أن النماذج المستقبلية ستكون ليست فقط أكثر ذكاءً، بل أسرع بكثير وأرخص في التشغيل.
يحل هذا التحول أيضاً مشكلة "التلوث" السياقي. عندما يولد النموذج آلاف الرموز من الاستدلال، يمكن أن يتشابك في كلماته الخاصة. يسمح الاستدلال المخفي بتجنب هذا الضجيج. استخدم الباحثون طرق التعلم المعزز لإجبار النموذج على "ضغط" أفكاره. نتيجة لذلك، تتعلم الشبكة العصبية التعامل مع التجريدات ذات الترتيب الأعلى دون تقسيمها إلى تفسيرات نصية بدائية. هذا هو في الواقع خطوة نحو إنشاء ما أطلق عليه دانيال كانيمان اسم «النظام 1» - التفكير السريع والتلقائي والبديهي الذي يستند مع ذلك إلى تحضير منطقي عميق.
بالنسبة للمطورين والشركات، هذه إشارة إلى أن سباق الحصول على كمية المعاملات قد يفسح المجال أخيراً لسباق الحصول على الأناقة المعمارية. إذا كنا نعتقد سابقاً أن حل المشاكل المعقدة يتطلب نوافذ سياقية ضخمة وحساب لا نهائي في مرحلة الاستدلال، فمن الواضح الآن: الكفاءة تكمن في قدرة النموذج على استيعاب معرفته. نحن على أعتاب ظهور جيل جديد من LLMs سيكون لديها عمق o1 لكن سرعة GPT-4o. هذا ليس مجرد تحسين؛ بل هو نضج التكنولوجيا التي أخيراً تتعلم التفكير في نفسها قبل قول أي شيء.
الخلاصة: كانت حقبة «الأفكار الطويلة» المنطوقة بصوت عالٍ مجرد مرحلة انتقالية. هل يمكن للنماذج المفتوحة أن تتقن Implicit CoT أسرع من إغلاق OpenAI لهذه الفجوة في منتجاتها التجارية؟
هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟
AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.