نمط ReAct (ReAct Pattern)
ReAct (التفكير + العمل) هو إطار عمل لتوجيه وكلاء الذكاء الاصطناعي يتناوب بين خطوات التفكير الطبيعية واللغوية والإجراءات المنفصلة لاستخدام الأدوات، مما يسمح للنموذج بملاحظة نتيجة كل إجراء وتحديث تفكيره قبل المتابعة.
ReAct هي بنية وكيل تتناوب بين نوعين من العمليات: التفكير (إنشاء فكر باللغة الطبيعية حول الحالة الحالية والخطوة التالية التي يجب القيام بها) والعمل (تنفيذ عملية ملموسة مثل البحث عبر الويب أو استعلام قاعدة البيانات أو تنفيذ الكود). تم تقديم الإطار بواسطة Yao وآخرون في ورقة عام 2022، 'ReAct: Synergizing Reasoning and Acting in Language Models'، المقدمة في ICLR 2023، وأصبح منذ ذلك الحين أحد أكثر القوالب المعتمدة على نطاق واسع لبناء وكلاء الذكاء الاصطناعي.
في حلقة ReAct، ينتج النموذج 'فكرة' — التفكير الداخلي حول حالة المهمة — متبوعًا بـ 'إجراء' يستدعي أداة خارجية. تعيد البيئة 'ملاحظة'، والتي يتم إلحاقها بنافذة السياق. ثم ينتج النموذج الفكرة التالية، مستنيرة بتلك الملاحظة، وتتكرر الدورة حتى يحكم النموذج بأن المهمة مكتملة. تسمح هذه البنية المتشابكة للوكيل بتصحيح المسار بشكل ديناميكي بدلاً من الالتزام مقدمًا بخطة ثابتة لا يمكنها دمج معلومات جديدة.
يعالج النمط قيدًا أساسيًا من توجيه chain-of-thought الثابت: لا يمكن للنموذج الحصول على معلومات خارجية جديدة في منتصف الرد. بدمج التفكير باستدعاءات الأدوات الحقيقية، تمكن ReAct المهام التي تتطلب استرجاع بيانات مباشر أو حسابات تفاعلية أو ملاحة متعددة الخطوات من خلال بيئة خارجية. أثر الفكرة والإجراء والملاحظة قابل للقراءة من قبل الإنسان أيضًا، مما يجعل من السهل بكثير تصحيح أخطاء الوكيل عن أنابيب استدعاء الأدوات غير الشفافة حيث يكون التفكير الداخلي مخفيًا.
بحلول 2026، تدعم حلقات على طراز ReAct معظم أطر عمل الوكيل الإنتاجية، بما في ذلك وكلاء LangChain و LangGraph و Claude tool-use API من Anthropic و Assistants API من OpenAI مع مفسر الكود والبحث عن الملفات. الملحقات مثل Reflexion تضيف خطوة نقد ذاتي وتحديث الذاكرة بعد إكمال المهمة. تسمح المتغيرات متعددة الوكلاء لوكيل ReAct واحد بإنشاء وكلاء فرعيين متخصصين كـ 'إجراءات' له. التقييدات العملية الأساسية هي الكمون—تضيف كل دورة تفكير-عمل رحلة ذهاب واستقبال استدلال كاملة واحدة على الأقل—وزيادة نافذة السياق حيث تتراكم الآثار عبر المهام الطويلة.