وكلاء AI vs RAG: كيف يعمل ReAct ولماذا نحتاج إلى أنظمة متعددة الوكلاء
لم تعد استجابة واحدة من LLM كافية: فالمهام الحقيقية تتطلب سلسلة من الإجراءات — جلب البيانات، اختيار الأداة، التحقق من النتيجة. وهذا بالضبط ما يفعله وكلاء AI…
معالج بواسطة الذكاء الاصطناعي من Habr AI؛ بتحرير Hamidun News
نماذج اللغة الكبيرة قادرة على توليد النصوص، لكن بالنسبة لمعظم المهام العملية، إجابة واحدة لا تكفي. يجب اتخاذ إجراء: طلب البيانات من مصدر خارجي، واختيار الأداة المناسبة، والتحقق من النتيجة — وإذا لزم الأمر، تصحيح الخطوة التالية. هذا بالضبط كيفية عمل وكلاء الذكاء الاصطناعي، وهذا هو السبب في أن النهج القائم على الوكلاء يصبح بسرعة المعيار الأساسي للأنظمة المبنية على نماذج اللغة الكبيرة.
الوكيل مقابل نموذج اللغة البسيط
نموذج اللغة الكلاسيكي هو سؤال وإجابة. طلب واحد، توليد واحد، توقف. الوكيل عبارة عن دورة: يقوم النموذج بالاستدلال، واختيار إجراء، والحصول على نتيجة من البيئة الخارجية، وتكرار العملية حتى يتم حل المهمة. الفرق الرئيسي عن أنظمة RAG (توليد معزز باسترجاع البيانات): يضيف RAG السياق من قاعدة معرفية قبل التوليد — وهذا إثراء سلبي. يقرر الوكيل بنفسه متى وماذا يطلب: يستدعي واجهات برمجية، ينفذ أكوادًا، يقرأ ملفات، يصل إلى خدمات خارجية. إنه لا يتلقى فقط تلميحًا — فهو يتصرف ويتكيف مع ما تعيده البيئة. فرق أساسي آخر: يمكن للوكيل تغيير خطته أثناء التنفيذ. إذا أرجعت عملية بحث نتيجة غير متوقعة، يعيد الوكيل صياغة الاستعلام أو ينتقل إلى أداة مختلفة. لا يمكن لـ RAG أن تفعل ذلك.
كيفية عمل ReAct
ReAct (الاستدلال والتصرف) هو أحد الأطر الأساسية والأكثر دراسة للوكلاء. يمر النموذج بالتتابع عبر ثلاث مراحل في دورة واحدة:
- Thought — التفكير: يصيغ النموذج ما هو معروف بالفعل وما يجب القيام به في الخطوة التالية
- Action — اختيار الأداة واستدعاؤها: البحث على الويب، الوصول إلى الآلة الحاسبة، طلبات واجهة برمجية أو استعلامات قاعدة البيانات
- Observation — تحليل النتيجة المرتجعة والانتقال إلى التكرار التالي
تتكرر الدورة حتى يتم الحصول على إجابة نهائية. يعمل ReAct بشكل جيد على سلاسل الاستدلال القصيرة والمتوسطة — 3–7 خطوات. على المهام الطويلة، تتراكم الأخطاء، لذلك غالبًا ما يتم دمجه مع آليات إضافية: التحقق من النتائج الوسيطة، حدود عدد الخطوات، صيغة الإخراج الصريحة. قوة ReAct هي الشفافية. يمكن التحقق من كل خطوة وتصحيح أخطائها: يمكنك رؤية ما "فكر" فيه النموذج، وما استدعاه، وما تلقاه في المقابل.
الأنظمة متعددة الوكلاء
يقتصر الوكيل الواحد: على نافذة السياق، التخصص، وقت التنفيذ. عندما تكون المهمة معقدة أو تتطلب عملاً متوازيًا، تدخل الأنظمة متعددة الوكلاء الساحة — وهي بنية يعمل فيها عدة وكلاء معًا. بنية نموذجية لنظام متعدد الوكلاء:
- Orchestrator — وكيل التحكم الذي يحلل المهمة ويوزع المهام الفرعية على العمال
- Workers — وكلاء متخصصون لوظائف محددة: البحث، توليد الأكواد، معالجة البيانات، الاتصالات
- Critic / Verifier — وكيل التحقق الذي يفحص نتائج الوكلاء الآخرين قبل التجميع النهائي
تتيح هذه البنية تنفيذ المهام الفرعية المستقلة بشكل متوازٍ وتقلل بشكل كبير من خطر تراكم الأخطاء، التي قد تنمو من خطوة إلى خطوة في سلسلة واحدة.
« يصبح النهج القائم على الوكلاء بسرعة المعيار الأساسي لأنظمة متقدمة
مبنية على نماذج اللغة الكبيرة » — من سلسلة « الحد الأدنى الأساسي ».
مثال عملي: وكيل في Google Colab
في ختام سلسلة « الحد الأدنى الأساسي »، يتم عرض وكيل وظيفي ضئيل — مساعد تخطيط الرحلات المنفذ في Google Colab. كل شيء قابل للتكرار: لا توجد تبعيات مخفية، إعدادات قليلة. يمكن للوكيل البحث عن معلومات حول الوجهات من خلال أدوات خارجية، وإنشاء مسار وفقًا لتفضيلات المستخدم، وتوضيح التفاصيل في الحوار إذا كان الطلب غامضًا. يوضح هذا المثال بوضوح كيف يختلف الوكيل الوظيفي بشكل أساسي عن مجرد استدعاء نموذج اللغة بموجه طويل: لا يخمن — بل يطلب ويتلقى ويتكيف.
ماذا يعني هذا
توقفت وكلاء الذكاء الاصطناعي عن كونها مفهومًا أكاديميًا. أصبح فهم الأنماط الأساسية — ReAct، فصل المتحكم/العامل، الأنظمة متعددة الوكلاء — ضروريًا للجميع الذين يبنون المنتجات على نماذج اللغة الكبيرة. بدون هذا الأساس، من الصعب التنبؤ بمكان فشل النظام، وشبه مستحيل تصحيح أخطائه.
هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟
AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.