Machine Learning Mastery→ المصدر

المكدس التقني لوكلاء AI: LLM، الأوركسترة، الذاكرة المتجهية والأدوات

وكلاء AI ليسوا مجرد LLM. تحت الغطاء، لدى كل واحد عدة طبقات: منسّق (LangChain وAutoGen وCrewAI)، وذاكرة متجهية (Pinecone وChroma)، وأدوات لتنفيذ إجراءات…

معالج بواسطة الذكاء الاصطناعي من Machine Learning Mastery؛ بتحرير Hamidun News
المكدس التقني لوكلاء AI: LLM، الأوركسترة، الذاكرة المتجهية والأدوات
المصدر: Machine Learning Mastery. كولاج: Hamidun News.
◐ استمع للمقال

وكيل الذكاء الاصطناعي ليس مجرد استدعاء لنموذج لغوي. خلف كل وكيل مستقل تكمن بنية متعددة الطبقات، واختيار كل مكون يحدد ما إذا كان النظام سيعمل بشكل موثوق وقابل للتنبؤ به مع مهام العالم الحقيقي.

طبقات مكدس الوكلاء

في الأساس يوجد نموذج لغوي — GPT-4o أو Claude 3.5 Sonnet أو Gemini 1.5 أو بدائل مفتوحة المصدر مثل Llama 3 و Mistral. وهو المسؤول عن التفكير المنطقي. يحدد اختيار النموذج سقف قدرات الوكيل: النموذج الأقوى يتعامل بشكل أفضل مع المهام متعددة الخطوات، لكنه أكثر تكلفة وأبطأ في التنفيذ.

فوق نموذج اللغة الكبير توجد طبقة التنسيق — إطار عمل أو كود مخصص يدير الدورة "فكر → اختر الأداة → نفذ → قيّم → استمر". أكثر أطر العمل شيوعاً هي: LangChain (نظام بيئي غني من التكاملات)، LlamaIndex (التركيز على RAG والعمل مع البيانات)، AutoGen من Microsoft (الحوار بين عدة وكلاء)، CrewAI (وكلاء لهم أدوار والعمل بروح الفريق). كل واحد يوازن بين المرونة وتعقيد الإعدادات بطريقة مختلفة. بالنسبة لحلول الإنتاج، يتم كتابة التنسيق بشكل متزايد من الصفر — هذا يسهل التحكم في سلوك الوكيل في كل خطوة.

الذاكرة: من الرموز إلى قواعس البيانات المتجهة

وكيل بدون ذاكرة يسقط كل السياق بعد كل محادثة. الذاكرة قصيرة المدى هي نافذة السياق للجلسة الحالية: كل ما يناسب الرموز، يتذكره النموذج الآن. لكن النافذة محدودة، فمن المكلف الاحتفاظ بكل شيء فيها، وفي الجلسات الطويلة تمتلئ بسرعة.

تتم تنفيذ الذاكرة طويلة المدى من خلال قواعس البيانات المتجهة: Pinecone و Chroma و Weaviate و Qdrant و pgvector. يقوم الوكيل بتحويل الحقائق إلى متجهات وتخزينها، ثم استرجاعها عند الحاجة من خلال البحث الدلالي. هذه طريقة عمل RAG (Retrieval-Augmented Generation): بدلاً من تخزين السياق كله في الرموز، يستعلم النظام فقط عما هو ذو صلة لخطوة معينة. هذا يقلل التكلفة ويقلل احتمالية الهلوسات.

المستوى الثالث هو التخزين المؤقت الدلالي: إذا أجاب الوكيل بالفعل على استعلام مماثل، يعيد النظام النتيجة المخزنة مؤقتاً دون استدعاء جديد لنموذج اللغة. في سيناريوهات الإنتاج ذات الأنماط المتكررة، هذا يقلل بشكل ملحوظ من زمن التأخير وتكلفة البنية التحتية.

الأدوات والإجراءات

تحول الأدوات وكيلاً من "دردشة ذكية" إلى نظام يفعل شيئاً حقيقياً. بدونها، يقتصر الوكيل على المعرفة من بيانات التدريب فقط، التي تصبح قديمة بسرعة. مجموعة نموذجية في وكيل الإنتاج:

  • البحث على الويب في الوقت الفعلي (Brave Search و Tavily و SerpAPI)
  • تنفيذ الكود (Python REPL و E2B Sandbox)
  • العمل مع الملفات والجداول والملفات وقواعس البيانات
  • طلبات HTTP إلى واجهات برمجية خارجية والخدمات المؤسسية
  • أتمتة المتصفح (Playwright و Puppeteer)

الحلقة الوصل هي استدعاء الدالة: يصف النموذج أي أداة يجب استدعاؤها وبأي الحجج، ينفذ المنسق الاستدعاء ويعيد النتيجة إلى السياق. تتكرر دورة "فكر — تصرف — لاحظ" حتى اكتمال المهمة أو حتى تكون هناك حاجة للتدخل البشري.

مكون منفصل وغالباً ما يتم التقليل من تقديره هو المراقبة. في الإنتاج، من المهم أن نفهم لماذا اتخذ الوكيل قراراً معيناً وأين فشل. تلتقط أدوات التتبع مثل LangSmith و Langfuse كل خطوة، وتسمح بمقارنة إصدارات الموجهات وقياس جودة الإجابات.

ماذا يعني هذا

مكدس التكنولوجيا لوكيل الذكاء الاصطناعي هو مجموعة من المقايضات الهندسية الملموسة، وليس تجريداً. الاختيار الصحيح للإطار والطبقة الذاكرة والأدوات يحدد ما إذا كان الوكيل موثوقاً في الإنتاج أم أنه سيهلس ويتعطل في منتصف الطريق نحو الهدف. مع خروج أنظمة الوكلاء من المختبرات إلى المنتجات الحقيقية، يصبح فهم كل طبقة من طبقات المكدس مهارة أساسية لمطوري تطبيقات الذكاء الاصطناعي.

ZK
Hamidun News
أخبار الذكاء الاصطناعي بدون ضوضاء. اختيار تحريري يومي من أكثر من 400 مصدر. منتج من جمال حميدون، رئيس الذكاء الاصطناعي في Alpina Digital.

هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟

AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.

ما رأيك؟
جارٍ تحميل التعليقات…