LangChain Deep Agents يخفض تكاليف LLM بنسبة 80% عبر التخزين المؤقت للـ prompts
أضافت LangChain التخزين المؤقت التلقائي للـ prompts إلى Deep Agents، وهذا يخفض تكاليف التوكنات حتى 80%. يحدد إطار العمل المزود تلقائيًا ويفعّل الـ cache…
معالج بواسطة الذكاء الاصطناعي من LangChain Blog؛ بتحرير Hamidun News
يقلل LangChain Deep Agents تكاليف LLM بنسبة 80% من خلال تخزين الأسئلة المؤقت
أضاف LangChain التخزين المؤقت التلقائي للأسئلة إلى Deep Agents. وفقًا للشركة، يقلل هذا نفقات رموز LLM بنسبة تصل إلى 80% دون إعدادات إضافية أو تغييرات على كود الوكيل.
ما هو تخزين الأسئلة المؤقت ولماذا يحتاجه الوكلاء
تخزين الأسئلة المؤقت هو أسلوب يقوم فيه مزود النموذج بتخزين نسخة "مجمدة" من أجزاء السياق التي تتكرر بشكل متكرر. قد يكون هذا سؤالًا في النظام أو سجل المحادثة أو مجموعة كبيرة من المستندات المحملة. عند الطلب التالي إلى النموذج، لا يعالج المزود هذه الرموز مجددًا — بل يسترجعها من الذاكرة المؤقتة ويفرض رسومًا أقل بكثير عليها.
بالنسبة لتطبيق دردشة نموذجي، يوفر التخزين المؤقت فائدة معتدلة: السؤال في النظام عادة ما يكون قصيرًا. بالنسبة للوكلاء، الصورة مختلفة جوهريًا. يقوم الوكيل بعدة طلبات متسلسلة إلى النموذج خلال مهمة واحدة.
في كل مرة، يرسل نفس التعليمات الطويلة وسجل إجراءاته السابقة والأدوات المحملة والمستندات. بدون تخزين مؤقت، يتم معالجة كل هذا والدفع مقابله من جديد في كل خطوة — حتى لو لم يتغير 90% من المحتوى. مثال بسيط: يقرأ وكيل البحث 50 صفحة من الوثائق الفنية، ثم يقوم بـ 30 خطوة من التفكير واستدعاءات الأدوات.
تستخرج كل خطوة السياق الكامل مرة أخرى في النموذج. مع التخزين المؤقت، يتم فرض رسوم على الاستدعاء الأول بالكامل، ويتم فرض رسوم على جميع الاستدعاءات اللاحقة فقط مقابل الرموز الجديدة.
كيف يقوم Deep Agents بتفعيل التخزين المؤقت تلقائيًا
قام LangChain بتنفيذ التخزين المؤقت بحيث يعمل دون تدخل المطور. لا حاجة للخوض في وثائق كل مزود أو تعيين أعلام خاصة أو إعادة هيكلة معمارية الوكيل. يحدد الإطار نفسه المزود الذي يتم استخدامه وينشط الآلية المطلوبة. يتم دعم جميع اللاعبين الرئيسيين:
- Anthropic (Claude) — تخزين مؤقت على مستوى السؤال في النظام ووصفات الأدوات
- OpenAI (GPT-4o, o3) — تخزين مؤقت لأجزاء الإدخال المتكررة
- Google (Gemini) — تخزين مؤقت سياقي للمستندات الطويلة
- موفرون متوافقون آخرون
هذا يعني أن المطور يكتب الكود مرة واحدة فقط لـ LangChain Deep Agents والتخزين المؤقت يعمل في كل مكان. عند التبديل إلى مزود آخر، لا تكون هناك حاجة لإعدادات إضافية.
المدخرات الحقيقية: تصل إلى 80% على الرموز
الرقم "حتى 80%" قابل للتحقيق في سيناريوهات محددة — السياق الطويل المتكرر بالإضافة إلى خطوات وكيل كثيرة. كلما زاد عدد الطلبات إلى النموذج ضمن مهمة واحدة وكلما كان جزء السؤال الثابت أطول، كانت المدخرات أكبر. بالنسبة للفرق التي تشغل الوكلاء في الإنتاج، هذا يعني انخفاضًا كبيرًا في فاتورة API. حرج بشكل خاص لسيناريوهات المؤسسات:
- تحليل مجموعات كبيرة من المستندات
- خطوط أنابيب البحث متعددة الخطوات
- الوكلاء الذين يتمتعون بذاكرة طويلة الأجل وسياق أدوات موسع
- منشئو المحتوى الذين يعالجون مئات الطلبات يوميًا
يؤكد LangChain أن تخزين الأسئلة المؤقت هو أحد أبسط التحسينات ذات أقصى عائد استثمار في تطوير الوكلاء. يهتم المزودون أيضًا بتوسيع هذا الدعم: حسابات أقل — بنية تحتية أرخص لأنفسهم.
ما يعنيه هذا
تصبح أنظمة الوكلاء مكلفة عند التوسع، والتخزين المؤقت للأسئلة هو بالفعل أحد الطرق الرئيسية للتحكم في التكاليف. يزيل LangChain حاجز الهندسة: لا يحتاج المطورون بعد الآن إلى تنفيذ التخزين المؤقت بأنفسهم لكل مزود. يقلل هذا من حاجز الدخول لتطوير وكلاء الإنتاج ويجعل تشغيل الوكلاء مبررًا اقتصاديًا حتى مع ميزانية محدودة.
هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟
AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.
أهم ما في عالم الذكاء الاصطناعي — مرة كل أسبوع
سبع قصص مهمة فعلاً هذا الأسبوع، مختارة بعناية. بلا ضجيج ولا بيانات صحفية.
تم! تحقق من بريدك للتأكيد.