MarkTechPost→ المصدر

NadirClaw: خفض تكلفة طلبات LLM عبر توجيه ذكي للـ prompts

يمكن للمطورين الآن استخدام NadirClaw للتوجيه الذكي لطلبات LLM. يصنّف النظام تلقائيًا الـ prompts البسيطة إلى نماذج أقل تكلفة، والمعقدة إلى نماذج أكثر قدرة. ويعم

معالج بواسطة الذكاء الاصطناعي من MarkTechPost؛ بتحرير Hamidun News
NadirClaw: خفض تكلفة طلبات LLM عبر توجيه ذكي للـ prompts
المصدر: MarkTechPost. كولاج: Hamidun News.
◐ استمع للمقال

NadirClaw هو نظام لتوجيه ذكي لطلبات LLM يصنف المحاثات إلى بسيطة ومعقدة مباشرة على جهاز المستخدم، دون إرسال البيانات إلى الخوادم. ثم يختار تلقائياً النموذج المناسب — اقتصادي للمهام البسيطة، قوي للمهام المعقدة. النتيجة: توفير كبير في تكاليف API دون فقدان الجودة.

كيفية عمل التوجيه

يعمل NadirClaw على ثلاث مراحل. أولاً، يقوم مصنّف محلي بتحليل المحث الوارد ويحدد ما إذا كان طلباً بسيطاً أم معقداً — دون إجراء استدعاءات API خارجية. هذه هي اللحظة الحاسمة: يحدث التصنيف على جانب العميل، مما يتجنب النفقات غير الضرورية. لا يتم إرسال المحث إلى أي مكان؛ يبقى خاصاً ويتم معالجته محلياً.

بعد ذلك، يختار النظام النموذج المناسب. يتم توجيه الطلبات البسيطة إلى خيارات أكثر اقتصاداً، مثل Gemini 1.5 Flash، بينما تذهب المهام التحليلية أو الإبداعية المعقدة إلى إصدارات أقوى، مثل Gemini 2.0 Pro. يمكن للمطورين تخصيص المسارات وعتبات التصنيف وفقاً لاحتياجاتهم — تعيين مستوى التعقيد الذي يتم فيه التبديل إلى نموذج مكلف. هذه مرونة لا توفرها نماذج التسعير الثابتة.

المرحلة الثالثة هي تنفيذ الطلب في النموذج المختار وإرجاع النتيجة. تستغرق العملية برمتها بضعة ميلي ثانية، ويحصل المستخدم على إجابة تقريباً على الفور. في غضون ذلك، تبقى تحليلات التوجيه على جانب المستخدم ولا يتم جمعها بشكل مركزي، مما يزيد من الخصوصية.

حيث نقتصد

الاقتصاد هو الميزة الرئيسية لهذا النهج. تتلقى معظم التطبيقات حركة مرور مختلطة: بعض الطلبات تتطلب معالجة معقدة، لكن معظمها بسيط وروتيني. إذا أرسلت كل شيء إلى نموذج قوي (ومكلف)، فإن التكاليف تنمو خطياً. يحل NadirClaw هذه المشكلة:

  • الطلبات البسيطة (تعريفات الكلمات، تحليل JSON، الملخصات الموجزة) تكلف 10 مرات أقل
  • التصنيف المحلي — لا توجد تكاليف لتحديد نوع المهمة، دون استخدام LLM
  • التطبيقات على نطاق واسع — إذا كانت 70–80٪ من المهام بسيطة، فإن التكاليف الإجمالية تنخفض بمقدار الثلث أو أكثر
  • تخزين مؤقت للسياق الطويل — يعمل بنفس الفعالية مع النماذج الرخيصة والمكلفة
  • لا توجد استدعاءات API زائدة — فقط الطلبات الضرورية للخدمات المدفوعة

يمكنك استخدام NadirClaw بطريقتين. أولاً — دمجه في تطبيقك من خلال مكتبة Python، التي ستوجه الطلبات تلقائياً في الخلفية. ثانياً — التجربة عبر CLI لفهم عتبات التصنيف التي تعمل بشكل أفضل لسيناريوك. التثبيت ضئيل، والإعداد يستغرق دقائق، والتكامل لا يتطلب تغييرات على منطق تطبيقك الأساسي.

ماذا يعني هذا

في عالم تتزايد فيه تكاليف API للـ LLM مع توسع التطبيق، يقدم NadirClaw طريقة عملية لتحسين النفقات. هذا مفيد بشكل خاص للأنظمة ذات أحجام كبيرة من الطلبات البسيطة — روبوتات الدعم، وأنظمة الأسئلة الشائعة، وتصنيف النصوص، واعتدال المحتوى، ومعالجة الطلبات.

الآن لدى المطورين أداة للحفاظ على التكاليف تحت السيطرة دون التضحية بالجودة للمهام التحليلية والإبداعية المعقدة. هذه خطوة نحو استخدام أكثر مسؤولية واقتصاداً للـ LLM في الإنتاج.

ZK
Hamidun News
أخبار الذكاء الاصطناعي بدون ضوضاء. اختيار تحريري يومي من أكثر من 400 مصدر. منتج من جمال حميدون، رئيس الذكاء الاصطناعي في Alpina Digital.

هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟

AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.

ما رأيك؟
جارٍ تحميل التعليقات…