Habr AI→ المصدر

أوضح Habr AI كيفية إعداد مدخلات منظَّمة لوكيل AI بدلًا من مواصفات تقنية خام

نشر Habr AI تحليلًا مفيدًا لبيانات الإدخال الخاصة بوكيل AI يفحص المواصفات التقنية. وبدلًا من وثيقة كاملة، يقترح الكاتب تقسيم المتطلبات إلى أجزاء ذرّية،…

معالج بواسطة الذكاء الاصطناعي من Habr AI؛ بتحرير Hamidun News
أوضح Habr AI كيفية إعداد مدخلات منظَّمة لوكيل AI بدلًا من مواصفات تقنية خام
المصدر: Habr AI. كولاج: Hamidun News.
◐ استمع للمقال

نشر موقع Habr AI تحليلاً مفصلاً حول ما يجب بالضبط أن يتم إدخاله لوكيل ذكاء اصطناعي عندما تكون المهمة هي التحقق من المتطلبات التقنية بدلاً من مجرد إعادة صياغتها. الفكرة الرئيسية: بدلاً من أن يتلقى الوكيل مستند مواصفات كامل، فإنه يتلقى مجموعة من المتطلبات الذرية في شكل جوازات سفر JSON.

لماذا مواصفة واحدة ليست كافية

يبدأ مؤلف المقالة بمشكلة مألوفة لكل من حاول تقديم مستند كبير إلى شبكة عصبية بالكامل. عندما يتلقى النموذج مواصفات متعددة الصفحات دون تحضير مسبق، فإنه يفقد التركيز ويخلط المتطلبات من أقسام مختلفة ويقدم ملاحظات عامة جداً. ونتيجة لذلك، قد يلاحظ النظام عدم دقة فردية، لكنه يواجه صعوبة في شرح النقطة المحددة التي بها مشكلة ولماذا تكون مشكلة وما الذي يجب إصلاحه.

لهذا السبب يتم تقسيم المستند أولاً إلى متطلبات منفصلة: إجراء واحد أو قاعدة واحدة أو قيد واحد لكل جزء. لتجنب فقدان السياق أثناء هذا التقسيم، يتم إضافة حقول مثل `parent_section` و `parent_object` إلى كل عنصر، وتُؤشر النقاط المرتبطة منطقياً على أنها `linked`. هذا مهم عندما يجب التحقق من عدة متطلبات معاً: على سبيل المثال، عندما يجب على النظام إرسال إخطار عبر البريد الإلكتروني و Telegram معاً وليس فقط من خلال قناة واحدة.

جواز المتطلبات

الخطوة التالية هي تحويل اللغة الطبيعية إلى مجموعة من الميزات التي يمكن لمصنف العمل معها. في هذا النظام، لا يعمل LLM كحكم نهائي ولا يحاول «فهم كل شيء». دوره أضيق بكثير: فهو يستخرج إشارات منظمة من النص ويجمعها في JSON. يوفر هذا النهج سيطرة: يمكن التحقق من الميزات ومقارنتها وتصحيحها في المعالجة اللاحقة إذا لزم الأمر. كما يصيغ المؤلف:

«يعمل الوكيل ليس مع النص، بل مع مثل هذه الهياكل.»

تصف المقالة ستة ميزات أساسية تشكل أساس هذا الجواز. بدلاً من تقييم جودة مجرد، يبحث النموذج عن إشارات محددة: أرقام وكلمات غامضة واستثناءات وحدود والمشاركون الصريحون في السيناريو. من الناحية العملية، يحول هذا الجواز عبارة مثل «يجب أن يتمكن المستخدم من تكوين التقرير بمرونة» إلى مجموعة مفهومة من الأعلام التي تظهر على الفور ما ينقصه المتطلب. هذه القابلية للتفسير هي بالضبط ما يميز هذا النظام عن مجرد طلب من نموذج تقييم النص برمته.

  • `has_numbers` — ما إذا كان المتطلب يحتوي على أرقام وحدود وتواريخ وغيرها من المعاملات المحددة
  • `stopword_score` — مدى غموض الصياغة بسبب كلمات مثل «مرن» و «مريح» أو «سريع»
  • `has_negative_keywords` — ما إذا تم وصف الاستثناءات والأخطاء
  • `boundary_conditions_mentioned` — ما إذا تم تحديد قيم فارغة وحد أقصى وحد أدنى أو حدود أخرى
  • `actor_count` — عدد المشاركين المذكورين صراحة في المتطلب

يتم استخراج الميزات نفسها من خلال وضع JSON وأمثلة few-shot للحفاظ على النموذج ضمن الشكل. إذا فقد LLM شيئاً واضحاً، مثل الأرقام في النص، فإن هذا يُطبق في المعالجة اللاحقة من خلال التعبيرات العادية. بعد ذلك يأتي شجرة القرار: تتلقى ميزات رقمية وتعين للمتطلب تسمية مثل `ok` أو `unverifiable` أو `no_negative` أو `no_boundary` أو `ambiguity`. للتدريب، قام المؤلف بتسمية 90 مواصفات وتقسيمها إلى 270 متطلب وحقق حوالي 82٪ دقة على مجموعة الاختبار.

الناقد والمقياس

لا ينتهي خط الأنابيب هناك. حتى المصنف الجيد يرى متطلباً واحداً في المرة، مما يعني أنه يمكنه بسهولة فقدان التناقضات بين الأقسام. لمثل هذه الحالات، يتم استخدام وكيل ناقد منفصل يتلقى النص الكامل للمواصفات وقائمة جوازات JSON والتسميات المتنبأ بها.

مهمته ليست إعادة تقييم كل عبارة من الصفر، بل مشاهدة المستند من الأعلى والبحث عن التضارب والثغرات في حقوق الوصول والأخطاء في خريطة التكاملات. قد يلاحظ هذا الناقد، على سبيل المثال، أنه في مكان واحد يكون حقل «المستودع» إلزامياً، بينما في مكان آخر تكون القيمة الفارغة مقبولة. لجعل النظام يعمل ليس فقط على الأمثلة القصيرة، تُعالج المتطلبات بالتوازي من خلال `ThreadPoolExecutor`، والنماذج المحلية تعمل في Ollama.

يلاحظ المؤلف أنه على جهاز كمبيوتر ألعاب عادي، يتعامل النظام بشكل مريح مع 4-6 طلبات متوازية بدون تدهور ملحوظ، وعلى دفعة من مائة متطلب، يوفر هذا تسريعاً بحوالي 3-4 مرات. تبقى المتطلبات المرتبطة في سلسلة واحدة للحفاظ على الترتيب والسياق العام للتحقق.

ماذا يعني هذا

يوضح التحليل على Habr AI بوضوح أين يتجه التطور العملي لوكلاء الذكاء الاصطناعي: من محاولات «إطعام النموذج بكل شيء في المرة الواحدة» إلى خطوط أنابيب ضيقة ومضبوطة بميزات واضحة ونماذج محلية وطبقة تحكيم منفصلة. إذا أرادت فريق بناء وكيل عملي للتحليل أو ضمان الجودة أو العمل مع التوثيق، فسيتعين عليها التفكير ليس فقط في اختيار نموذج، بل أيضاً في كيفية تنظيم بيانات الإدخال والعلامات والتحقق النهائي من النتائج.

ZK
Hamidun News
أخبار الذكاء الاصطناعي بدون ضوضاء. اختيار تحريري يومي من أكثر من 400 مصدر. منتج من جمال حميدون، رئيس الذكاء الاصطناعي في Alpina Digital.

هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟

AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.

ما رأيك؟
جارٍ تحميل التعليقات…