الوكلاء

التعلم مع التدخل البشري (Human-in-the-Loop - HITL)

التعلم مع التدخل البشري هو نمط تصميم نظام يتم فيه دمج الإشراف البشري بشكل هيكلي في نقطة واحدة أو أكثر من نقاط القرار في خط أنابيب ذكاء اصطناعي آلي، مما يتطلب موافقة أو تصحيح أو إعادة توجيه من قبل شخص قبل المتابعة.

يشير التعلم مع التدخل البشري إلى أي بنية معمارية يتم فيها دمج الحكم البشري بشكل هيكلي في سير عمل آلي بدلاً من تطبيقه فقط بعد انتهاء المهمة. في سياق وكلاء الذكاء الاصطناعي، يعني التعلم مع التدخل البشري أن الوكيل يتوقف عند نقاط تفتيش محددة ويطلب تأكيداً بشرياً قبل تنفيذ الإجراءات التي تكون ذات عواقب أو غير قابلة للعكس أو غامضة أو خارج عتبة ثقة محددة مسبقاً. يسبق المصطلح نماذج اللغات الكبيرة — وقد تم استخدامه في التعلم النشط والروبوتات منذ أوائل العقد الأول من القرن الحادي والعشرين على الأقل — لكنه اكتسب بروزاً متجدداً مع بدء وكلاء الذكاء الاصطناعي المستقلة اتخاذ إجراءات في العالم الحقيقي.

يمكن تكوين نقاط تفتيش التعلم مع التدخل البشري بدرجات مختلفة من التفصيل. قد تتطلب التطبيقات الحد الأدنى موافقة بشرية فقط للإجراءات عالية الرهانات أو المتعارضة — حذف الملفات أو إرسال رسائل البريد الإلكتروني أو بدء العمليات المالية — بينما قد تتطلب الإعدادات الأكثر تحفظاً موافقة في كل خطوة تخطيط. تطبق بعض الأنظمة التعلم مع التدخل البشري بشكل غير متزامن، وتصف الإجراءات المقترحة للمراجعة البشرية دون حجب الوكيل عن خطوات متوازية أقل خطورة. يمكن للإنسان الموافقة أو الرفض أو تعديل أو إعادة توجيه الإجراء المقترح؛ يدمج الوكيل الرد ويستمر. توفر سجلات التدقيق لجميع الموافقات إمكانية التتبع لأغراض الامتثال.

مسألة التعلم مع التدخل البشري مهمة لأن وكلاء الذكاء الاصطناعي الحالية ليست موثوقة دائماً: فهي تهلوس الحقائق وتسيء تفسير التعليمات الغامضة وتقترح أحياناً إجراءات ذات عواقب غير مقصودة كبيرة. يوفر التعلم مع التدخل البشري آلية أمان هيكلية، خاصة بالنسبة للمجالات عالية الرهانات بما في ذلك العمليات المالية وقرارات الرعاية الصحية وإنشاء المستندات القانونية ونشر الأكواس على الأنظمة الإنتاجية والروبوتات في العالم الحقيقي. تعزز الأطر التنظيمية هذا الضرورة: قانون الذكاء الاصطناعي في الاتحاد الأوروبي، الذي دخل مراحل الإنفاذ في 2024-2025، يفرض إشرافاً بشرياً ذا معنى لفئات أنظمة الذكاء الاصطناعي عالية المخاطر كما هو محدد في ملحقه الثالث.

اعتباراً من عام 2026، يعتبر التعلم مع التدخل البشري ميزة قابلة للتكوين قياسية في منصات وكلاء الذكاء الاصطناعي للمؤسسات. يكشف LangGraph عن بدائيات المقاطعة التي توقف تنفيذ الرسم البياني في انتظار إدخال بشري؛ يدعم Claude من Anthropic أوضاع موافقة قابلة للتكوين لاستدعاءات الأدوات الحساسة؛ وأضافت بائعو الأتمتة الروبوتية طوابير موافقة الإجراءات إلى منصاتهم الموجودة. يستكشف البحث النشط تقليل نفقات التعلم مع التدخل البشري مع الحفاظ على ضمانات الأمان — بما في ذلك التصعيد القائم على الثقة الذي يوجه فقط قرارات منخفضة الثقة للبشر، وتجميع الإجراءات المسجلة بالمخاطر، والنماذج المتعلمة التي تتنبأ بالوقت الذي تضيف فيه المراجعة البشرية أكثر قيمة نسبية إلى تكلفة الكمون.

مثال

يتم تكوين وكيل إعادة الترتيب البرمجي الذي يعمل بشكل مستقل على مستودع الإنتاج للتوقف وتقديم فرق موحدة للمهندس في الخدمة قبل تنفيذ أي نص ترحيل قاعدة بيانات؛ يقوم المهندس بمراجعة التغيير والموافقة عليه بتعليق، وينتقل الوكيل — مما يمنع تعديل المخطط الذي لم تتم مراجعته من الوصول إلى النظام المباشر.

مصطلحات مرتبطة

الوكيل المستقل (Autonomous Agent)Guardrails توافق الذكاء الاصطناعي (AI Alignment)

← المسرد