Thomson Reuters تحدد أربع قواعد لوكلاء AI يمكن للشركات الوثوق بهم
يدخل وكلاء AI بشكل متزايد إلى سير العمل الفعلي، لكن الثقة بهم لا تعتمد على قوة النموذج بقدر ما تعتمد على العملية. وتنصح Thomson Reuters بقياس الجودة عبر…
معالج بواسطة الذكاء الاصطناعي من ZDNet AI؛ بتحرير Hamidun News
تنتقل وكلاء الذكاء الاصطناعي بسرعة من التجارب إلى سير العمل، وتواجه الشركات سؤالاً رئيسياً: كيف يمكننا جعلهم موثوقين بما يكفي للمهام الحقيقية؟ تعتقد Thomson Reuters أن الإجابة لا تكمن في سحر النماذج، بل في انضباط التطوير والاختبار والتكامل مع الأدوات الموجودة.
كيفية قياس النجاح
وفقاً لجويل هرون، مسؤول التكنولوجيا في Thomson Reuters Labs، فإن الخطوة الأولى هي تحديد النتيجة الجيدة مقدماً. بالنسبة للأنظمة الوكيلة، هذا أصعب من البرامج العادية: لا يكفي التحقق من أن الإجابة "تبدو صحيحة". تحتاج إلى وصف رسمي للصفات التي تجعل النتيجة جيدة، وأين يمكن للوكيل أن يفشل، والانحرافات التي ستقبلها الشركة، والنقطة التي تحتاج فيها التدخل البشري. تستخدم الشركة مستويات تقييم متعددة لتجنب الاعتماد على مقياس واحد أو مجموعة اختبار واحدة:
- معايير عامة لتقييم النماذج الجديدة مبكراً
- اختبارات داخلية بمعايير واضحة لجودة الإجابات
- فحوصات آلية لدورات تطوير سريعة
- تقييم نهائي من قبل خبراء المجال
تساعد الأتمتة على تسريع التكرارات، لكن الثقة النهائية لا تزال تحتاج إلى المرور عبر الأشخاص. يؤكد هرون أنه قبل إطلاق المنتج، تريد الفريق التأكيد من خبراء بشريين، وليس فقط من المقاييس والاختبارات الآلية. بالنسبة للأسواق حيث يكلف الخطأ المال أو الوقت أو المخاطر القانونية، هذا النهج ليس احتياطاً زائداً بل متطلباً إلزامياً. وإلا، قد يظهر الوكيل نتائج عرض رائعة لكن يفشل في العالم الحقيقي، حيث تأتي التفاصيل الدقيقة والسياق المهني في الاعتبار.
اللغة المشتركة للفرق
الاستنتاج الثاني من Thomson Reuters هو أن الوكيل لا يمكن تصميمه بشكل منفصل عن الواجهة وتجربة المستخدم. إذا أرادت الشركة أن يعمل موظفوها مع الوكيل كزميل رقمي، فإنهم يحتاجون إلى لغة مشتركة وواجهة بديهية ومنطق تفاعل شفاف. يجب أن يرى المستخدمون ليس فقط النتيجة، بل تفكير النظام: ما هي الخطوات التي يتخذها، وأين يطلب البيانات، ومتى يستخدم الأدوات، وفي أي وقت يحتاج إلى مراجعة بشرية. بدون هذا الشفافية، ينظر إلى الوكيل على أنه صندوق أسود وليس كمساعد.
يؤدي هذا إلى نصيحة عملية: يجب ألا يعمل المصممون وفرق المنتج وعلماء البيانات في قنوات منفصلة بل يعملون معاً حرفياً. يصف هرون هذا بدون رومانسية—تحتاج ببساطة إلى جلوس المصممين بجانب علماء البيانات وإجبارهم على مناقشة ما يحدث داخل الوكيل بانتظام. كلما كان هذا الاقتران أكثر إحكاماً، زادت سرعة ظهور واجهة لا تخفي تفكير النظام بل تجعله قابلاً للإدارة. بالنسبة للعمل، هذا أيضاً حماية من الاستقلالية الكاذبة، عندما تخفي واجهة جميلة منطقاً غير مستقر.
الأدوات والشركاء
الدرس الثالث هو: لا تحاول بناء وكيل "كلي العلم" يستطيع فعل كل شيء بمفرده. تتخذ Thomson Reuters مساراً مختلفاً: تحليل المنتجات الموجودة وتحويل وظائفها إلى أدوات مثبتة يمكن للوكيل العمل بها. إذا كانت الشركة تمتلك عشرات التطبيقات الناضجة المتراكمة على مدار السنين، فإنها تصبح ليست عبءاً بل مجموعة من الوحدات الموثوقة للعمارة الوكيلة الجديدة. هذا النهج مهم بشكل خاص الآن، حيث تحرز النماذج تقدماً كبيراً في توليد الأكواد وتنفيذ الخطط والاستدلال متعدد الخطوات، لكنها لا تزال لا تستطيع ضمان القابلية للتنبؤ بنفسها.
"نحن لا نلعب بنسبة 90%. نحن نلعب بنسبة 99% و99.9%"، هكذا يصف هرون
المعيار لمنتجات وكلاء الذكاء الاصطناعي.
يؤدي هذا إلى النصيحة الرابعة: التعلم ليس فقط داخل شركتك. أطلقت Thomson Reuters تحالف Trust in AI مع Anthropic و AWS و Google Cloud و OpenAI، وتطور أيضاً شراكات مع Imperial College London. يركز تركيز هذه المبادرات على الشرح والشفافية و "آخر تسعات" الدقة التي تفصل بين نموذج أولي مثير للإعجاب ومنتج عامل. بالنسبة للشركات، هذا إشارة: لا يمكن بناء مكدس وكلاء بمعزل عن الآخرين إذا لم يكن الهدف فقط تنفيذ ميزة عصرية، بل إحضار النظام إلى مستوى يمكن الوثوق به بالقرارات الحقيقية.
ماذا يعني هذا
النقطة الرئيسية للمقالة مباشرة: يجب على الشركات ألا تنتظر وكيلاً مثالياً أسطوري. تُبنى الأنظمة الموثوقة من معايير جودة قابلة للقياس والتعاون الوثيق بين فرق المنتج والتقنية والأدوات الداخلية المثبتة وتبادل الممارسات الخارجية. لن تكون الفائزين هي الشركات التي يبدو وكيلها أذكى، بل تلك التي يتم اختبار سلوك الوكيل فيها بشكل أفضل وأكثر فهماً من قبل المستخدمين وأعمق تكاملاً في العمل التشغيلي الحقيقي.
هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟
AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.