3DNews AI→ المصدر

روبوتات الدردشة AI الشائعة تخطئ في التشخيص في أكثر من 80% من الحالات، وفقًا لدراسة

روبوتات الدردشة AI الموجهة للمستهلكين لا تزال غير مناسبة للتشخيص الطبي: فقد أظهرت دراسة أخطاءً في أكثر من 80% من الحالات. عندما يمتلك النموذج بيانات قليلة عن…

معالج بواسطة الذكاء الاصطناعي من 3DNews AI؛ بتحرير Hamidun News
روبوتات الدردشة AI الشائعة تخطئ في التشخيص في أكثر من 80% من الحالات، وفقًا لدراسة
المصدر: 3DNews AI. كولاج: Hamidun News.
◐ استمع للمقال

روبوتات الذكاء الاصطناعي للمستهلكين الشهيرة تؤدي أداءً ضعيفاً في دور المشخصين الرقميين. بينت الدراسة أنه عند محاولة إجراء تشخيصات طبية بناءً على مجموعة محدودة من الأعراض، تخطئ في أكثر من 80% من الحالات.

كيفية اختبار الروبوتات

اختبر الباحثون ليس الأنظمة الطبية المتخصصة، بل روبوتات المحادثة السائدة التي يلجأ المستخدمون إليها للحصول على إجابات سريعة على أي سؤال. تم تقديم لها سيناريوهات تتضمن بيانات غير مكتملة عن حالة المريض — تماماً كما يصف الشخص حالته الصحية في رسالته الأولى، بدون فحوصات أو فحص سريري أو أسئلة المتابعة من الطبيب. بدت المهمة بسيطة: ربط الأعراض بسبب محتمل. لكن هنا بالذات انكشفت المشكلة الرئيسية: الإجابة الواثقة والمترابطة والمصاغة بشكل ملائم غالباً ما لم تتطابق مع الاستنتاجات الصحيحة سريرياً.

من المهم أيضاً أن هذا الشكل يعكس سلوك المستخدم الفعلي بقرب كبير. نادراً ما يأتي الناس إلى الروبوت بسجلات طبية منظمة بعناية؛ بل يكون الأغلب مجرد بضع جمل عن ألم أو حمى أو ضعف أو عرض غير معتاد يريدون شرحه بسرعة دون حجز موعد عيادة. إذن الاختبار فعلياً تحقق ليس من القدرة المجردة للنموذج على التفكير حول الطب، بل من ملاءمته في سيناريو يومي يوجد فيه إغراء باستبدال استشارة متخصص برد فوري من الدردشة.

من أين تأتي الأخطاء

النماذج العامة جيدة في تلخيص المعلومات العامة، وشرح المصطلحات، وتجميع المعلومات في إجابة موجزة. لكن التشخيص الطبي يعمل بشكل مختلف: فهو يتطلب العمل مع عدم التأكد، والتمييز بين الاحتمالات المتشابهة، والأخذ في الاعتبار السيناريوهات النادرة لكن الخطيرة، وأحياناً القول بصراحة أن البيانات غير كافية.

يميل الروبوت الموجه للمستهلك إلى محاولة إكمال الطلب برد يبدو مفيداً بدلاً من التوقف عند صيغة آمنة وتوجيه الشخص إلى متخصص. مشكلة إضافية أن روبوت المحادثة السائد لا يجري حواراً تشخيصياً حقيقياً. قد يطرح بضع أسئلة توضيحية، لكنه لا ينشئ اختباراً منهجياً للفرضيات، ولا يربط الإجابات بالقياسات الموضوعية، ولا يتحمل مسؤولية سريرية عن النتيجة.

حتى لو خمّن النموذج الاتجاه العام، فإنه بسهولة يفتقد التفاصيل التي للطبيب تغيّر كل الاستنتاج: مدة الأعراض، والأمراض المصاحبة، والأدوية، والعمر، والجراحات الأخيرة، أو نمط التدهور. تتفاقم المشكلة عندما تتداخل الأعراض عبر عشرات الحالات ويصفها المستخدم بشكل غير دقيق أو موجز جداً.

في هذه الظروف، يبدأ النموذج في ملء الصورة بناءً على نمط وضغط عدم التأكد في إجابة واثقة، بينما في الممارسة الحقيقية كان الطبيب ربما يبقي عدة نسخ مفتوحة ويأمر بفحوصات إضافية. هذا ما يجعل الخطأ غير ملحوظ بشكل خاص للمستخدم.

ونتيجة لذلك، تحدث أعطال نمطية:

  • يخلط الروبوت بين الحالات ذات الأعراض المتشابهة
  • يقلل من حدة الحالات المحتملة الخطورة
  • يعطي تشخيصاً واثقاً حيث تكون قائمة الاحتمالات مطلوبة
  • لا يفصل بين المعلومات المرجعية واتخاذ القرارات الطبية

لماذا هذا خطير

الخطر الرئيسي ليس أن الروبوت يخطئ أحياناً، بل أنه يخطئ بإقناع. للمستخدم، قد يبدو النبرة الهادئة والواثقة علامة على الكفاءة، رغم أنه لا توجد فحوصات سريرية أو وصول إلى السجل الطبي أو تحقق من الفحوصات خلف الإجابة.

إذا تلقى الشخص طمأنينة كاذبة، قد يؤجل زيارة الطبيب، أو يفوت تدهور حالته، أو يختار إجراءات خاطئة في الساعات الأولى عندما تكون سرعة الاستجابة مهمة بشكل خاص. هذا السيناريو خطير بشكل خاص حيث تشبه الأعراض شيئاً غير ضار لكنها فعلياً تتطلب تقييماً عاجلاً: مثلاً، ألم شديد، ضيق التنفس، الاضطرابات العصبية، أو علامات العدوى. في مثل هذه الحالات، الخطأ ليس مجرد صياغة دردشة غير دقيقة، بل وقت ضائع.

الروبوتات الموجهة للمستهلك مُحسَّنة للراحة في المحادثة والشعور بالفائدة، لا للفحص الطبي المحافظ حيث من الأفضل توجيه شخص إلى الطبيب مرة إضافية بدلاً من تفويت إشارة حرجة. هذا لا يعني أن الذكاء الاصطناعي غير مفيد في الطب. يمكن لمثل هذه الأنظمة أن تساعد في صياغة الشكاوى، وشرح المصطلحات، وجمع الأسئلة للموعد، أو تذكير ما هي المعلومات التي يجب تحضيرها قبل التشاور. لكن كأداة للتشخيص، فروبوتات المحادثة السائدة حتى الآن غير موثوقة، خاصة عندما تكون المعلومات نادرة والأعراض غامضة وتكلفة الخطأ عالية.

في هذا الدور، من الأحكم استخدامها كطبقة تحضيرية ومرجعية قبل زيارة الطبيب، وليس كحكم نهائي.

ماذا يعني هذا

خلاصة الدراسة صارمة إلى حد ما: روبوتات الذكاء الاصطناعي الشهيرة لا يمكن أن ترى بديلاً عن الطبيب، حتى لو وجدت المعلومات بسرعة وتحدثت بثقة. للمستخدمين، هذا خط من الثقة؛ للشركات، هذا إشارة بأن السيناريوهات الطبية تتطلب ضبطاً متخصصاً، والتحقق من قبل الخبراء، وعرضاً حذراً جداً من الإجابات.

ZK
Hamidun News
أخبار الذكاء الاصطناعي بدون ضوضاء. اختيار تحريري يومي من أكثر من 400 مصدر. منتج من جمال حميدون، رئيس الذكاء الاصطناعي في Alpina Digital.

هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟

AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.

ما رأيك؟
جارٍ تحميل التعليقات…