Bloomberg Tech→ المصدر

ChatGPT و Gemini و Grok قدموا نصائح طبية مشكلة في نصف الإجابات

كشف تدقيق جديد للروبوتات الذكية الشهيرة عن نتيجة محبطة: حوالي نصف الإجابات على الأسئلة الطبية كانت مشكلة. اختبر الباحثون ChatGPT و Gemini و Grok و Meta AI و…

معالج بواسطة الذكاء الاصطناعي من Bloomberg Tech؛ بتحرير Hamidun News
ChatGPT و Gemini و Grok قدموا نصائح طبية مشكلة في نصف الإجابات
المصدر: Bloomberg Tech. كولاج: Hamidun News.
◐ استمع للمقال

تكشف عملية تدقيق جديدة من BMJ Open عن شيء مقلق: برامج الدردشة الآلية بالذكاء الاصطناعي الشهيرة أصبحت بالفعل جزءاً من الحياة اليومية، لكن عندما يتعلق الأمر بقضايا الصحة، لا يمكن الاعتماد عليها كمصدر مستقل للتوصيات. خلص الباحثون إلى أن حوالي نصف الردود على الاستفسارات الطبية تبين أنها إشكالية — من المعلومات غير الكاملة إلى النصائح التي قد تدفع الشخص، دون استشارة طبية، نحو علاج غير فعال أو قد يكون خطيراً. اختبرت فريق البحث خمس خدمات عامة — ChatGPT و Gemini و Meta AI و Grok و DeepSeek — عبر خمسة مواضيع حيث تكون الأساطير والمعلومات الخاطئة شائعة بشكل خاص: السرطان واللقاحات والخلايا الجذعية والتغذية والأداء الرياضي.

في فبراير 2025، تم طرح 50 سؤالاً على كل برنامج دردشة آلي، مع تحليل إجمالي 250 رد. كانت بعض الاستفسارات من نوع مغلق، حيث توجد إجابة صحيحة واحدة في إطار الإجماع العلمي، وبعضها من نوع مفتوح، يتطلب من النظام تقديم شرحه الخاص أو قائمة بمسارات العمل الممكنة. كانت النتائج قاسية.

اعتبر نصف جميع الردود إشكالياً: 30% كانت معتدلة الإشكالية، و20% أخرى كانت شديدة الإشكالية. بعبارة أخرى، لا يتعلق الأمر فقط بأخطاء صغيرة في الصياغة، بل يشمل أيضاً النصائح التي قد تقود المستخدمين نحو علاج غير فعال أو تسبب ضرراً إذا تم اتباعها دون طبيب. أظهرت النماذج أداءً سيئاً بشكل خاص في الأسئلة المفتوحة: عندما احتاجت إلى صياغة توصيتها الخاصة بدلاً من الاختيار من الخيارات المعطاة، زادت نسبة الأجوبة الأكثر خطورة بشكل ملحوظ.

كانت هناك اختلافات بين الخدمات، رغم أن الجميع أظهر نقاط ضعف في المتوسط. وفقاً للدراسة، قدم Grok في أغلب الأحيان الردود الأكثر إشكالية: 29 من أصل 50 رد له، أو 58%، تم تصنيفها في أشد فئة. أظهرت Gemini، على النقيض من ذلك، أقل نسبة من الردود الأكثر إشكالية وأكثر الأجوبة التي لا توجد بها مشاكل واضحة.

حسب الموضوع، كانت أداء برامج الدردشة الآلية أفضل على أسئلة اللقاحات والسرطان، وأسوأ في الخلايا الجذعية والأداء الرياضي والتغذية — المجالات التي يوجد بها بشكل خاص عدد كبير من الادعاءات المثيرة للجدل والممارسات البديلة والنصائح الزائفة علمياً في المجال العام. مشكلة منفصلة تتعلق ليس فقط بالمحتوى بل بالعرض أيضاً. يلاحظ المؤلفون أن الردود كانت دائماً مكتوبة بنبرة واثقة وقلما صحبتها تحفظات أو تحذيرات.

من بين 250 استفسار، رفضت برامج الدردشة الآلية الإجابة مرتين فقط، وكلا الرفضين جاءا من Meta AI. تبين أن جودة الاستشهادات ضعيفة: بلغ متوسط اكتمال المراجع حوالي 40%، ولم تستطع أي خدمة تقديم قائمة مصادر دقيقة تماماً، جزئياً بسبب الاستشهادات المختلقة أو المشوهة. علاوة على ذلك، كانت النصوص معقدة للجمهور العام وفي مستوى القراءة تقابل أكثر خريج جامعة من شخص يحاول ببساطة فهم عرضه أو وصفته الطبية بسرعة.

يؤكد المؤلفون أن هذا ليس حكماً ضد استخدام الذكاء الاصطناعي في الطب وليس دليلاً على عدم جدوى برامج الدردشة الآلية بالكامل. تتمتع الدراسة بقيود: فهي تغطي خمس نماذج فقط، واختبرتها في وقت محدد، واستخدمت عن قصد بعض الاستفسارات كاختبار إجهاد لكشف نقاط ضعف النظام. لذلك، لا ينبغي تطبيق نسبة 50% من الردود الإشكالية بشكل آلي على كل حوار يومي مع الذكاء الاصطناعي.

لكن الاستنتاج الأكثر أهمية هو مختلف: عندما يكون الموضوع مثيراً للجدل أو محملاً عاطفياً أو مشبعاً بالفعل بالأساطير الطبية، ينتج النموذج بسهولة نصاً يبدو مقنعاً دون دعم علمي كافٍ. وفقاً لبيانات جالوب من 15 أبريل 2026، استخدم 25% من الأمريكيين بالفعل أدوات الذكاء الاصطناعي للمعلومات أو النصائح الطبية، لذا فإن هذا ليس عادة متخصصة بل سلوك جماعي. المعنى العملي لهذا البحث بسيط جداً.

يمكن أن يكون برنامج الدردشة الآلية مفيداً كملاح سريع: شرح المصطلح، مساعدة في تجميع قائمة أسئلة للطبيب، أو اقتراح ما يجب توضيحه إضافياً. لكنه لا يجب أن يحل محل التشخيص والتفكير السريري واختيار العلاج. بالنسبة لشركات الذكاء الاصطناعي، هذا إشارة لتعزيز الحماية الدفاعية والتحقق من الاستشهادات والتحذيرات للمستخدمين.

بالنسبة للمستخدمين أنفسهم، تذكير بأن النبرة الواثقة للنموذج لا تضمن الموثوقية. كلما زاد سعر الخطأ، قل هامش الارتجال الذي تمتلكه الآلة.

ZK
Hamidun News
أخبار الذكاء الاصطناعي بدون ضوضاء. اختيار تحريري يومي من أكثر من 400 مصدر. منتج من جمال حميدون، رئيس الذكاء الاصطناعي في Alpina Digital.

هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟

AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.

ما رأيك؟
جارٍ تحميل التعليقات…