هارفارد: AI أدق من الأطباء في فرز مرضى الطوارئ عند الاستقبال

قارنت هارفارد وBeth Israel Deaconess بين OpenAI o1 وأطباء باستخدام حالات حقيقية من قسم الطوارئ. وفي مرحلة الفرز الأولي، قدّم النموذج تشخيصًا دقيقًا أو قريبًا منه بوتيرة أعلى — 67% مقابل 50–55% لدى البشر. لكن الأمر لا يتعلق بعد باستبدال الطبيب: فقد قيّمت الدراسة الاستدلال السريري النصي، لا الفحص الكامل ولا التواصل مع المريض ولا القرارات المتخذة عند سرير المريض.

Khamidun Zhemal

رصد الذكاء الاصطناعي · Guardian

30 أبريل 2026· 3 د

معالج بواسطة الذكاء الاصطناعي من Guardian؛ بتحرير Hamidun News

هارفارد: AI أدق من الأطباء في فرز مرضى الطوارئ عند الاستقبال — المصدر: Guardian. كولاج: Hamidun News.

◐ استمع للمقال

أبلغت فريق من كلية الطب بجامعة هارفارد ومركز بيث إسرائيل ديكونس الطبي أن نموذج الاستدلال o1 من OpenAI أثبت دقة أعلى من الأطباء في سلسلة من مهام التشخيص في الحالات الطارئة. كانت النتيجة الأكثر لفتاً للانتباه في مرحلة الفرز الأولي في قسم الطوارئ، حيث تكون البيانات محدودة لكن يجب اتخاذ القرارات بسرعة.

كيفية إجراء المقارنة

تم نشر الدراسة في 30 أبريل 2026 في مجلة Science وأصبحت واحدة من أكبر المحاولات لمقارنة الذكاء الاصطناعي ليس مع اختبارات الامتحانات، بل مع العمل السريري الحقيقي. قام المؤلفون بتشغيل النموذج من خلال ستة تجارب: من الحالات التشخيصية المعقدة والاستدلال الاحتمالي إلى المهام التي تتضمن اختيار التكتيكات السريرية المستقبلية. كان الجزء الأساسي من العمل يتضمن 76 حالة حقيقية من قسم الطوارئ في مستشفى في بوسطن.

تلقى النموذج والأطباء سجلات متطابقة من السجلات الطبية الإلكترونية وطُلب منهم اقتراح التشخيصات الأكثر احتمالاً والخطوات التالية. من المهم الإشارة إلى أنه تم "تنظيف" البيانات بشكل ضئيل قبل الاختبار. استخدم الباحثون نفس النص الصاخب والناقص الذي يراه الطبيب في الدقائق الأولى: العلامات الحيوية والعمر والوصف الموجز للشكاوى من الممرضة والملاحظات الفردية من السجل الطبي.

حدث التحقق في ثلاث مراحل: في لحظة الفرز وعند أول تواصل مع طبيب وفي نقطة القرار بشأن الدخول إلى جناح أو وحدة العناية المكثفة. لم يكن المقيمون يعرفون من قدم الإجابة — إنسان أم نموذج.

حيث أثبتت الذكاء الاصطناعي أنها أقوى

أظهر النموذج أكبر ميزة له بالضبط حيث كان لدى الطبيب أقل قدر من المعلومات. في الفرز الأولي، قدم OpenAI o1 تشخيصاً دقيقاً أو قريباً جداً في 67٪ من الحالات. من بين الأطباء على نفس مجموعة المرضى، كان المعدل في نطاق 50–55٪. عندما أصبحت هناك بيانات أكثر متاحة، ارتفعت دقة الذكاء الاصطناعي إلى 82٪، بينما وصل البشر إلى 70–79٪؛ هنا لم تكن الفجوة ذات دلالة إحصائية بعد الآن، لكن الاتجاه استمر. في المهام التي تتضمن تخطيط إدارة الحالات، بما في ذلك اختيار الاختبارات والمضادات الحيوية ومناقشة أهداف العلاج، حقق النموذج أيضاً نتائج أفضل بكثير.

67٪ — تشخيص دقيق أو قريب جداً من الذكاء الاصطناعي في الفرز الأولي
50–55٪ — نتائج الأطباء في نفس المرحلة
82٪ — دقة الذكاء الاصطناعي بعد وصول بيانات إضافية
89٪ — أداء النموذج في مهام إدارة الحالات مقابل 34٪ للأطباء

قدم المؤلفون مثالاً مثيراً للاهتمام. في حالة واحدة، وصل مريض يعاني من جلطة دموية في الرئتين وتدهور الحالة. افترض الأطباء أن العلاج المضاد للتخثر القياسي قد فشل. ومع ذلك، ربط النموذج الصورة بذئبة حمراء في التاريخ الطبي للمريض واقترح أن مصدر المشكلة هو الالتهاب الرئوي في هذا السياق. في وقت لاحق، تم تأكيد هذا التقدير. لاحظ الباحثون بشكل خاص أن النموذج عمل بثقة مع الحالات النادرة والمعقدة.

لماذا هذا ليس بديلاً للأطباء

لا تعني هذه النتائج أنه يمكن نقل قسم الطوارئ إلى الطيار الآلي. اختبرت الدراسة في المقام الأول المكون النصي للاستدلال السريري: قراءة السجلات الطبية وبناء التشخيص التفاضلي واقتراح الخطوة التالية. لم يقم الذكاء الاصطناعي بفحص المريض ولم يرَ تعابير الألم ولم يستمع إلى التنفس ولم يقيّم المشية ولم يعمل مع الأشعات السينية وتخطيطات القلب بالطريقة التي يفعلها طبيب بجانب السرير. ذكّر الخبراء الخارجيون بالفعل أن هذا يتعلق بشكل أكثر برأي ثانٍ "أعمى" بناءً على النص، وليس إدارة كاملة للمريض في الوقت الفعلي.

"نحن نشهد تحولاً تكنولوجياً حقيقياً عميقاً سيغير الطب"، قال المؤلف

المشارك في الدراسة أرجون مانراي. لكن المؤلفين أنفسهم يؤكدون في نفس الوقت على القيود. حتى لو خمّن النموذج التشخيص الرئيسي الصحيح في كثير من الأحيان، فقد يقترح اختبارات أو تدخلات غير ضرورية قد تؤذي المريض. علاوة على ذلك، لا يوجد حالياً نظام واضح للمسؤولية: من يتحمل مسؤولية الخطأ إذا اعتمد طبيب على اقتراح خوارزمية؟ لذلك يتحدث الباحثون ليس عن استبدال الطبيب، بل عن صيغة جديدة للعمل التعاوني، حيث يعمل الذكاء الاصطناعي كمحلل سريع ومصدر رأي ثانٍ، بينما يبقى القرار النهائي مع الإنسان.

ما الذي يعنيه هذا

بالنسبة للطب، هذا إشارة إلى أن نماذج اللغة الكبيرة تخرج من مرحلة العرض التوضيحي وتقترب من التحقق السريري الحقيقي. السيناريو قريب الأجل ليس طبيباً ذكاء اصطناعياً "مستقلاً" بدون أشخاص، بل أنظمة تراجع السجلات الإلكترونية بسلاسة وتقترح الاحتمالات التشخيصية الضائعة وتساعد في ترتيب أولويات الحالات في قسم الطوارئ بشكل أسرع. المرحلة التالية أصبحت واضحة الآن: ليس معايير جديدة، بل تجارب سريرية استشرافية، حيث سيتم الانتباه ليس فقط لدقة الإجابات، بل أيضاً للسلامة والتكلفة والتأثير على نتائج العلاج.

Hamidun News

أخبار الذكاء الاصطناعي بدون ضوضاء. اختيار تحريري يومي من أكثر من 50 مصدر. منتج من جمال حميدون، رئيس الذكاء الاصطناعي في Alpina Digital.

قناة Telegram RSS hamidun.com

هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟

AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.

🎓 Academy — 7 أيام مجاناً استشارة مجانية