Guardian→ original

Harvard: AI más precisa que los médicos en el triaje de pacientes en urgencias

Harvard y Beth Israel Deaconess compararon OpenAI o1 con médicos en casos reales del servicio de urgencias. En la etapa de triaje inicial, el modelo dio con…

Procesado por IA desde Guardian; editado por Hamidun News
Harvard: AI más precisa que los médicos en el triaje de pacientes en urgencias
Fuente: Guardian. Collage: Hamidun News.
◐ Escuchar artículo

Un equipo de la Escuela de Medicina de Harvard y el Centro Médico Beth Israel Deaconess informó que el modelo de razonamiento o1 de OpenAI demostró mayor precisión que los médicos en una serie de tareas de diagnóstico de emergencia. El resultado más notable fue en la etapa del triaje inicial en el servicio de emergencias, donde los datos son limitados pero las decisiones deben tomarse rápidamente.

Cómo se Realizó la Comparación

El estudio fue publicado el 30 de abril de 2026 en la revista Science y se convirtió en uno de los mayores intentos de comparar la IA no con pruebas de examen, sino con trabajo clínico real. Los autores ejecutaron el modelo a través de seis experimentos: desde casos diagnósticos complejos y razonamiento probabilístico hasta tareas que implican la selección de futuras tácticas clínicas. La parte clave del trabajo involucró 76 casos reales del servicio de emergencias de un hospital en Boston.

El modelo y los médicos recibieron registros idénticos de historiales médicos electrónicos y se les pidió que propusieran los diagnósticos más probables y los próximos pasos. Importante: los datos fueron poco "limpiados" antes de la prueba. Los investigadores utilizaron el mismo texto ruidoso e incompleto que ve un médico en los primeros minutos: signos vitales, edad, descripción breve de las quejas de una enfermera, notas individuales del historial médico.

La verificación se realizó en tres etapas: en el momento del triaje, en el primer contacto con un médico, y en el punto de decisión sobre hospitalización en una sala o unidad de cuidados intensivos. Los evaluadores no sabían quién proporcionó la respuesta —un humano o el modelo.

Dónde la IA Demostró Ser Más Fuerte

El modelo mostró su ventaja más notable precisamente donde el médico tenía menos información. En el triaje inicial, OpenAI o1 proporcionó un diagnóstico preciso o muy cercano en el 67% de los casos. Entre los médicos en el mismo conjunto de pacientes, la tasa fue del 50–55%. Cuando había más datos disponibles, la precisión de la IA subió al 82%, mientras que los humanos alcanzaron el 70–79%; aquí la brecha ya no era estadísticamente significativa, pero la tendencia persistió. En tareas que implican la planificación de la gestión de casos, incluida la selección de pruebas, antibióticos y discusión de objetivos del tratamiento, el modelo también se desempeñó significativamente mejor.

  • 67% — diagnóstico preciso o cercano de la IA en el triaje inicial
  • 50–55% — resultados del médico en la misma etapa
  • 82% — precisión de la IA después de la llegada de datos adicionales
  • 89% — desempeño del modelo en tareas de gestión de casos versus 34% para médicos

Los autores proporcionaron un ejemplo revelador. En un caso, un paciente llegó con un coágulo en los pulmones y condición deteriorada. Los médicos asumieron que la terapia anticoagulante estándar había fallado. El modelo, sin embargo, conectó el cuadro con el lupus en el historial del paciente e hipotéticamente sugirió que la fuente del problema era la inflamación pulmonar en ese contexto. Posteriormente, esta versión se confirmó. Los investigadores señalaron particularmente que el modelo funcionaba con confianza en casos raros y complejos.

Por Qué Esto No es un Reemplazo para los Médicos

Estos resultados no significan que el servicio de emergencias pueda pasarse al piloto automático. El estudio probó principalmente el componente textual del razonamiento clínico: lectura de historiales médicos, construcción de un diagnóstico diferencial y sugerencia del siguiente paso. La IA no examinó al paciente, no vio expresiones de dolor, no escuchó la respiración, no evaluó la marcha, no trabajó con radiografías y EKGs de la manera que lo hace un médico al lado de la cama. Expertos externos ya han recordado que esto es más sobre una "segunda opinión ciega" basada en texto, que sobre la gestión completa del paciente en tiempo real.

"Estamos observando un cambio tecnológico verdaderamente profundo que transformará la medicina", dijo el coautor del estudio Arjun Manrai.

Pero los autores mismos enfatizan simultáneamente las limitaciones. Incluso si el modelo adivina más frecuentemente el diagnóstico principal correto, puede sugerir pruebas o intervenciones innecesarias que podrían dañar al paciente. Además, actualmente no existe un sistema claro de responsabilidad: ¿quién es responsable de un error si un médico confía en la sugerencia de un algoritmo? Por lo tanto, los investigadores hablan no de reemplazar al médico, sino de un nuevo formato de trabajo colaborativo, donde la IA sirve como un analista rápido y fuente de una segunda opinión, mientras que la decisión final sigue siendo del humano.

Lo Que Esto Significa

Para la medicina, esta es una señal de que los grandes modelos de lenguaje están saliendo de la fase de demostración y se acercan a la validación clínica real. El escenario a corto plazo no es un "AI doctor" autónomo sin personas, sino sistemas que revisan sin problemas los historiales electrónicos, sugieren posibilidades diagnósticas perdidas y ayudan a priorizar casos en el servicio de emergencias más rápidamente. La siguiente fase ahora es clara: no nuevos benchmarks, sino ensayos clínicos prospectivos, donde la atención se prestará no solo a la precisión de las respuestas, sino también a la seguridad, costo e impacto en los resultados del tratamiento.

ZK
Hamidun News
Noticias de AI sin ruido. Selección editorial diaria de más de 400 fuentes. Producto de Zhemal Khamidun, Head of AI en Alpina Digital.

¿Quieres dejar de leer sobre IA y empezar a usarla?

AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.

¿Qué te parece?
Cargando comentarios…