Harvard: AI más precisa que los médicos en el triaje de pacientes en urgencias

Q: ¿Cuál es la fuente?

Publicado originalmente en Guardian. Hamidun News procesa y adapta los materiales con IA.

Q: ¿Cuándo se publicó?

30 abr 2026. Tiempo de lectura: 3 min.

Harvard y Beth Israel Deaconess compararon OpenAI o1 con médicos en casos reales del servicio de urgencias. En la etapa de triaje inicial, el modelo dio con…

Redacción de Hamidun News

Monitoreo de AI · Guardian

30 abr 2026· 3 min

Procesado por IA desde Guardian; editado por Hamidun News

Harvard: AI más precisa que los médicos en el triaje de pacientes en urgencias — Fuente: Guardian. Collage: Hamidun News.

◐ Escuchar artículo

Un equipo de la Escuela de Medicina de Harvard y el Centro Médico Beth Israel Deaconess informó que el modelo de razonamiento o1 de OpenAI demostró mayor precisión que los médicos en una serie de tareas de diagnóstico de emergencia. El resultado más notable fue en la etapa del triaje inicial en el servicio de emergencias, donde los datos son limitados pero las decisiones deben tomarse rápidamente.

Cómo se Realizó la Comparación

El estudio fue publicado el 30 de abril de 2026 en la revista Science y se convirtió en uno de los mayores intentos de comparar la IA no con pruebas de examen, sino con trabajo clínico real. Los autores ejecutaron el modelo a través de seis experimentos: desde casos diagnósticos complejos y razonamiento probabilístico hasta tareas que implican la selección de futuras tácticas clínicas. La parte clave del trabajo involucró 76 casos reales del servicio de emergencias de un hospital en Boston.

El modelo y los médicos recibieron registros idénticos de historiales médicos electrónicos y se les pidió que propusieran los diagnósticos más probables y los próximos pasos. Importante: los datos fueron poco "limpiados" antes de la prueba. Los investigadores utilizaron el mismo texto ruidoso e incompleto que ve un médico en los primeros minutos: signos vitales, edad, descripción breve de las quejas de una enfermera, notas individuales del historial médico.

La verificación se realizó en tres etapas: en el momento del triaje, en el primer contacto con un médico, y en el punto de decisión sobre hospitalización en una sala o unidad de cuidados intensivos. Los evaluadores no sabían quién proporcionó la respuesta —un humano o el modelo.

Dónde la IA Demostró Ser Más Fuerte

El modelo mostró su ventaja más notable precisamente donde el médico tenía menos información. En el triaje inicial, OpenAI o1 proporcionó un diagnóstico preciso o muy cercano en el 67% de los casos. Entre los médicos en el mismo conjunto de pacientes, la tasa fue del 50–55%. Cuando había más datos disponibles, la precisión de la IA subió al 82%, mientras que los humanos alcanzaron el 70–79%; aquí la brecha ya no era estadísticamente significativa, pero la tendencia persistió. En tareas que implican la planificación de la gestión de casos, incluida la selección de pruebas, antibióticos y discusión de objetivos del tratamiento, el modelo también se desempeñó significativamente mejor.

67% — diagnóstico preciso o cercano de la IA en el triaje inicial
50–55% — resultados del médico en la misma etapa
82% — precisión de la IA después de la llegada de datos adicionales
89% — desempeño del modelo en tareas de gestión de casos versus 34% para médicos

Los autores proporcionaron un ejemplo revelador. En un caso, un paciente llegó con un coágulo en los pulmones y condición deteriorada. Los médicos asumieron que la terapia anticoagulante estándar había fallado. El modelo, sin embargo, conectó el cuadro con el lupus en el historial del paciente e hipotéticamente sugirió que la fuente del problema era la inflamación pulmonar en ese contexto. Posteriormente, esta versión se confirmó. Los investigadores señalaron particularmente que el modelo funcionaba con confianza en casos raros y complejos.

Por Qué Esto No es un Reemplazo para los Médicos

Estos resultados no significan que el servicio de emergencias pueda pasarse al piloto automático. El estudio probó principalmente el componente textual del razonamiento clínico: lectura de historiales médicos, construcción de un diagnóstico diferencial y sugerencia del siguiente paso. La IA no examinó al paciente, no vio expresiones de dolor, no escuchó la respiración, no evaluó la marcha, no trabajó con radiografías y EKGs de la manera que lo hace un médico al lado de la cama. Expertos externos ya han recordado que esto es más sobre una "segunda opinión ciega" basada en texto, que sobre la gestión completa del paciente en tiempo real.

"Estamos observando un cambio tecnológico verdaderamente profundo que transformará la medicina", dijo el coautor del estudio Arjun Manrai.

Pero los autores mismos enfatizan simultáneamente las limitaciones. Incluso si el modelo adivina más frecuentemente el diagnóstico principal correto, puede sugerir pruebas o intervenciones innecesarias que podrían dañar al paciente. Además, actualmente no existe un sistema claro de responsabilidad: ¿quién es responsable de un error si un médico confía en la sugerencia de un algoritmo? Por lo tanto, los investigadores hablan no de reemplazar al médico, sino de un nuevo formato de trabajo colaborativo, donde la IA sirve como un analista rápido y fuente de una segunda opinión, mientras que la decisión final sigue siendo del humano.

Lo Que Esto Significa

Para la medicina, esta es una señal de que los grandes modelos de lenguaje están saliendo de la fase de demostración y se acercan a la validación clínica real. El escenario a corto plazo no es un "AI doctor" autónomo sin personas, sino sistemas que revisan sin problemas los historiales electrónicos, sugieren posibilidades diagnósticas perdidas y ayudan a priorizar casos en el servicio de emergencias más rápidamente. La siguiente fase ahora es clara: no nuevos benchmarks, sino ensayos clínicos prospectivos, donde la atención se prestará no solo a la precisión de las respuestas, sino también a la seguridad, costo e impacto en los resultados del tratamiento.

Hamidun News

Noticias de AI sin ruido. Selección editorial diaria de más de 400 fuentes. Producto de Zhemal Khamidun, Head of AI en Alpina Digital.

Canal de Telegram RSS hamidun.com

¿Quieres dejar de leer sobre IA y empezar a usarla?

AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.

🎓 Academy — 7 días gratis Consulta gratuita