Guardian→ original

Harvard: AI é mais precisa que médicos na triagem de pacientes no pronto-socorro

Harvard e Beth Israel Deaconess compararam o OpenAI o1 com médicos em casos reais do pronto-socorro. Na triagem inicial, o modelo forneceu com mais…

Processado por IA de Guardian; editado por Hamidun News
Harvard: AI é mais precisa que médicos na triagem de pacientes no pronto-socorro
Fonte: Guardian. Colagem: Hamidun News.
◐ Ouvir artigo

Uma equipe da Harvard Medical School e do Beth Israel Deaconess Medical Center relatou que o modelo de raciocínio o1 da OpenAI demonstrou maior precisão do que médicos em uma série de tarefas de diagnóstico emergencial. O resultado mais notável foi no estágio da triagem inicial no pronto-socorro, onde os dados são limitados, mas as decisões precisam ser tomadas rapidamente.

Como a Comparação Foi Realizada

O estudo foi publicado em 30 de abril de 2026 na revista Science e se tornou uma das maiores tentativas de comparar IA não com testes de exame, mas com trabalho clínico real. Os autores executaram o modelo através de seis experimentos: desde casos diagnósticos complexos e raciocínio probabilístico até tarefas envolvendo seleção de táticas clínicas futuras. A parte chave do trabalho envolveu 76 casos reais do pronto-socorro de um hospital em Boston.

O modelo e os médicos receberam registros idênticos dos prontuários eletrônicos e foram solicitados a propor os diagnósticos mais prováveis e os próximos passos. Importante: os dados foram pouco "limpos" antes do teste. Os pesquisadores usaram o mesmo texto barulhento e incompleto que um médico vê nos primeiros minutos: sinais vitais, idade, descrição breve das queixas de uma enfermeira, notas individuais do histórico médico.

A verificação ocorreu em três estágios: no momento da triagem, no primeiro contato com um médico e no ponto de decisão sobre hospitalização em uma enfermaria ou unidade de terapia intensiva. Os avaliadores não sabiam quem forneceu a resposta — um humano ou o modelo.

Onde a IA Mostrou-se Mais Forte

O modelo mostrou sua vantagem mais notável precisamente onde o médico tinha menos informações. Na triagem inicial, o OpenAI o1 forneceu um diagnóstico preciso ou muito próximo em 67% dos casos. Entre os médicos no mesmo conjunto de pacientes, a taxa ficou na faixa de 50–55%. Quando mais dados ficaram disponíveis, a precisão da IA subiu para 82%, enquanto os humanos alcançaram 70–79%; aqui a lacuna não era mais estatisticamente significativa, mas a tendência persistiu. Em tarefas envolvendo planejamento de gerenciamento de casos, incluindo seleção de testes, antibióticos e discussão de objetivos de tratamento, o modelo também teve desempenho significativamente melhor.

  • 67% — diagnóstico preciso ou próximo da IA na triagem inicial
  • 50–55% — resultados do médico no mesmo estágio
  • 82% — precisão da IA após chegada de dados adicionais
  • 89% — desempenho do modelo em tarefas de gerenciamento de casos versus 34% para médicos

Os autores forneceram um exemplo revelador. Em um caso, um paciente chegou com um coágulo nos pulmões e condição deteriorada. Os médicos assumiram que a terapia anticoagulante padrão tinha falhado. O modelo, porém, conectou o quadro ao lúpus no histórico do paciente e hipotetizou que a fonte do problema era inflamação pulmonar nesse contexto. Mais tarde, essa versão foi confirmada. Os pesquisadores notaram particularmente que o modelo funcionava com confiança com casos raros e complexos.

Por Que Isto Não é um Substituto para Médicos

Esses resultados não significam que o pronto-socorro possa ser comutado para piloto automático. O estudo testou principalmente o componente textual do raciocínio clínico: leitura de prontuários médicos, construção de um diagnóstico diferencial e sugestão do próximo passo. A IA não examinou o paciente, não viu expressões de dor, não ouviu a respiração, não avaliou a marcha, não trabalhou com radiografias e EKGs da maneira como um médico faz à beira do leito. Especialistas externos já lembraram que se trata mais de uma "segunda opinião cega" baseada em texto, do que de gerenciamento completo do paciente em tempo real.

"Estamos observando uma mudança tecnológica verdadeiramente profunda que mudará a medicina", disse o co-autor do estudo Arjun Manrai.

Mas os próprios autores simultaneamente enfatizam as limitações. Mesmo que o modelo adivinhe mais frequentemente o diagnóstico principal correto, pode sugerir testes ou intervenções desnecessárias que poderiam prejudicar o paciente. Além disso, atualmente não há um sistema claro de responsabilidade: quem é responsável por um erro se um médico confiar na sugestão de um algoritmo? Portanto, os pesquisadores falam não em substituir o médico, mas em um novo formato de trabalho colaborativo, onde a IA serve como um analista rápido e fonte de uma segunda opinião, enquanto a decisão final permanece com o humano.

O Que Isto Significa

Para a medicina, este é um sinal de que grandes modelos de linguagem estão saindo da fase de demonstração e se aproximando da validação clínica real. O cenário de curto prazo não é um "AI doctor" autônomo sem pessoas, mas sistemas que revisam perfeitamente prontuários eletrônicos, sugerem possibilidades diagnósticas perdidas e ajudam a priorizar casos no pronto-socorro mais rapidamente. A próxima fase agora é clara: não novos benchmarks, mas ensaios clínicos prospectivos, onde a atenção será dada não apenas à precisão das respostas, mas também à segurança, custo e impacto nos resultados do tratamento.

ZK
Hamidun News
Notícias de AI sem ruído. Seleção editorial diária de mais de 400 fontes. Produto de Zhemal Khamidun, Head of AI na Alpina Digital.

Quer parar de ler sobre IA e começar a usar?

AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.

O que você acha?
Carregando comentários…