哈佛大学最新研究发现,OpenAI 的 o1 模型在急诊分诊和临床管理中表现优于人类医生。在涉及 76 个真实病例的测试中,该模型诊断准确率达 67%,显著高于专科医生的 50%-55%。研究通过六项实验证实,具备“思维链”推理能力的 AI 在处理复杂病情时优势稳定。尽管如此,研究人员强调目前 AI 尚未准备好独立投入常规临床应用,建议将其作为辅助医生的“第二诊疗意见”,以提升诊断安全性与准确性。
更新
红色邮件
23°
特拉维夫 - 雅法
搜索
主页
以色列新闻
中东与世界新闻
科技与数字
房地产
金融
生活方式
健康与科学
犹太世界
旅游
更多
频道
观点
杂志
体育
美食
天气
播客
网站与来源
Ynet
Calcalist
yad2
ynetespanol
Вести
mynet
联系我们
隐私政策
使用条款
无障碍声明
呼叫 AI 医生:在诊断错综复杂时,机器已胜过人类医生
哈佛大学最新研究发现,OpenAI 的 o1 模型在急诊分诊和临床管理方面表现优于医生,但研究人员警告,该结果并不意味着人工智能已准备好投入常规临床应用;目前,他们建议将其作为“第二诊疗意见”使用。
作者:奥伦·赖斯(Oren Reiss)
发表评论 | 打印 | 发现错误?请向我们报告
一名患者因肺部血凝块被送入急诊室。其病情一度好转,却突然恶化。医疗团队怀疑治疗失败。
就在此时,人工智能介入:在扫描该患者的病历后,它提出了一个截然不同的判断:患者有狼疮病史,这是一种可引发心脏炎症的自身免疫性疾病,而根据该模型的推理,这恰恰解释了病情的恶化。事后证实,这一判断完全正确。
图片说明:AI 辅助分诊与医生诊断之间的差距稳定且显著。(图片来源:Shutterstock)
这并非医疗剧中的虚构情节,而是不久前发生在波士顿贝斯以色列女执事医疗中心(Beth Israel Deaconess Medical Center)急诊室的真实案例。近日发表于权威期刊《科学》(Science)的一项新研究指出,此类场景或许很快将成为常态,而该研究发现的 AI 模型优势尤为引人注目。
六项实验,一个结论
这项由哈佛大学与贝斯以色列女执事医疗中心的研究人员牵头、并联合斯坦福大学学者共同开展的研究,并未依赖单一测试。研究人员设计了六项独立实验,将 OpenAI 最新一代具备“思维链”(chain-of-thought)推理能力的 o1 模型——该模型可在得出结论前逐步推理——与数百名不同培训背景和临床经验水平的医生(包括住院医师、专科医生和家庭医师)进行对比。在每一项实验中,无一例外,该模型的表现均优于人类医生。
其中最具代表性、最贴近真实临床实践的实验,采用了来自贝斯以色列急诊室的 76 个真实病例。模型与两名专科医生接收完全相同的数据:电子病历、生命体征以及接诊护士撰写的简短描述。另有两位不知晓各诊断来源的医生对结果进行评估。
结果显示,差距稳定且显著。在信息有限、压力最大的分诊阶段,该模型在 67% 的病例中给出了正确或高度接近的诊断;第一位医生的准确率为 55%,第二位为 50%。随着更多信息的获取,所有参与者的准确率均有提升。然而……
来源:ynetnews.com
