近期,微软Copilot Health、亚马逊Health AI、OpenAI ChatGPT Health及Anthropic Claude等健康类AI工具相继面向公众开放,旨在缓解医疗资源不足人群的健康咨询难题。尽管部分研究显示大语言模型具备提供安全建议的能力,专家强调需经独立严谨评估后再推广,避免仅依赖企业内部测试。牛津大学博士候选人安德鲁·比恩认为模型已具备实际应用基础,但证据必须扎实;微
人工智能
如今,AI健康工具的数量前所未有地增多——但它们的实际效果究竟如何?
针对医疗资源获取受限人群,专业聊天机器人或许能带来切实改变。然而,在缺乏充分测试的情况下,我们尚无法判断这些工具究竟是有益还是有害。
作者:格蕾丝·哈金斯(Grace Huckins) 档案页面 2026年3月30日
萨拉·罗杰斯 / MITTR | Getty Images
执行摘要
本月早些时候,微软推出了“Copilot Health”——这是其Copilot应用中新增的一个功能模块,用户可在此连接个人医疗记录,并就自身健康状况提出具体问题。几天前,亚马逊宣布将此前仅限于其One Medical会员使用的基于大语言模型(LLM)的Health AI工具,面向更广泛用户开放。这些产品加入到OpenAI去年1月推出的ChatGPT Health以及Anthropic的Claude之列——后者在获得授权后亦可访问用户健康数据。由此可见,“面向大众的健康AI”已正式成为一股趋势。
鉴于当前许多人在现有医疗体系下仍难以获得可靠健康建议,公众对提供健康咨询的聊天机器人存在明确需求。部分研究表明,目前的大语言模型确实具备提供安全、实用建议的能力。然而,研究者指出,这些工具应由独立专家进行更为严谨的评估,理想情况下应在大规模推广前完成。
在医疗这一高风险领域,若仅依赖企业自身对其产品的评估,可能并不明智,尤其当这些评估结果未向外部专家公开时。即便部分企业(如OpenAI)确实在开展高质量、严谨的研究工作,它们仍可能因视角局限而存在盲点,而更广泛的学术研究共同体则有望弥补这些不足。
牛津互联网研究所博士候选人安德鲁·比恩(Andrew Bean)表示:“只要人类始终需要更多医疗服务,我认为我们理应全力探索一切可行路径。我完全相信,这些模型目前已发展到足以投入实际应用的程度。”
但他同时强调:“不过,相关证据基础必须足够扎实。”
转折点
据开发者介绍,这些健康类产品的推出,正是由于生成式人工智能在能力上已取得显著突破,能够有效提供医学建议。微软AI副总裁兼医疗业务负责人多米尼克·金(Dominic King)曾是一名外科医生,他指出,AI技术的进步是微软组建健康团队并推出Copilot Health的核心动因。“我们亲眼见证了生成式AI在回答健康问题及给出优质回应方面取得的巨大进展,”他表示。
但金也指出,这仅是故事的一半;另一关键因素则是真实需求。就在Copilot Health上线前夕,微软发布了一份报告及其配套博客文章,详细阐述了人们如何使用Copilot获取健康建议。该公司称,其每日接收约5000万条健康相关提问,而健康话题也是Copilot平台上最受欢迎的讨论主题之一。
来源:Grace Huckins
