AI健康工具激增，但实际效果如何？

人工智能

如今，AI健康工具的数量前所未有地增多——但它们的实际效果究竟如何？

针对医疗资源获取受限人群，专业聊天机器人或许能带来切实改变。然而，在缺乏充分测试的情况下，我们尚无法判断这些工具究竟是有益还是有害。

作者：格蕾丝·哈金斯（Grace Huckins）档案页面 2026年3月30日

萨拉·罗杰斯 / MITTR | Getty Images

执行摘要

本月早些时候，微软推出了“Copilot Health”——这是其Copilot应用中新增的一个功能模块，用户可在此连接个人医疗记录，并就自身健康状况提出具体问题。几天前，亚马逊宣布将此前仅限于其One Medical会员使用的基于大语言模型（LLM）的Health AI工具，面向更广泛用户开放。这些产品加入到OpenAI去年1月推出的ChatGPT Health以及Anthropic的Claude之列——后者在获得授权后亦可访问用户健康数据。由此可见，“面向大众的健康AI”已正式成为一股趋势。

鉴于当前许多人在现有医疗体系下仍难以获得可靠健康建议，公众对提供健康咨询的聊天机器人存在明确需求。部分研究表明，目前的大语言模型确实具备提供安全、实用建议的能力。然而，研究者指出，这些工具应由独立专家进行更为严谨的评估，理想情况下应在大规模推广前完成。

在医疗这一高风险领域，若仅依赖企业自身对其产品的评估，可能并不明智，尤其当这些评估结果未向外部专家公开时。即便部分企业（如OpenAI）确实在开展高质量、严谨的研究工作，它们仍可能因视角局限而存在盲点，而更广泛的学术研究共同体则有望弥补这些不足。

牛津互联网研究所博士候选人安德鲁·比恩（Andrew Bean）表示：“只要人类始终需要更多医疗服务，我认为我们理应全力探索一切可行路径。我完全相信，这些模型目前已发展到足以投入实际应用的程度。”

但他同时强调：“不过，相关证据基础必须足够扎实。”

转折点

据开发者介绍，这些健康类产品的推出，正是由于生成式人工智能在能力上已取得显著突破，能够有效提供医学建议。微软AI副总裁兼医疗业务负责人多米尼克·金（Dominic King）曾是一名外科医生，他指出，AI技术的进步是微软组建健康团队并推出Copilot Health的核心动因。“我们亲眼见证了生成式AI在回答健康问题及给出优质回应方面取得的巨大进展，”他表示。

但金也指出，这仅是故事的一半；另一关键因素则是真实需求。就在Copilot Health上线前夕，微软发布了一份报告及其配套博客文章，详细阐述了人们如何使用Copilot获取健康建议。该公司称，其每日接收约5000万条健康相关提问，而健康话题也是Copilot平台上最受欢迎的讨论主题之一。