“AI医生”可能要来了!报告称:在疾病诊断方面,AI已超越人类!

2025年04月10日02:00:25 健康 3418

“人工智能医生” 已经近在眼前。

站长之家(chinaz.com)4 月 9 日 消息:一份报告显示,人工智能(ai)的实力在医疗诊断领域也超越了人类。据说,openai 的最新人工智能模型 gpt-4 比人类医生更出色。当地时间 8 日,美国斯坦福大学以人为本人工智能研究所(stanford institute for human-centered ai)发布了《2025 年人工智能指数报告(artificial intelligence index report 2025)》。根据该报告显示,在基于临床案例的诊断测试中,gpt-4 的准确率比人类医生高出了 16%。报告称:“总体而言,gpt-4 单独诊断的性能最高,结果也很稳定。” 接着又指出:“而人类医生单独诊断的性能较低”、“不过,当人类医生与人工智能协作时,根据使用方式的不同,成果差异很大” 。

《2025 年人工智能指数报告》中进行的人工智能与人类医生的诊断测试实验,是以向 gpt-4 和美国的 50 名临床医生(专科医生 26 名、普通医生 24 名)提供 6 名诊断难度较大患者的案例的方式进行的。之后再将 “gpt-4 单独诊断”、 “gpt-4 协作的人类医生”、以及“人类医生单独诊断” 的诊断结果进行比较。第一个实验是 “gpt-4 与人类医生对比”,第二个实验是 “与 gpt-4 协作的人类医生与人类医生对比”,以此来考察诊断的准确性。

结果显示,gpt-4 诊断组的准确率中位数(92%)比仅由人类医生诊断的组(76%)高出 16 个百分点。中位数是指将数据排列后位于正中间的数值。此外,与 gpt-4 协作的医生组的中位数(76%)仅比人类医生单独诊断的组(74%)高出 2 个百分点,这一差异也并不显著。关于准确率,由两名未直接参与实验的内科专科医生按照预先设定的标准进行了独立评估。他们在不知道每个诊断是谁做出的情况下进行了打分。

“AI医生”可能要来了!报告称:在疾病诊断方面,AI已超越人类! - 天天要闻

这份报告的评估意义在于,它展示了ai在医疗现场的地位正在发生变化 —— ai 不仅被广泛应用于机器人手术、医学数据分析,还包括基于人工智能的癌症筛查解决方案等诸多领域。但此前它一直停留在辅助医生判断的领域。

作为全球最具公信力的人工智能白皮书之一,《人工智能指数报告》得出了“像 gpt-4 这样的生成式 ai 模型比医生诊断得更好”的分析结果,同时也预测:在不久的将来,在医院里看到 ai 医生将成为稀松平常之事!

报告评价道:“这次实验结果总体上表明,gpt-4 诊断的性能最高、且具有一致性”,“即使 ai 与人类医生协作,根据医生个人的判断方式和运用能力的不同,结果也会有所不同”。接着还指出:“最近,在癌症检测和重症患者识别等领域,也有研究表明人工智能的表现优于医疗工作者”、“人工智能的应用范围正在从单纯的诊断扩展到更复杂的临床判断领域” 。

与此同时,在衡量 gpt-4 临床知识性能的代表性标准 “medqa” 基准测试中,gpt-4 去年的准确率达到了 96.0%。与 2022 年的 67.6% 相比,这一数值大幅提高了 28.4 个百分点。medqa 是基于美国医生国家考试水平的医学问题而构建的测试,用于评估人工智能的临床知识水平。

报告还补充道:“有研究结果表明,人工智能与医生的协作能够产生最佳结果,因此这一领域将成为未来重要的研究课题”、“但人工智能系统本身也具有一定的潜在风险,例如产生与事实不符信息的‘ai幻觉’问题、或不可预测的错误等,人们对其可靠性和安全性仍存疑,因此需要制定考虑到这些风险因素的政策应对措施” 。

健康分类资讯推荐

内镜下开“隧道” 精准摘除消化道肿瘤 - 天天要闻

内镜下开“隧道” 精准摘除消化道肿瘤

【来源:红网】为患者实施手术。红网时刻新闻通讯员 鄢婷 肖会玲 娄底报道近日,娄底市第一人民医院消化内科团队成功运用隧道法内镜黏膜下剥离术(ESTD)为一名乙状结肠早癌患者实施微创治疗。此项技术的开展,填补了娄底市该领域的空白,为提升内镜微
血常规上的“箭头”代表什么?这4个指标很关键→ - 天天要闻

血常规上的“箭头”代表什么?这4个指标很关键→

拿到血常规报告单时许多人不知道该看哪个指标看到箭头多先别慌抓住这几个关键指标白细胞、血小板、血红蛋白+红细胞就能快速抓住重点↓↓↓血常规优先关注这4个核心指标红细胞(RBC)+血红蛋白(HGB)红细胞是血液中数量最多的一种血细胞。
科学与健康丨第一时间掌握!首个国家级高温健康风险预警来了 - 天天要闻

科学与健康丨第一时间掌握!首个国家级高温健康风险预警来了

新华社北京7月2日电 题:第一时间掌握!首个国家级高温健康风险预警来了新华社记者顾天成7月2日,国家疾控局和中国气象局联合发布首个国家级高温健康风险预警和健康提示。为何发布国家级高温健康风险预警,如何分级?与普通天气预报有哪些不同?怎样筑牢高温下的“健康防线”?——预警分5个等级,按照与高温相关疾病风险分...
一动就出汗的人,是身体虚?可能得排查一下这4种病! - 天天要闻

一动就出汗的人,是身体虚?可能得排查一下这4种病!

闷热的天气出汗多,这不难理解。但同样的环境下,有人轻汗微微,有人则汗流浃背,甚至吃个饭,稍微走一走,整个后背都湿了……爱出汗的人,是身体虚吗?需要警惕哪些疾病风险?01比别人出汗多,或是天生的出汗是人体调节体温的重要手段。
荣耀手表5 Ultra发布:首发防猝筛查研究与心脑血管风险评估 - 天天要闻

荣耀手表5 Ultra发布:首发防猝筛查研究与心脑血管风险评估

在 7 月 2 日的荣耀 Magic V5 暨 AI 终端生态发布会上,荣耀正式推出了全新的旗舰智能手表 —— 荣耀手表 5 Ultra,并行业首发“防猝筛查研究”与“China-PAR 国人专属心脑血管风险评估”两大创新健康能力,以“AI 健康专家”的身份,为用户带来全方位的心脏健康守护与个性化健康管理体验。据介绍,荣耀手表 5 Ultra 行业首...
张家港首家“小哥体检中心”启用 - 天天要闻

张家港首家“小哥体检中心”启用

昨天(7月1日)下午,张家港市健康护航·“新”有所医关爱新就业群体健康项目启动,张家港市首家“小哥体检中心”正式揭牌。外卖小哥在“小哥体检中心”体检。通讯员 袁艺/摄新就业群体是城市建设发展的重要力量。
脾虚湿重别只知道参苓白术丸!这味中成药才是“全能选手”! - 天天要闻

脾虚湿重别只知道参苓白术丸!这味中成药才是“全能选手”!

一说到脾虚湿重,十个人里八个都知道参苓白术丸。但你有没有发现:吃了一阵子,舌苔还是厚得像白漆,肚子依旧胀得像气球?其实啊,调理脾虚湿重就像修下水道——光往堵了的管道里倒“补药营养液”可不行,得一边排水、一边修管道,双管齐下才有效! 为什么参
脾虚调理误区:别瞎补!中医说关键要让脾胃“动起来” - 天天要闻

脾虚调理误区:别瞎补!中医说关键要让脾胃“动起来”

很多人一听说脾虚,第一反应就是买人参、山药、黄精猛补,结果越吃越胃胀、口干,甚至便秘——其实这是踩了调理的大雷!中医里“脾虚”的核心不是“缺营养”,而是脾胃的“运化功能”罢工了。就像厨房下水道堵了,你还拼命倒鸡汤,只会让管道更堵一样,补脾前
提醒父母:服用他汀时,饮食上要少吃“4物”,一定要记在心上 - 天天要闻

提醒父母:服用他汀时,饮食上要少吃“4物”,一定要记在心上

“医生说我胆固醇高,给我开了他汀……可是我还爱吃肉,还能吃吗?”“听说吃他汀不能喝柚子汁,是不是真的?”类似这样的提问,在门诊上几乎天天都能遇到。确实,他汀类药物是目前治疗高胆固醇、预防心脑血管疾病的“主力选手”,很多中老年人长期服用。