“AI医生”可能要来了!报告称:在疾病诊断方面,AI已超越人类!

2025年04月10日02:00:25 健康 3418

“人工智能医生” 已经近在眼前。

站长之家(chinaz.com)4 月 9 日 消息:一份报告显示,人工智能(ai)的实力在医疗诊断领域也超越了人类。据说,openai 的最新人工智能模型 gpt-4 比人类医生更出色。当地时间 8 日,美国斯坦福大学以人为本人工智能研究所(stanford institute for human-centered ai)发布了《2025 年人工智能指数报告(artificial intelligence index report 2025)》。根据该报告显示,在基于临床案例的诊断测试中,gpt-4 的准确率比人类医生高出了 16%。报告称:“总体而言,gpt-4 单独诊断的性能最高,结果也很稳定。” 接着又指出:“而人类医生单独诊断的性能较低”、“不过,当人类医生与人工智能协作时,根据使用方式的不同,成果差异很大” 。

《2025 年人工智能指数报告》中进行的人工智能与人类医生的诊断测试实验,是以向 gpt-4 和美国的 50 名临床医生(专科医生 26 名、普通医生 24 名)提供 6 名诊断难度较大患者的案例的方式进行的。之后再将 “gpt-4 单独诊断”、 “gpt-4 协作的人类医生”、以及“人类医生单独诊断” 的诊断结果进行比较。第一个实验是 “gpt-4 与人类医生对比”,第二个实验是 “与 gpt-4 协作的人类医生与人类医生对比”,以此来考察诊断的准确性。

结果显示,gpt-4 诊断组的准确率中位数(92%)比仅由人类医生诊断的组(76%)高出 16 个百分点。中位数是指将数据排列后位于正中间的数值。此外,与 gpt-4 协作的医生组的中位数(76%)仅比人类医生单独诊断的组(74%)高出 2 个百分点,这一差异也并不显著。关于准确率,由两名未直接参与实验的内科专科医生按照预先设定的标准进行了独立评估。他们在不知道每个诊断是谁做出的情况下进行了打分。

“AI医生”可能要来了!报告称:在疾病诊断方面,AI已超越人类! - 天天要闻

这份报告的评估意义在于,它展示了ai在医疗现场的地位正在发生变化 —— ai 不仅被广泛应用于机器人手术、医学数据分析,还包括基于人工智能的癌症筛查解决方案等诸多领域。但此前它一直停留在辅助医生判断的领域。

作为全球最具公信力的人工智能白皮书之一,《人工智能指数报告》得出了“像 gpt-4 这样的生成式 ai 模型比医生诊断得更好”的分析结果,同时也预测:在不久的将来,在医院里看到 ai 医生将成为稀松平常之事!

报告评价道:“这次实验结果总体上表明,gpt-4 诊断的性能最高、且具有一致性”,“即使 ai 与人类医生协作,根据医生个人的判断方式和运用能力的不同,结果也会有所不同”。接着还指出:“最近,在癌症检测和重症患者识别等领域,也有研究表明人工智能的表现优于医疗工作者”、“人工智能的应用范围正在从单纯的诊断扩展到更复杂的临床判断领域” 。

与此同时,在衡量 gpt-4 临床知识性能的代表性标准 “medqa” 基准测试中,gpt-4 去年的准确率达到了 96.0%。与 2022 年的 67.6% 相比,这一数值大幅提高了 28.4 个百分点。medqa 是基于美国医生国家考试水平的医学问题而构建的测试,用于评估人工智能的临床知识水平。

报告还补充道:“有研究结果表明,人工智能与医生的协作能够产生最佳结果,因此这一领域将成为未来重要的研究课题”、“但人工智能系统本身也具有一定的潜在风险,例如产生与事实不符信息的‘ai幻觉’问题、或不可预测的错误等,人们对其可靠性和安全性仍存疑,因此需要制定考虑到这些风险因素的政策应对措施” 。

健康分类资讯推荐

为何人最终都会死亡呢?医生从血管的角度来讲,答案很简单 - 天天要闻

为何人最终都会死亡呢?医生从血管的角度来讲,答案很简单

在我们的日常生活中,时不时会遇到一些被疾病折磨得痛苦不堪的患者。他们中,有些正经历着慢性疾病的折磨,比如高血压、糖尿病、冠心病,每天都在与身体的“不听话”作斗争。这些疾病不仅影响了他们的生活和工作,更带来了心理上的沉重负担。
大便是肠胃的镜子,出现这3种大便,赶紧调调脾胃 - 天天要闻

大便是肠胃的镜子,出现这3种大便,赶紧调调脾胃

在繁忙的工作和多变的生活节奏中,许多人或多或少都会遇到一些肠胃不适的困扰。或是经常腹泻,影响了工作效率;或是便秘缠身,让人焦躁不安;又或是不明原因的腹胀、消化不良,严重时甚至影响生活质量。有时候,我们会去医院做个检查,医生说“注意饮食,调整
让呼吸更自由!2025世界哮喘日科普活动在广州举办 - 天天要闻

让呼吸更自由!2025世界哮喘日科普活动在广州举办

2025年5月6日是第27个世界哮喘日,今年主题为“让吸入治疗惠及所有哮喘患者”。为提升公众对哮喘防治的认知水平,由国家呼吸系统疾病临床医学研究中心、广州呼吸健康研究院、生物岛实验室指导,广东省呼吸与健康学会主办,广州市广播电视台协办的“护肺健康 畅享呼吸”世界哮喘日科普活动,在广州国际媒体港举行。院士、专...
【有医说医】第27个世界哮喘日:我国患者超4500万人,有病还能运动吗? - 天天要闻

【有医说医】第27个世界哮喘日:我国患者超4500万人,有病还能运动吗?

“每次发作时,感觉我就像是一条被捞出水的鱼,又像被吸进外太空,空气稀薄,控制不了一点。”这是哮喘患者在网络分享的自嘲留言,诙谐中透着无奈,也让更多人直观感受到,哮喘并非小病,而是一种随时可能打乱生活节奏的慢性疾病。每年春季,全国各地树木植物陆续进入飞絮期,加之气候温差频繁变化,通常被视为哮喘急性发作...
《黄帝内经》空腹睡觉的智慧:不吃夜宵反而更健康? - 天天要闻

《黄帝内经》空腹睡觉的智慧:不吃夜宵反而更健康?

现代人睡前刷手机、吃夜宵已成习惯,但2300年前的《黄帝内经》却提出"胃不和则卧不安",主张"空腹而眠"。古人这种反常识的养生法,如今被科学证实:适当饥饿感能让睡眠质量翻倍!今天我们就来破解这个"饿着睡更香"的千古谜题。 一、《黄帝内经》到
刚睡醒还累?身体在给你发“信号”啦! - 天天要闻

刚睡醒还累?身体在给你发“信号”啦!

你有没有过这样的经历:晚上早早爬上床,一觉睡到自然醒,可起床后还是感觉浑身疲惫,就像没睡过一样。这是咋回事呢?今天咱就来唠唠,为啥刚睡醒身体却还是很累。 在古代,人们就很重视睡眠,中医经典《黄帝内经》里就提到“起居有常”,强调了合理作息对
带状疱疹引发“世界第一痛”,甘肃老人坐飞机来汉接受微创除痛 - 天天要闻

带状疱疹引发“世界第一痛”,甘肃老人坐飞机来汉接受微创除痛

极目新闻通讯员 张梦石 谯玲玲 钟亚春76岁的吴奶奶近日从甘肃兰州坐飞机来到湖北武汉,接受“世界第一痛”即三叉神经痛的治疗。5月6日,在武汉市第一医院疼痛科病房内,老人术后疼痛大为缓解,即将出院的她拉着医护的手道别。老人拉着医护的手表示感谢 通讯员 代雨朦 摄吴奶奶家住甘肃省兰州市,育有一儿三女。20多天前,其...
手脚一旦出现这4种异常,很可能是血管堵了,尽早检查 - 天天要闻

手脚一旦出现这4种异常,很可能是血管堵了,尽早检查

日常生活中,许多人忽视了生活习惯对血管的毁灭性伤害,不知不觉中,血管就悄悄“报废”了。那么,哪些习惯会加速血管的“报废”?出现哪些异常,意味着血管堵了?一起来看 年轻人常做的3件事正加速血管报废 ■高糖饮食每天奶茶甜点不离口,熬夜还要吃夜宵,这些习惯会不断腐蚀血管内皮,让血管壁“坑坑洼洼”。■高...
《中国医药指南》:深表歉意,辞退涉事编辑 - 天天要闻

《中国医药指南》:深表歉意,辞退涉事编辑

【来源:新闻晨报】此前被媒体报道的 多篇妇科论文及文献中出现“男性病例”一事中 ,其中两篇涉及文献均发表在《中国医药指南》期刊,如宫颈癌、高危产妇等论文中出现多个男性病例。