「AI醫生」可能要來了!報告稱:在疾病診斷方面,AI已超越人類!

2025年04月10日02:00:25 健康 3418

「人工智慧醫生」 已經近在眼前。

站長之家(chinaz.com)4 月 9 日 消息:一份報告顯示,人工智慧(ai)的實力在醫療診斷領域也超越了人類。據說,openai 的最新人工智慧模型 gpt-4 比人類醫生更出色。當地時間 8 日,美國斯坦福大學以人為本人工智慧研究所(stanford institute for human-centered ai)發布了《2025 年人工智慧指數報告(artificial intelligence index report 2025)》。根據該報告顯示,在基於臨床案例的診斷測試中,gpt-4 的準確率比人類醫生高出了 16%。報告稱:「總體而言,gpt-4 單獨診斷的性能最高,結果也很穩定。」 接著又指出:「而人類醫生單獨診斷的性能較低」、「不過,當人類醫生與人工智慧協作時,根據使用方式的不同,成果差異很大」 。

《2025 年人工智慧指數報告》中進行的人工智慧與人類醫生的診斷測試實驗,是以向 gpt-4 和美國的 50 名臨床醫生(專科醫生 26 名、普通醫生 24 名)提供 6 名診斷難度較大患者的案例的方式進行的。之後再將 「gpt-4 單獨診斷」、 「gpt-4 協作的人類醫生」、以及「人類醫生單獨診斷」 的診斷結果進行比較。第一個實驗是 「gpt-4 與人類醫生對比」,第二個實驗是 「與 gpt-4 協作的人類醫生與人類醫生對比」,以此來考察診斷的準確性。

結果顯示,gpt-4 診斷組的準確率中位數(92%)比僅由人類醫生診斷的組(76%)高出 16 個百分點。中位數是指將數據排列後位於正中間的數值。此外,與 gpt-4 協作的醫生組的中位數(76%)僅比人類醫生單獨診斷的組(74%)高出 2 個百分點,這一差異也並不顯著。關於準確率,由兩名未直接參与實驗的內科專科醫生按照預先設定的標準進行了獨立評估。他們在不知道每個診斷是誰做出的情況下進行了打分。

「AI醫生」可能要來了!報告稱:在疾病診斷方面,AI已超越人類! - 天天要聞

這份報告的評估意義在於,它展示了ai在醫療現場的地位正在發生變化 —— ai 不僅被廣泛應用於機器人手術、醫學數據分析,還包括基於人工智慧的癌症篩查解決方案等諸多領域。但此前它一直停留在輔助醫生判斷的領域。

作為全球最具公信力的人工智慧白皮書之一,《人工智慧指數報告》得出了「像 gpt-4 這樣的生成式 ai 模型比醫生診斷得更好」的分析結果,同時也預測:在不久的將來,在醫院裡看到 ai 醫生將成為稀鬆平常之事!

報告評價道:「這次實驗結果總體上表明,gpt-4 診斷的性能最高、且具有一致性」,「即使 ai 與人類醫生協作,根據醫生個人的判斷方式和運用能力的不同,結果也會有所不同」。接著還指出:「最近,在癌症檢測和重症患者識別等領域,也有研究表明人工智慧的表現優於醫療工作者」、「人工智慧的應用範圍正在從單純的診斷擴展到更複雜的臨床判斷領域」 。

與此同時,在衡量 gpt-4 臨床知識性能的代表性標準 「medqa」 基準測試中,gpt-4 去年的準確率達到了 96.0%。與 2022 年的 67.6% 相比,這一數值大幅提高了 28.4 個百分點。medqa 是基於美國醫生國家考試水平的醫學問題而構建的測試,用於評估人工智慧的臨床知識水平。

報告還補充道:「有研究結果表明,人工智慧與醫生的協作能夠產生最佳結果,因此這一領域將成為未來重要的研究課題」、「但人工智慧系統本身也具有一定的潛在風險,例如產生與事實不符信息的『ai幻覺』問題、或不可預測的錯誤等,人們對其可靠性和安全性仍存疑,因此需要制定考慮到這些風險因素的政策應對措施」 。

健康分類資訊推薦

50歲如何避免「斷崖式衰老」? - 天天要聞

50歲如何避免「斷崖式衰老」?

50歲是人生的重要轉折點。在這一時期,人體內的激素平衡發生變化,無論身體還是精神都面臨著巨大的挑戰。這個50歲左右的時間點被日本老年健康專家和田秀樹稱為「思秋期」,和日語中的「思春期」(即青春期)相對應。
離上市更近的佰澤醫療仍受桎梏,難道民營醫院「長坡厚雪」是偽命題? - 天天要聞

離上市更近的佰澤醫療仍受桎梏,難道民營醫院「長坡厚雪」是偽命題?

文 | 醫藥研究社對比龐大的公立醫院系統,紮根腫瘤細分賽道的民營醫院靠「小而美」出圈,通過差異化布局,一定程度避開了公立醫院的主戰場,也成為填補醫療服務缺口的重要拼圖。這一賽道的明星企業不少,比如美中嘉和,該公司屬於國內民營腫瘤醫療第一梯隊,去年1月於港交所正式上市。值得一提的是,美中嘉和上市首日即遭遇...
新冠病毒抬頭?鍾南山:不必恐慌,要重點關注這類人群 - 天天要聞

新冠病毒抬頭?鍾南山:不必恐慌,要重點關注這類人群

新冠病毒又活躍了?5月19日,「共和國勳章」獲得者、中國工程院院士鍾南山在廣州接受記者專訪,對新冠病毒流行趨勢做出最新判斷。「這一輪新冠感染整體上可防可控,不必恐慌。」鍾南山提醒,對於部分65歲以上且有基礎病的老年人來說,存在一定危險,建議感染者要在48小時內儘快服用特效藥,如來瑞特韋、先諾特韋和民得維等...
身居鬧市,心向自然,城裡人也能養出山野好身體 - 天天要聞

身居鬧市,心向自然,城裡人也能養出山野好身體

「天天困在樓房裡,吸著汽車尾氣,吃的外賣快餐,這身子骨能好嗎?」您是不是也常聽老鄰居們這樣抱怨?別急著嘆氣!咱老祖宗《黃帝內經》早說了:「人以天地之氣生」,住在城裡照樣能「偷」來山野的養生訣竅,關鍵得懂這「鬧市中取靜」的門道!
58天瘦了18斤,我明白了!為什麼一吃晚餐,體重就下降了 - 天天要聞

58天瘦了18斤,我明白了!為什麼一吃晚餐,體重就下降了

去年冬天有位客戶找我,說自己嘗試過各種方法卻總在體重上「卡殼」。她提到以前為了控制體重,晚上只啃黃瓜或喝代餐粉,結果半夜餓了,第二天反而吃得更多。後來我們調整了她的晚餐模式,58天後她發來消息:「原來晚餐吃對了,身體真的會自己調整!
做完體外衝擊波碎石後,是不是就「萬石如意」了? - 天天要聞

做完體外衝擊波碎石後,是不是就「萬石如意」了?

當體檢報告顯示泌尿系統結石時許多患者的第一訴求往往是儘快消除結石泌尿外科對付泌尿繫結石有一套常見的「隔山打牛」術那就是「體外衝擊波碎石」——將衝擊波從體外準確無誤地傳給「石頭」將其粉碎消滅萬惡的結石圖源:soogif但有些做體外碎石的患者都
長時間戴或有損聽力 - 天天要聞

長時間戴或有損聽力

根據世界衛生組織發布數據顯示,全球有超過10億12歲至35歲之間的年輕人,正面臨無法逆轉的聽力損失風險。隨著年齡的增長,聽力功能下降本身就不可逆轉,再加上長時間戴耳機、愛亂掏耳朵、不會正確擤鼻涕、愛熬夜這幾件容易影響聽力的事,總有一件是你們愛做的——若任由這些行為繼續傷害耳朵,可能導致耳聾提前找上門。今天...