歷史首次!o3找到Linux內核零日漏洞,12000行代碼看100遍揪出

2025年05月26日11:52:03 科技 1878

夢晨 發自 凹非寺
量子位 | 公眾號 QbitAI


AI成功找到Linux安全漏洞,還是內核級別的零日漏洞。

剛剛,OpenAI總裁轉發了獨立研究員Seen Heelan的實驗成果:用o3模型找到了Linux內核SMB實現中的一個遠程零日漏洞。

歷史首次!o3找到Linux內核零日漏洞,12000行代碼看100遍揪出 - 天天要聞

更讓人驚訝的是,整個過程中沒有用到任何複雜的工具——沒有腳手架、沒有智能體框架、沒有工具調用,僅僅是o3 API本身。

這個漏洞被編號為CVE-2025-37899,是SMB」註銷」命令處理程序中的一個釋放後使用(use-after-free)漏洞。

據作者透露,這是首次公開討論的由大模型發現的此類漏洞。

歷史首次!o3找到Linux內核零日漏洞,12000行代碼看100遍揪出 - 天天要聞

有網友看過發現過程後感嘆,原以為會有很瘋狂的實驗設置,但其實只是把一堆代碼縫到一起,讓o3檢查100次。

希望其他白帽黑客已經開始像這樣檢查其他關鍵操作系統了。

歷史首次!o3找到Linux內核零日漏洞,12000行代碼看100遍揪出 - 天天要聞

OpenAI首席研究官Mark Chen表示:像o3這樣的推理模型正開始助力深度技術工作和有意義的科學發現。接下來一年,類似這樣的成果將會越來越普遍:

歷史首次!o3找到Linux內核零日漏洞,12000行代碼看100遍揪出 - 天天要聞

AI不僅找到漏洞,還能輔助修復

Sean Heelan是一位獨立研究員,專註於基於大模型的漏洞研究和漏洞利用自動化生成。

他原本在手動檢查Linux內核的KSMBD(內核態SMB3協議實現)漏洞,想要暫時遠離大模型相關的工具開發。

歷史首次!o3找到Linux內核零日漏洞,12000行代碼看100遍揪出 - 天天要聞

但o3發佈後,他忍不住想測試一下:」既然我手裡已經有這些漏洞,不如看看o3能不能找到它們?」

他先用一個自己手動發現的漏洞CVE-2025-37778作為測試。這是Kerberos認證路徑中的一個釋放後使用漏洞,是測試大模型能力很好的基準,因為:

  • 它是Linux 內核遠程攻擊面的一部分
  • 它並不簡單,發現他需要理解如何觸發特定的會話狀態、認證函數的多條執行路徑、跨函數的對象生命周期管理
  • 但它也並非極其複雜,作者本人可以在10分鐘內帶着同時了解涉及到的約3300行代碼

接下來開始實驗之前,還需要搞清楚一個問題,該給大模型展示哪些代碼?

理想情況當然是大模型讀取整個代碼庫並輸出結果,但實踐中上由於上下文窗口的限制還無法事先。

最終Heelan為 LLM 提供了「會話設置」命令處理程序的代碼,包括它調用的所有函數的代碼等等,直到調用深度達到3(這是包含推理漏洞所需代碼所需的深度),還包含了命令處理器、連接建立/拆除、請求分發等完整上下文。

提示詞中告訴o3專門尋找use-after-free漏洞,提供KSMBD架構說明,強調要避免誤報,每個實驗運行100次,統計成功率。

相關代碼和提示詞已開源在GitHub上。

歷史首次!o3找到Linux內核零日漏洞,12000行代碼看100遍揪出 - 天天要聞

Heelan還按同樣流程測試了Claude3.7和Claude 3.5作為對比,結果o3的表現讓人眼前一亮:

  • OpenAI o3: 100次運行中成功找到8次漏洞
  • Claude 3.7: 100次中找到3次
  • Claude 3.5: 100次中一次都沒找到

此外有意思的的是,o3和Claude的輸出風格完全不同。

o3生成的像人類寫的漏洞報告,結構清晰、重點突出

歷史首次!o3找到Linux內核零日漏洞,12000行代碼看100遍揪出 - 天天要聞

Claude更像思維流或工作日誌,細節豐富但略顯冗長。

歷史首次!o3找到Linux內核零日漏洞,12000行代碼看100遍揪出 - 天天要聞

接下來發生的事情更精彩了。

Heelan想測試o3在更大代碼量下的表現,於是給它提供了所有SMB命令處理程序的代碼,約12000行代碼。

雖然找到原始漏洞的成功率降到了1%,性能明顯下降。但在運行結果中,o3報告了一個全新的漏洞。

Heelan自己之前也不知道這個漏洞,它同樣是由於sess->user的釋放造成的,但這次是在會話註銷處理程序中。

歷史首次!o3找到Linux內核零日漏洞,12000行代碼看100遍揪出 - 天天要聞

o3自己對這個漏洞的解釋如下。

當一個ksmbd工作線程還在執行使用sess->user的請求時,另一個處理同一會話SMB2 LOGOFF的線程釋放了該結構。沒有同步機制保護該指針,所以第一個線程會解引用已釋放的內存——這是一個經典的釋放後使用漏洞,會導致內核內存損壞和任意代碼執行。

更有意思的是,研究員發現o3不僅能找到漏洞,某些情況下修復方案比人類更完善。

對於之前的Kerberos認證漏洞,Heelan最初提出的修復是簡單地將指針置空:

if (sess->state == SMB2_SESSION_VALID) {
    ksmbd_free_user(sess->user);
    sess->user = NULL;  // 添加這行
}

但o3的報告中有指出這個修復不夠充分,因為SMB協議允許兩個不同的連接」綁定」到同一個會話,在釋放和置空之間的短暫窗口期,另一個線程仍可能訪問這個指針。

最終Heelan承認,如果使用o3來找和修復原始漏洞,「理論上」會比自己完成更好。

之所以加上「理論上」的限定,是因為現在AI誤報的比例有點高,人類很難認真仔細地查看o3的每份報告。

不過他也認為隨着技術的發展,這個比例只會越來越低。

Heelan在報告結尾感慨道:

大模型在程序分析技術的能力空間中,處於一個比我們見過的任何東西都更接近人類的位置。考慮到創造力、靈活性和通用性,LLM更像是人類代碼審計員,而不是符號執行、抽象解釋或模糊測試。

他特彆強調,如果你從事安全研究工作,現在應該開始密切關注了:

  • 專家級研究員不會被取代,反而會變得更高效
  • 對於10000行以內的代碼問題,o3有相當大的概率能解決或幫助解決
  • 雖然仍有約1:50的信噪比問題,但這已經值得投入時間和精力

不過也有人看到了其中的風險:

如果壞人利用AI的能力找到類似的漏洞並攻擊系統又如何呢?

歷史首次!o3找到Linux內核零日漏洞,12000行代碼看100遍揪出 - 天天要聞

科技分類資訊推薦

小米玄戒O1相關謠言回應來了 - 天天要聞

小米玄戒O1相關謠言回應來了

上周,小米正式舉行小米15周年戰略新品發佈會。這次活動中,小米自主研發設計的「玄戒」芯片正式亮相。據悉,玄戒O1旗艦處理器由小米自主研發設計,有着190億晶體管,芯片面積109mm²,實驗室安兔兔跑分突破300萬。
科技金融:「掃一掃,千萬到手」 - 天天要聞

科技金融:「掃一掃,千萬到手」

5月22日,「金魚嘴·機構日」金沙江聯合資本·AI+智能硬件專場在南京金魚嘴基金大廈舉行。參加路演的9家企業覆蓋工業機械人、智慧城市、醫療健康設備等領域。今天,記者走進全國首個基金特色街區——南京金魚嘴基金街區,源碼資本、毅達資本、華映資本等知名機構的標識鋪滿一整面牆,另一面牆上則有清華大學、上海交通大學...
蘋果iPhone 17 Pro Max - 廚師cook做到了! - 天天要聞

蘋果iPhone 17 Pro Max - 廚師cook做到了!

蘋果iPhone17系列塑料模型的第一個上手視頻。這是接近最終的設計。iPhone17的外觀將會是這樣的。左邊有三個攝像頭,LED閃光燈、麥克風和騙子位於最右邊的角落,可能是為了給獨立顯示面部識別騰出空間。這個音量鍵、電源鍵、操作鍵和無用的
安卓16對智能手機手電筒亮度將可調節 - 天天要聞

安卓16對智能手機手電筒亮度將可調節

安卓 16 QPR1 Beta 版推出,帶來諸多精彩功能,未來版本可能還會有更驚艷的升級,其中一個可能就是 「手電筒亮度調節」 工具。也許很快,用戶就能控制設備閃光燈的光強度了。谷歌為推出此功能籌備已久。
特朗普對蘋果和三星說:要麼在美國製造,要麼支付25%的關稅 - 天天要聞

特朗普對蘋果和三星說:要麼在美國製造,要麼支付25%的關稅

唐納德・特朗普正力促蘋果、三星等主要智能手機製造商,將面向美國市場的產品生產環節遷回美國。他警告說,若不照做,就會對其產品徵收 25% 的進口關稅。特朗普先是通過其 「真相社交」 平台發佈了這一消息,後又在橢圓形辦公室的簡報會上重申了一遍。
小米重磅發佈,又「史上最強」!收入、盈利均創歷史新高!小米SU7系列交付新車75869輛,盧偉冰介紹小米AI布局 - 天天要聞

小米重磅發佈,又「史上最強」!收入、盈利均創歷史新高!小米SU7系列交付新車75869輛,盧偉冰介紹小米AI布局

每經編輯:陳柯名,黃勝5月27日晚間,小米集團公布財報,2025年第一季度,集團收入及盈利均再次創下歷史新高。2025年第一季度,小米集團總收入為人民幣1113億元,創歷史新高,同比增長47.4%。業務分部來看,2025年第一季度,手機×AIoT分部收入為人民幣927億元,同比增長22.8%,智能電動汽車及AI等創新業務分部收入為人民幣...