歷史首次！o3找到Linux內核零日漏洞，12000行代碼看100遍揪出

2025年05月26日11:52:03 科技 1878

夢晨發自凹非寺
量子位 | 公眾號 QbitAI

AI成功找到Linux安全漏洞，還是內核級別的零日漏洞。

剛剛，OpenAI總裁轉發了獨立研究員Seen Heelan的實驗成果：用o3模型找到了Linux內核SMB實現中的一個遠程零日漏洞。

更讓人驚訝的是，整個過程中沒有用到任何複雜的工具——沒有腳手架、沒有智能體框架、沒有工具調用，僅僅是o3 API本身。

這個漏洞被編號為CVE-2025-37899，是SMB」註銷」命令處理程序中的一個釋放後使用（use-after-free）漏洞。

據作者透露，這是首次公開討論的由大模型發現的此類漏洞。

有網友看過發現過程後感嘆，原以為會有很瘋狂的實驗設置，但其實只是把一堆代碼縫到一起，讓o3檢查100次。

希望其他白帽黑客已經開始像這樣檢查其他關鍵操作系統了。

OpenAI首席研究官Mark Chen表示：像o3這樣的推理模型正開始助力深度技術工作和有意義的科學發現。接下來一年，類似這樣的成果將會越來越普遍：

AI不僅找到漏洞，還能輔助修復

Sean Heelan是一位獨立研究員，專註於基於大模型的漏洞研究和漏洞利用自動化生成。

他原本在手動檢查Linux內核的KSMBD（內核態SMB3協議實現）漏洞，想要暫時遠離大模型相關的工具開發。

但o3發佈後，他忍不住想測試一下：」既然我手裡已經有這些漏洞，不如看看o3能不能找到它們？」

他先用一個自己手動發現的漏洞CVE-2025-37778作為測試。這是Kerberos認證路徑中的一個釋放後使用漏洞，是測試大模型能力很好的基準，因為：

它是Linux 內核遠程攻擊面的一部分
它並不簡單，發現他需要理解如何觸發特定的會話狀態、認證函數的多條執行路徑、跨函數的對象生命周期管理
但它也並非極其複雜，作者本人可以在10分鐘內帶着同時了解涉及到的約3300行代碼

接下來開始實驗之前，還需要搞清楚一個問題，該給大模型展示哪些代碼？

理想情況當然是大模型讀取整個代碼庫並輸出結果，但實踐中上由於上下文窗口的限制還無法事先。

最終Heelan為 LLM 提供了「會話設置」命令處理程序的代碼，包括它調用的所有函數的代碼等等，直到調用深度達到3（這是包含推理漏洞所需代碼所需的深度），還包含了命令處理器、連接建立/拆除、請求分發等完整上下文。

提示詞中告訴o3專門尋找use-after-free漏洞，提供KSMBD架構說明，強調要避免誤報，每個實驗運行100次，統計成功率。

相關代碼和提示詞已開源在GitHub上。

Heelan還按同樣流程測試了Claude3.7和Claude 3.5作為對比，結果o3的表現讓人眼前一亮：

OpenAI o3: 100次運行中成功找到8次漏洞
Claude 3.7: 100次中找到3次
Claude 3.5: 100次中一次都沒找到

此外有意思的的是，o3和Claude的輸出風格完全不同。

o3生成的像人類寫的漏洞報告，結構清晰、重點突出

Claude更像思維流或工作日誌，細節豐富但略顯冗長。

接下來發生的事情更精彩了。

Heelan想測試o3在更大代碼量下的表現，於是給它提供了所有SMB命令處理程序的代碼，約12000行代碼。

雖然找到原始漏洞的成功率降到了1%，性能明顯下降。但在運行結果中，o3報告了一個全新的漏洞。

Heelan自己之前也不知道這個漏洞，它同樣是由於sess->user的釋放造成的，但這次是在會話註銷處理程序中。

o3自己對這個漏洞的解釋如下。

當一個ksmbd工作線程還在執行使用sess->user的請求時，另一個處理同一會話SMB2 LOGOFF的線程釋放了該結構。沒有同步機制保護該指針，所以第一個線程會解引用已釋放的內存——這是一個經典的釋放後使用漏洞，會導致內核內存損壞和任意代碼執行。

更有意思的是，研究員發現o3不僅能找到漏洞，某些情況下修復方案比人類更完善。

對於之前的Kerberos認證漏洞，Heelan最初提出的修復是簡單地將指針置空：

if (sess->state == SMB2_SESSION_VALID) {
    ksmbd_free_user(sess->user);
    sess->user = NULL;  // 添加這行
}

但o3的報告中有指出這個修復不夠充分，因為SMB協議允許兩個不同的連接」綁定」到同一個會話，在釋放和置空之間的短暫窗口期，另一個線程仍可能訪問這個指針。

最終Heelan承認，如果使用o3來找和修復原始漏洞，「理論上」會比自己完成更好。

之所以加上「理論上」的限定，是因為現在AI誤報的比例有點高，人類很難認真仔細地查看o3的每份報告。

不過他也認為隨着技術的發展，這個比例只會越來越低。

Heelan在報告結尾感慨道：

大模型在程序分析技術的能力空間中，處於一個比我們見過的任何東西都更接近人類的位置。考慮到創造力、靈活性和通用性，LLM更像是人類代碼審計員，而不是符號執行、抽象解釋或模糊測試。

他特彆強調，如果你從事安全研究工作，現在應該開始密切關注了：

專家級研究員不會被取代，反而會變得更高效
對於10000行以內的代碼問題，o3有相當大的概率能解決或幫助解決
雖然仍有約1:50的信噪比問題，但這已經值得投入時間和精力

不過也有人看到了其中的風險：

如果壞人利用AI的能力找到類似的漏洞並攻擊系統又如何呢？

科技

螞蟻消金林嘉南：大模型賦能智能風控，額度互動促進金融健康

「螞蟻消金希望利用交互式智能風控技術，挖掘年輕人努力成長的證明」。6月19日，在上海舉行的2025中國國際金融展上，螞蟻消金首席風險官林嘉南分享了，如何將大模型技術應用在交互式智能風控領域，從而促進額度的互動性，促進用戶與機構的金融健康。這契合了本屆展會「開放創新，科技賦能，共創金融新未來」的主題。普惠金...

06月19日 6779

中國電信聯合華為發佈「智聚大上行」創新技術，賦能5G-A產業煥新升級

潮新聞客戶端記者張雲山在2025 MWC上海期間，中國電信聯合華為舉辦5G-A「智聚大上行」創新發佈會。會上，中國電信與華為聯合發佈了「基於智能編排和上行頻譜解耦與池化，形成智能大上....

06月19日 8541

德國西格瑪（SIGMA Audio）品牌介紹

德國西格瑪（SIGMA Audio）品牌溯源：精密工藝與純粹音質的融合德國西格瑪（SIGMA Audio）是享譽全球的高端音響品牌，誕生於德國精密工程與聲學技術的沃土。

06月19日 1675

海爾位列谷歌&凱度BrandZ中國全球化品牌第6，蟬聯行業第一

海南陵水 2025年6月19日 -- 6月19日，谷歌Google攜手凱度BrandZ發佈《2025年中國全球化品牌50強》榜單，海爾蟬聯行業第一，位列第6位，連續9年穩居中國全球化品牌前十之列，品牌排名與全球影響力持續攀升。自主創牌的行業標杆作為權威的品牌價值評估體系之一，《2025年中國全球化品牌50強》榜單覆蓋了澳大利亞、巴西、法...

06月19日 6836

銳評｜堅定「投資未來」必將「贏得未來」

一輛公交車在北京京郊絲滑行駛，但坐在主駕的安全員並沒有摸方向盤，哪怕遇到複雜路況，「AI司機」也能應對自如……「活力中國調研行」主題採訪活動正在進行，一行記者走進北京機械人世界，切身感受「未來已來」。

06月19日 1270

宇通客車5月產銷數據發佈輕型車銷量同比增長34.88%

6月4日。宇通客車披露5月產銷數據。當月生產量達3434輛，銷售量為3053輛，運營態勢穩健。分車型看，輕型車市場表現格外突出，5月銷量同比增長34.88%，在行業整體承壓下逆勢上揚。

06月19日 5698

人形機械人領域招聘需求大漲《2025年機械人產業人才發展報告》發佈

潮新聞客戶端記者張鑫通訊員應夢悅當前，機械人產業蓬勃發展。據智聯招聘日前發佈的《2025年機械人產業人才發展報告》顯示，今年前5個月，機械人產業招聘職位數同比增長6%，求職人數同....

06月19日 4015

銳評｜將自動續費的選擇權還給用戶

近日，國家廣播電視總局實施互聯網電視專項規範管理措施，劍指用戶反映集中的自動續費「扣費前無提醒」「取消流程複雜」「投訴渠道不暢」等問題。提起自動續費的「坑」，很多人都有切身體驗。往往是默認勾選或不經意勾選了「自動續費」，等到察覺銀錢損失而希望取消之時，卻難以找到入口。這樣的現象背後，是某些平台為「留...

06月19日 3979

陳鍾：安全為錨創新為帆

2025年6月10日，中關村互聯網金融研究院、中關村金融科技產業發展聯盟主辦的「2025中關村論壇系列活動——數字金融與金融安全大會」在中關村展示中心舉辦。大會以「人工智能機遇：未來金融格局重塑及安全治理」為主題，全面解讀金融領域的探討數字金融與金融安全之間的緊密聯繫，分享行業內最新技術動態與創新應用實踐，並...

06月19日 8363