历史首次!o3找到Linux内核零日漏洞,12000行代码看100遍揪出

2025年05月26日11:52:03 科技 1878

梦晨 发自 凹非寺
量子位 | 公众号 QbitAI


AI成功找到Linux安全漏洞,还是内核级别的零日漏洞。

刚刚,OpenAI总裁转发了独立研究员Seen Heelan的实验成果:用o3模型找到了Linux内核SMB实现中的一个远程零日漏洞。

历史首次!o3找到Linux内核零日漏洞,12000行代码看100遍揪出 - 天天要闻

更让人惊讶的是,整个过程中没有用到任何复杂的工具——没有脚手架、没有智能体框架、没有工具调用,仅仅是o3 API本身。

这个漏洞被编号为CVE-2025-37899,是SMB”注销”命令处理程序中的一个释放后使用(use-after-free)漏洞。

据作者透露,这是首次公开讨论的由大模型发现的此类漏洞。

历史首次!o3找到Linux内核零日漏洞,12000行代码看100遍揪出 - 天天要闻

有网友看过发现过程后感叹,原以为会有很疯狂的实验设置,但其实只是把一堆代码缝到一起,让o3检查100次。

希望其他白帽黑客已经开始像这样检查其他关键操作系统了。

历史首次!o3找到Linux内核零日漏洞,12000行代码看100遍揪出 - 天天要闻

OpenAI首席研究官Mark Chen表示:像o3这样的推理模型正开始助力深度技术工作和有意义的科学发现。接下来一年,类似这样的成果将会越来越普遍:

历史首次!o3找到Linux内核零日漏洞,12000行代码看100遍揪出 - 天天要闻

AI不仅找到漏洞,还能辅助修复

Sean Heelan是一位独立研究员,专注于基于大模型的漏洞研究和漏洞利用自动化生成。

他原本在手动检查Linux内核的KSMBD(内核态SMB3协议实现)漏洞,想要暂时远离大模型相关的工具开发。

历史首次!o3找到Linux内核零日漏洞,12000行代码看100遍揪出 - 天天要闻

但o3发布后,他忍不住想测试一下:”既然我手里已经有这些漏洞,不如看看o3能不能找到它们?”

他先用一个自己手动发现的漏洞CVE-2025-37778作为测试。这是Kerberos认证路径中的一个释放后使用漏洞,是测试大模型能力很好的基准,因为:

  • 它是Linux 内核远程攻击面的一部分
  • 它并不简单,发现他需要理解如何触发特定的会话状态、认证函数的多条执行路径、跨函数的对象生命周期管理
  • 但它也并非极其复杂,作者本人可以在10分钟内带着同时了解涉及到的约3300行代码

接下来开始实验之前,还需要搞清楚一个问题,该给大模型展示哪些代码?

理想情况当然是大模型读取整个代码库并输出结果,但实践中上由于上下文窗口的限制还无法事先。

最终Heelan为 LLM 提供了“会话设置”命令处理程序的代码,包括它调用的所有函数的代码等等,直到调用深度达到3(这是包含推理漏洞所需代码所需的深度),还包含了命令处理器、连接建立/拆除、请求分发等完整上下文。

提示词中告诉o3专门寻找use-after-free漏洞,提供KSMBD架构说明,强调要避免误报,每个实验运行100次,统计成功率。

相关代码和提示词已开源在GitHub上。

历史首次!o3找到Linux内核零日漏洞,12000行代码看100遍揪出 - 天天要闻

Heelan还按同样流程测试了Claude3.7和Claude 3.5作为对比,结果o3的表现让人眼前一亮:

  • OpenAI o3: 100次运行中成功找到8次漏洞
  • Claude 3.7: 100次中找到3次
  • Claude 3.5: 100次中一次都没找到

此外有意思的的是,o3和Claude的输出风格完全不同。

o3生成的像人类写的漏洞报告,结构清晰、重点突出

历史首次!o3找到Linux内核零日漏洞,12000行代码看100遍揪出 - 天天要闻

Claude更像思维流或工作日志,细节丰富但略显冗长。

历史首次!o3找到Linux内核零日漏洞,12000行代码看100遍揪出 - 天天要闻

接下来发生的事情更精彩了。

Heelan想测试o3在更大代码量下的表现,于是给它提供了所有SMB命令处理程序的代码,约12000行代码。

虽然找到原始漏洞的成功率降到了1%,性能明显下降。但在运行结果中,o3报告了一个全新的漏洞。

Heelan自己之前也不知道这个漏洞,它同样是由于sess->user的释放造成的,但这次是在会话注销处理程序中。

历史首次!o3找到Linux内核零日漏洞,12000行代码看100遍揪出 - 天天要闻

o3自己对这个漏洞的解释如下。

当一个ksmbd工作线程还在执行使用sess->user的请求时,另一个处理同一会话SMB2 LOGOFF的线程释放了该结构。没有同步机制保护该指针,所以第一个线程会解引用已释放的内存——这是一个经典的释放后使用漏洞,会导致内核内存损坏和任意代码执行。

更有意思的是,研究员发现o3不仅能找到漏洞,某些情况下修复方案比人类更完善。

对于之前的Kerberos认证漏洞,Heelan最初提出的修复是简单地将指针置空:

if (sess->state == SMB2_SESSION_VALID) {
    ksmbd_free_user(sess->user);
    sess->user = NULL;  // 添加这行
}

但o3的报告中有指出这个修复不够充分,因为SMB协议允许两个不同的连接”绑定”到同一个会话,在释放和置空之间的短暂窗口期,另一个线程仍可能访问这个指针。

最终Heelan承认,如果使用o3来找和修复原始漏洞,“理论上”会比自己完成更好。

之所以加上“理论上”的限定,是因为现在AI误报的比例有点高,人类很难认真仔细地查看o3的每份报告。

不过他也认为随着技术的发展,这个比例只会越来越低。

Heelan在报告结尾感慨道:

大模型在程序分析技术的能力空间中,处于一个比我们见过的任何东西都更接近人类的位置。考虑到创造力、灵活性和通用性,LLM更像是人类代码审计员,而不是符号执行、抽象解释或模糊测试。

他特别强调,如果你从事安全研究工作,现在应该开始密切关注了:

  • 专家级研究员不会被取代,反而会变得更高效
  • 对于10000行以内的代码问题,o3有相当大的概率能解决或帮助解决
  • 虽然仍有约1:50的信噪比问题,但这已经值得投入时间和精力

不过也有人看到了其中的风险:

如果坏人利用AI的能力找到类似的漏洞并攻击系统又如何呢?

历史首次!o3找到Linux内核零日漏洞,12000行代码看100遍揪出 - 天天要闻

科技分类资讯推荐

中国智能眼镜市场增速超100%,市场格局将“风起云涌” - 天天要闻

中国智能眼镜市场增速超100%,市场格局将“风起云涌”

根据国际数据公司(IDC)近日发布的《全球智能眼镜市场季度跟踪报告》,2025年第一季度全球智能眼镜(Smart Eyewear)市场出货量148.7万台,同比增长82.3%。其中全球音频和音频拍摄眼镜市场出货量83.1万台,同比增长219.5%;AR/VR市场出货65.6万台,同比增长18.1%。智能眼镜市场在全球范围仍然以Meta为主要发力厂商,除美国.
余承东首次揭秘鸿蒙折叠电脑内部设计:风扇竟比两枚硬币还薄 - 天天要闻

余承东首次揭秘鸿蒙折叠电脑内部设计:风扇竟比两枚硬币还薄

快科技6月19日消息,6月初,全球首款鸿蒙折叠电脑——华为MateBook Fold非凡大师开售,起售价23999元。今日,华为常务董事、终端BG董事长余承东发布视频,首次揭秘鸿蒙折叠电脑内部设计。据介绍,鸿蒙折叠电脑采用分布式整机架构,不仅在7.3mm超薄机身中装下了两个大风扇、VC散热板、电池,还在有限的空间里塞了隐藏的内置...
培养复合型人才,华科大推出“低空经济领航者计划” - 天天要闻

培养复合型人才,华科大推出“低空经济领航者计划”

极目新闻记者 黎先才随着数字孪生、无人机技术、北斗导航等领域的突破性发展,低空经济正成为全球城市升维竞争的新赛道。低空经济加快发展极目新闻记者获悉,为破解地方“政策落地断层、产业协同薄弱、人才供需错配”三大瓶颈,进一步推动低空经济理论落地与产业实践,华中科技大学建筑与城市规划学院重磅推出“低空经济领...
OPPO Reno 14 5G手机登陆全球市场 7月17日日本开售 - 天天要闻

OPPO Reno 14 5G手机登陆全球市场 7月17日日本开售

【CNMO科技消息】近日,CNMO注意到,OPPO Reno 14 5G手机已正式登陆全球市场。据官方消息,Reno 14 5G将于7月1日在马来西亚率先开售,随后在7月17日于日本上市,提供“流光绿”和“珠光白”两种配色选择。这款新机延续
江汽集团:尊界系列第二款、第三款产品已在加速研发 - 天天要闻

江汽集团:尊界系列第二款、第三款产品已在加速研发

IT之家 6 月 19 日消息,江汽集团官方今日发文介绍:6 月 18 日尊界 S800 汽车批量投产,该车上市 19 天大定 5000+。合肥尊界超级工厂首创多项行业技术,联合 220 余家全球供应链,研发端 5000 人团队 + 华为深度合作。另外,江汽集团透露,尊界系列第二款、第三款产品已在加速研发。IT之家昨日报道,江淮汽车与华为合作的...
余承东揭秘华为MateBook Fold鸿蒙折叠电脑内构:如何高效散热 - 天天要闻

余承东揭秘华为MateBook Fold鸿蒙折叠电脑内构:如何高效散热

IT之家 6 月 19 日消息,华为常务董事、终端 BG 董事长余承东今日发布视频,展示如何在 MateBook Fold 中完成“极限收纳挑战”。据介绍,这台鸿蒙折叠电脑合上时屏幕 13 英寸,展开后屏幕 18 英寸,重量只有 1.16kg,厚度 7.3mm。该机搭载了超 3 年时间打造的分布式的整体架构,装下了两个风扇、VC 散热板、电池等“大件”...
更高效更安全助力金融服务提质焕新 华为擎云 C5新品亮相金融展 - 天天要闻

更高效更安全助力金融服务提质焕新 华为擎云 C5新品亮相金融展

IDC公布的调研数据显示,在中国市场商用平板领域,华为擎云在2024年全年及2025年Q1季度市场份额第一,并且优势不断扩大。作为行业领先品牌,华为擎云不断加大技术投入,持续打磨商用平板产品,在2025中国国际金融展期间推出新一代高效多能商务平板华为擎云 C5(第3代)。华为擎云 C5平板新品搭载HarmonyOS自主操作系统,具...
南都电商观察|啊宝涉虚假宣传;编造“高额奖学金”账号被封 - 天天要闻

南都电商观察|啊宝涉虚假宣传;编造“高额奖学金”账号被封

主播&达人1、百万粉丝网红啊宝涉虚假宣传,被指固体饮料当药卖据澎湃新闻,近日,因宣传科普应对蛇咬伤而走红的网红“啊宝”被消费者举报在销售固体饮料“阿宝胃舒”的过程中宣称可以根治胃酸胃胀等多种胃部不适,还能治疗痛风、关节炎,涉嫌虚假宣传。该名消费者提供给媒体的图片显示,该产品包装盒上印有“啊宝”头像、字...
天猫618数据出炉:453个品牌成交破亿  同比增长24% - 天天要闻

天猫618数据出炉:453个品牌成交破亿 同比增长24%

【环球网科技综合报道】2025天猫618玩法简化,用户规模和活跃度创新高,品牌全周期成交高效增长。美妆、服饰、家电家装、3C数码、运动户外、潮玩、宠物等行业成交规模及增速,蝉联全网第一。截至6月18日24点,453个品牌在天猫618成交破亿,同比去年增长24%。其中,苹果、美的、海尔、小米、华为、源氏木语、耐克、格力、斐...