一个开源者站出来质疑,谷歌论文被指抄作业,学术圈开始安静地看戏
2026年3月,谷歌在ICLR 2026会议上发表了一篇名为《TurboQuant》的论文,这篇论文一出现,市场反应就很大,存储芯片股像滑梯一样下跌,人们称它为“AI内存革命”,听起来很厉害,但没过几天,一位叫高健扬的华人学者直接在社交平台上公开表示,这篇论文抄袭了他们团队的研究成果。
高健扬团队在2024年5月就在arXiv上发布了RaBitQ,代码全部公开,核心方法是“随机旋转加向量量化”,到了9月他们又补充了理论证明,误差边界达到了FOCS 2017的最优水平,这项工作后来被SIGMOD 2024和2025录用,还受邀在FOCS Workshop上进行报告,这些信息都是公开可查的,但谷歌那篇论文里几乎没有提到RaBitQ,只把它简单归为“基于网格的PQ”类别,好像它不值得重视。
最让人不舒服的是审稿环节,有个审稿人直接问随机旋转是不是他们首创,谷歌作者当场承认之前有人做过,包括RaBitQ,但最后定稿时他们把相关讨论全删了,只在附录里简单提了一句,这不是疏忽而是故意绕开,高健扬后来发邮件给第二作者Majid Daliri,一条条解释为什么他们的理论已经最优,对方回复说已转达全体作者,结果一点改动都没有。
3月高健扬正式发函,要求对方修改引用内容或进行致歉,第一作者Amir Zandieh回复说随机旋转是通用技术,不需要每个使用者都去引用,这句话听起来很随意,但问题不在于技术是否通用,而在于他们使用了别人搭建的框架和优化过的路径,却声称自己是从头开始发明的,特别是当别人已经把理论边界推到极限时,他们还评价人家的方法不够好,这不是疏忽,而是故意狡辩。
这件事背后有点微妙,高健扬是苏黎世联邦理工的博士后,没有大公司的工作背景,依靠开源项目和学术会议评审一步步积累经验,他的代码可以顺利复现,实验过程很透明,论文经过两轮严格评审才被正式录用,而谷歌这边资源充足、话语权也大,把别人的成果包装成自己的突破,顺便带动了商业宣传,美光和西部数据的股价当天就大幅下跌,说明资本市场也相信了这个说法。
更奇怪的是平台的反应,有个叫WFrV的审稿人明确建议加入RaBitQ对比实验,结果这个建议被无视了,顶会审稿原本应该负责把关,现在看起来更像是在走过场,谷歌在提交前就知道问题存在,但没做内部核查,也没启动学术诚信流程,时间线上很清楚,2024年5月RaBitQ上线,9月理论完善,2025年5月双方有过技术沟通,2026年3月论文照常发表,整个过程里,没人阻拦一下,也没人问一句这样是否合适。
高健扬不再继续争吵,只是拿出证据让大家自己判断,他没有喊口号,也没有组织队伍,就发了几条推文,贴了几段邮件截图,其他人大多保持沉默,有些同行私下议论说这种事经常发生,举报成本太高,胜算又低,不如选择闭嘴,但也有人悄悄转发他的帖子,没有添加评论,只是单纯转发了。
学术圈就像一个小江湖,谁说话声音大,谁就占上风,但真相这东西放久了,自然会浮出水面。