去年,一篇来自MIT博士二年级学生的论文一经发布,立刻引发学术界广泛关注。
该研究通过对一个大型材料实验室的调查,用详实数据展示了AI工具如何显著提升科研人员的工作效率。更令人惊讶的是,作者还发现AI在科研中产生了一些有趣的“次生效应”。
当时,这篇论文不仅登上多家主流媒体头条,还获得业内高度评价——“这是目前为止关于AI对科学探索影响最深入的研究之一。”
不仅如此,作者还将论文提交至全球顶级经济学期刊《The Quarterly Journal of Economics》,并收到“修改后重新提交”的通知,意味着论文极有可能被正式发表。
然而就在不久前,这篇论文的两位导师——诺贝尔经济学奖得主Daron Acemoglu与David Autor教授突然公开呼吁撤稿,原因是他们怀疑论文中的关键数据可能是伪造的!
目前,MIT经济系已在官网上发布正式声明,请求arXiv平台撤下该论文。
MIT表示,这篇发布于2024年11月的预印本论文自发表以来便引发质疑。经过内部保密审查后,学校认为必须将其撤回,并已联系arXiv和相关期刊提出撤稿申请。
此前,MIT曾要求该学生自行申请撤稿,但遭到拒绝。如今,学校强调,该学生已不在校内注册,不属于MIT成员。
事实上,早在去年底论文刚一发布时,就已有不少学者提出疑问。随着质疑声不断增多,导师们也开始察觉问题,并主动上报学校展开调查。
最终,论文作者所致谢的两位教授Acemoglu和Autor联合发表声明:
MIT一名前博士二年级学生的论文《Artificial Intelligence, Scientific Discovery and Product Innovation》虽尚未通过同行评审发表,却已在AI与科学领域引起广泛讨论。
尽管由于学生隐私法和MIT相关政策限制,无法披露具体调查细节,但我们必须明确指出:我们对该论文中数据来源、可靠性及研究真实性均缺乏信心。
我们希望澄清一点:现阶段,学术界或公众在探讨相关议题时,不应采信该论文所呈现的结果。
以下是声明原文(可上下滑动查看):
AI让新材料发现暴增44%?数据是假的
回顾去年年底,这篇论文一度引发轰动。作者提出的多项结论极具吸引力:
AI正以前所未有的速度推动新发现,使研究人员发现的新材料数量增长了44%,专利申请量增加39%,下游产品创新增长17%;
AI对科研生产力的影响极为不均,顶尖1/10科学家产出提升81%,而排名靠后的1/3几乎无变化;
对高产科学家而言,AI成为其“智能伙伴”,放大创造力和产出。
沃顿商学院教授Ethan Mollick也转发支持该文,许多读者称赞这是一篇值得期待的大模型与科研结合的高质量研究。
然而现在看来,这些看似振奋人心的数据,竟可能源自伪造?
此事引发热议后,《大西洋月刊》记者以题为《科学家 vs 机器》的文章对此进行了深度报道。
早在2024年11月,就有专业人士对论文内容提出质疑。
伦敦大学学院无机与材料化学教授Robert Palgrave公开表示,文中观点存在诸多漏洞,逻辑不够严谨。
他随后展开详细分析:
论文称研究对象是一家匿名美国公司,拥有超过1000名科学家从事新材料研发,涵盖医疗、光学、工业制造等多个方向。然而,其中多个细节令人起疑。
例如,作者声称该公司早在2022年就开始系统使用AI进行科研,并设立大规模对照实验。试问,哪家企业会如此前瞻性地为上千名员工设置多年追踪机制,并将数据提供给一位MIT博士一年级学生?
此外,作者甚至能查阅员工实验记录,这种权限是否合理也值得商榷。
更可疑的是,论文中提到的材料类型包括生物材料、陶瓷、金属合金、聚合物等,但并未给出具体说明。
Palgrave指出,像陶瓷这类材料结构复杂且无序,极难通过AI进行高通量建模。谷歌DeepMind早期尝试失败即源于此。
论文使用的SOAP方法也被质疑修改过:“第二项对靠近质心的原子增加了权重。”但周期性材料并无中心之说,前提本身错误。
所谓“新颖性”指标因此并不具备说服力。
论文声称AI帮助发现了新材料,但如何验证这些预测是否真实有效?作者几乎没有提及。
Palgrave最后表示,虽然论文构思巧妙、工作量庞大,但整体数据过于理想化,令人难以信服。
材料科学家怎么看?
另一位材料专家Ben则从技术角度进一步剖析。
他表示,论文描述了一家美国公司对1000多名材料科学家进行的随机试验,涉及AI工具对科研各环节的影响。然而,数据太过完美,几乎不真实。
例如:
新材料数量 ↑ 44%
专利数量 ↑ 39%
原型产品 ↑ 17%
所有结果都具有统计显著性(p<0.000),每项指标都呈现出清晰趋势,图表也异常规整。
再看裁员案例:公司裁掉3%员工,却奇迹般不影响数据分析,反而成为论文亮点之一。这种巧合实在难以置信。
Ben还指出,作者声称通过晶体结构计算判断新材料相似度,但没有提供任何技术细节。仅凭一个经济学博士的能力,几乎不可能独立完成如此复杂的建模。
图表显示AI发现的新材料更具创新性,若属实,足以单独发表于《Nature》。但在文中却仅作为附录。
更重要的是,不同材料类型的相似性应有差异,但作者未做归一化处理,数据显然不可靠。
综上所述,这篇论文很可能完全虚构。即便如此,它仍险些登上顶级期刊,足见造假手法之高明。
欢迎您的阅读,请关注本号,持续为您带来有用资讯,感谢!