非营利研究机构 METR:资深程序员使用 AI 反而会拖慢开发速度

2025年07月10日23:40:17 科技 9487

it之家 7 月 10 日消息,据路透社今日报道,非营利机构 metr 的最新研究发现,和大家普遍认为的相反,经验丰富的软件开发者在使用最先进的 ai 工具辅助熟悉的代码库时,反而变得更慢,而不是更快。

该机构对一批资深开发者进行了深入调查,他们用流行的 ai 编程助手 cursor 来完成自己熟悉的开源项目任务。

研究开始前,这些开发者预计 ai 能让自己的工作速度提升,估计任务时间会缩短 24%。完成任务后,他们依然觉得自己节省了 20% 的时间。但研究数据显示,ai 实际让任务完成时间增加了 19%

非营利研究机构 METR:资深程序员使用 AI 反而会拖慢开发速度 - 天天要闻

研究负责人乔尔・贝克和内特・拉什表示,这结果令人非常意外。拉什甚至在研究前预期速度会翻倍。

这项发现挑战了“ai 能显著提升高薪工程师效率”的普遍看法,而这正是吸引大量投资进军 ai 软件开发领域的重要原因。更有甚者,还将 ai 看作将初级程序员岗位的“替代品”。

过去研究中,ai 在提升开发效率上取得了显著成果:一项显示程序员速度提高了 56%,另一项表明开发者在固定时间内能多完成 26% 的任务

但 metr 的新研究表明,这些积极结果并不适用于所有情况。尤其是对熟悉大型成熟开源代码库的资深开发者来说,反而出现了效率下降。

研究作者指出,很多相关研究依赖 ai 开发的基准测试,这些测试未必能真实反映现实工作任务。it之家从报道中获悉,效率变慢的主要原因,是开发者需要花时间检查和修正 ai 给出的代码建议

贝克说:“ai 提出的建议方向基本正确,但细节上并非完全符合实际需求。”

作者强调,这种变慢不太可能出现在初级开发者或对不熟悉代码库的工程师身上。

不过大部分参与研究的开发者和作者本人依然使用 cursor。他们认为,ai 让开发过程更轻松愉快,就像修改一篇文章,而不是从空白开始写作。贝克表示:“开发者的目标不仅是尽快完成任务,他们更愿意选择这条付出更少努力的路。”

科技分类资讯推荐

【芯片】Tensor G5曝光,Pixel10工程机现身海鲜市场 - 天天要闻

【芯片】Tensor G5曝光,Pixel10工程机现身海鲜市场

近日谷歌Pixel 10 Pro Fold出现在了GeekBench跑分数据库中:新机搭载了谷歌全新的Tensor G5处理器,据悉这代终于是告别了三星工艺,转而拥抱台积电N3E工艺。从显示信息来看,Tensor G5采用了1+5+2的八核CPU架构,1*3.78GHz X4超大核+5*3.05GHz A725大核+2*2.25GHz A520小核构成。单核
【新机】2K屏+潜望长焦,iQOO 15曝光 - 天天要闻

【新机】2K屏+潜望长焦,iQOO 15曝光

说到iQOO的数字旗舰系列,这代iQOO13相机被刀还是挺可惜的,主要也是为了避免和老大哥X200产生冲突。今天@数码闲聊站曝光了下代iQOO旗舰的信息:新机可能会跳过iQOO 14,直接命名为iQOO 15,这代将会有中杯/大杯两个杯型。新机将会采用6.85英寸2K LIPO三星定制直面屏,屏幕边框极窄,支持Pol-less去偏光技术,还具有AR抗眩...
清华专家破百年陈规!沪上论坛曝电力革新,陈磊构想太敢了 - 天天要闻

清华专家破百年陈规!沪上论坛曝电力革新,陈磊构想太敢了

听说了吗?清华大学的专家居然说要彻底打破电力系统运行了上百年的规矩!就在上海那场新能源论坛上,陈磊研究员抛出个重磅观点 —— 以后用电不用再看频率脸色,有功功率想咋调就咋调!这事儿要是真能成,咱们家里的空调、电动车充电可就再也不会因为电网不
消费活力释放,上海零售商业形态向“文商旅体展”融合演进 - 天天要闻

消费活力释放,上海零售商业形态向“文商旅体展”融合演进

2025年二季度,在上海市政府经济刺激方案推动下,上海商业市场消费活力逐步释放,但零售物业租赁指标的复苏态势仍显平缓。核心商圈平均租金为1877元/平方米/月,平均出租率为94.71%,整体表现与去年同期持平,其中徐家汇、陆家嘴等商圈凭借成熟商业生态,表现相对突出。但与非核心商圈相比,从存量、新增供应、净吸纳量等指...
OPPO K13 Turbo 系列真机曝光,7 月 21 日发布 - 天天要闻

OPPO K13 Turbo 系列真机曝光,7 月 21 日发布

IT之家 7 月 11 日消息,博主 @i冰宇宙 今日分享了一款带保密壳的新机真机图,配备 RGB 灯效以及主动散热风扇,预计为刚刚官宣的 OPPO K13 Turbo 系列。IT之家注意到,OPPO K13 Turbo 系列将于 7 月 21 日发布,在 GeekBench 6.3.0 中单核成绩为 2156 分,多核成绩为 6652 分,预计搭载高通骁龙