非营利研究机构 METR:资深程序员使用 AI 反而会拖慢开发速度

2025年07月10日23:40:17 科技 9487

it之家 7 月 10 日消息,据路透社今日报道,非营利机构 metr 的最新研究发现,和大家普遍认为的相反,经验丰富的软件开发者在使用最先进的 ai 工具辅助熟悉的代码库时,反而变得更慢,而不是更快。

该机构对一批资深开发者进行了深入调查,他们用流行的 ai 编程助手 cursor 来完成自己熟悉的开源项目任务。

研究开始前,这些开发者预计 ai 能让自己的工作速度提升,估计任务时间会缩短 24%。完成任务后,他们依然觉得自己节省了 20% 的时间。但研究数据显示,ai 实际让任务完成时间增加了 19%

非营利研究机构 METR:资深程序员使用 AI 反而会拖慢开发速度 - 天天要闻

研究负责人乔尔・贝克和内特・拉什表示,这结果令人非常意外。拉什甚至在研究前预期速度会翻倍。

这项发现挑战了“ai 能显著提升高薪工程师效率”的普遍看法,而这正是吸引大量投资进军 ai 软件开发领域的重要原因。更有甚者,还将 ai 看作将初级程序员岗位的“替代品”。

过去研究中,ai 在提升开发效率上取得了显著成果:一项显示程序员速度提高了 56%,另一项表明开发者在固定时间内能多完成 26% 的任务

但 metr 的新研究表明,这些积极结果并不适用于所有情况。尤其是对熟悉大型成熟开源代码库的资深开发者来说,反而出现了效率下降。

研究作者指出,很多相关研究依赖 ai 开发的基准测试,这些测试未必能真实反映现实工作任务。it之家从报道中获悉,效率变慢的主要原因,是开发者需要花时间检查和修正 ai 给出的代码建议

贝克说:“ai 提出的建议方向基本正确,但细节上并非完全符合实际需求。”

作者强调,这种变慢不太可能出现在初级开发者或对不熟悉代码库的工程师身上。

不过大部分参与研究的开发者和作者本人依然使用 cursor。他们认为,ai 让开发过程更轻松愉快,就像修改一篇文章,而不是从空白开始写作。贝克表示:“开发者的目标不仅是尽快完成任务,他们更愿意选择这条付出更少努力的路。”

科技分类资讯推荐

小米顶级拍照旗舰狂降3000元,16GB+512GB+120倍变焦,最后还是等到了 - 天天要闻

小米顶级拍照旗舰狂降3000元,16GB+512GB+120倍变焦,最后还是等到了

早几年提到“拍照手机”,不少人脑海里第一个蹦出来的还是华为。但眼下这个市场早已悄悄发生了变化。如今的消费者在选影像旗舰时,早已不再盯着某一家看,尤其是价格敏感型用户,面对溢价较高、性能受限的情况,开始把注意力转向了性价比更高、影像体验同样出
英特尔发布 6862 图形驱动,相比 Q1 版本性能最高提升 37% - 天天要闻

英特尔发布 6862 图形驱动,相比 Q1 版本性能最高提升 37%

IT之家 7 月 11 日消息,英特尔公司于 7 月 8 日,面向锐炫(Arc) B、A 系列显卡、集成 Arc 核显的酷睿 Ultra 系列处理器,发布了 32.0.101.6862(Q2.25)图形驱动,主要提升性能。IT之家查询英特尔官方公告,本次驱动更新为 710.5MB,相比较 2025 年第 1 季度驱动,在 SPECviewperf 15 基准
OpenAI悄然将Shopify纳入购物搜索合作伙伴 - 天天要闻

OpenAI悄然将Shopify纳入购物搜索合作伙伴

OpenAI 已悄然将 Shopify 添加为第三方搜索合作伙伴,以增强其购物搜索功能,从而呈现丰富的购物搜索结果。Shopify 的加入并未正式宣布,但已悄然嵌入 OpenAI ChatGPT 搜索文档中。
ACL 2025 | 数据多不如风格齐?SCAR精选 - 天天要闻

ACL 2025 | 数据多不如风格齐?SCAR精选

本文共3600字,建议阅读10分钟SCAR 方法在大语言模型指令微调领域取得了重要突破。一、总览这是 RMIT 大学、新南威尔士大学和莫纳什大学联合发表的论文。