非營利研究機構 METR:資深程序員使用 AI 反而會拖慢開發速度

2025年07月10日23:40:17 科技 9487

it之家 7 月 10 日消息,據路透社今日報道,非營利機構 metr 的最新研究發現,和大家普遍認為的相反,經驗豐富的軟件開發者在使用最先進的 ai 工具輔助熟悉的代碼庫時,反而變得更慢,而不是更快。

該機構對一批資深開發者進行了深入調查,他們用流行的 ai 編程助手 cursor 來完成自己熟悉的開源項目任務。

研究開始前,這些開發者預計 ai 能讓自己的工作速度提升,估計任務時間會縮短 24%。完成任務後,他們依然覺得自己節省了 20% 的時間。但研究數據顯示,ai 實際讓任務完成時間增加了 19%

非營利研究機構 METR:資深程序員使用 AI 反而會拖慢開發速度 - 天天要聞

研究負責人喬爾・貝克和內特・拉什表示,這結果令人非常意外。拉什甚至在研究前預期速度會翻倍。

這項發現挑戰了「ai 能顯著提升高薪工程師效率」的普遍看法,而這正是吸引大量投資進軍 ai 軟件開發領域的重要原因。更有甚者,還將 ai 看作將初級程序員崗位的「替代品」。

過去研究中,ai 在提升開發效率上取得了顯著成果:一項顯示程序員速度提高了 56%,另一項表明開發者在固定時間內能多完成 26% 的任務

但 metr 的新研究表明,這些積極結果並不適用於所有情況。尤其是對熟悉大型成熟開源代碼庫的資深開發者來說,反而出現了效率下降。

研究作者指出,很多相關研究依賴 ai 開發的基準測試,這些測試未必能真實反映現實工作任務。it之家從報道中獲悉,效率變慢的主要原因,是開發者需要花時間檢查和修正 ai 給出的代碼建議

貝克說:「ai 提出的建議方向基本正確,但細節上並非完全符合實際需求。」

作者強調,這種變慢不太可能出現在初級開發者或對不熟悉代碼庫的工程師身上。

不過大部分參與研究的開發者和作者本人依然使用 cursor。他們認為,ai 讓開發過程更輕鬆愉快,就像修改一篇文章,而不是從空白開始寫作。貝克表示:「開發者的目標不僅是儘快完成任務,他們更願意選擇這條付出更少努力的路。」

科技分類資訊推薦

【芯片】Tensor G5曝光,Pixel10工程機現身海鮮市場 - 天天要聞

【芯片】Tensor G5曝光,Pixel10工程機現身海鮮市場

近日谷歌Pixel 10 Pro Fold出現在了GeekBench跑分數據庫中:新機搭載了谷歌全新的Tensor G5處理器,據悉這代終於是告別了三星工藝,轉而擁抱台積電N3E工藝。從顯示信息來看,Tensor G5採用了1+5+2的八核CPU架構,1*3.78GHz X4超大核+5*3.05GHz A725大核+2*2.25GHz A520小核構成。單核
【新機】2K屏+潛望長焦,iQOO 15曝光 - 天天要聞

【新機】2K屏+潛望長焦,iQOO 15曝光

說到iQOO的數字旗艦系列,這代iQOO13相機被刀還是挺可惜的,主要也是為了避免和老大哥X200產生衝突。今天@數碼閑聊站曝光了下代iQOO旗艦的信息:新機可能會跳過iQOO 14,直接命名為iQOO 15,這代將會有中杯/大杯兩個杯型。新機將會採用6.85英寸2K LIPO三星定製直面屏,屏幕邊框極窄,支持Pol-less去偏光技術,還具有AR抗眩...
清華專家破百年陳規!滬上論壇曝電力革新,陳磊構想太敢了 - 天天要聞

清華專家破百年陳規!滬上論壇曝電力革新,陳磊構想太敢了

聽說了嗎?清華大學的專家居然說要徹底打破電力系統運行了上百年的規矩!就在上海那場新能源論壇上,陳磊研究員拋出個重磅觀點 —— 以後用電不用再看頻率臉色,有功功率想咋調就咋調!這事兒要是真能成,咱們家裡的空調、電動車充電可就再也不會因為電網不
消費活力釋放,上海零售商業形態向「文商旅體展」融合演進 - 天天要聞

消費活力釋放,上海零售商業形態向「文商旅體展」融合演進

2025年二季度,在上海市政府經濟刺激方案推動下,上海商業市場消費活力逐步釋放,但零售物業租賃指標的復蘇態勢仍顯平緩。核心商圈平均租金為1877元/平方米/月,平均出租率為94.71%,整體表現與去年同期持平,其中徐家匯、陸家嘴等商圈憑藉成熟商業生態,表現相對突出。但與非核心商圈相比,從存量、新增供應、凈吸納量等指...
OPPO K13 Turbo 系列真機曝光,7 月 21 日發佈 - 天天要聞

OPPO K13 Turbo 系列真機曝光,7 月 21 日發佈

IT之家 7 月 11 日消息,博主 @i冰宇宙 今日分享了一款帶保密殼的新機真機圖,配備 RGB 燈效以及主動散熱風扇,預計為剛剛官宣的 OPPO K13 Turbo 系列。IT之家注意到,OPPO K13 Turbo 系列將於 7 月 21 日發佈,在 GeekBench 6.3.0 中單核成績為 2156 分,多核成績為 6652 分,預計搭載高通驍龍