非營利研究機構 METR:資深程序員使用 AI 反而會拖慢開發速度

2025年07月10日23:40:17 科技 9487

it之家 7 月 10 日消息,據路透社今日報道,非營利機構 metr 的最新研究發現,和大家普遍認為的相反,經驗豐富的軟件開發者在使用最先進的 ai 工具輔助熟悉的代碼庫時,反而變得更慢,而不是更快。

該機構對一批資深開發者進行了深入調查,他們用流行的 ai 編程助手 cursor 來完成自己熟悉的開源項目任務。

研究開始前,這些開發者預計 ai 能讓自己的工作速度提升,估計任務時間會縮短 24%。完成任務後,他們依然覺得自己節省了 20% 的時間。但研究數據顯示,ai 實際讓任務完成時間增加了 19%

非營利研究機構 METR:資深程序員使用 AI 反而會拖慢開發速度 - 天天要聞

研究負責人喬爾・貝克和內特・拉什表示,這結果令人非常意外。拉什甚至在研究前預期速度會翻倍。

這項發現挑戰了“ai 能顯著提升高薪工程師效率”的普遍看法,而這正是吸引大量投資進軍 ai 軟件開發領域的重要原因。更有甚者,還將 ai 看作將初級程序員崗位的“替代品”。

過去研究中,ai 在提升開發效率上取得了顯著成果:一項顯示程序員速度提高了 56%,另一項表明開發者在固定時間內能多完成 26% 的任務

但 metr 的新研究表明,這些積極結果並不適用於所有情況。尤其是對熟悉大型成熟開源代碼庫的資深開發者來說,反而出現了效率下降。

研究作者指出,很多相關研究依賴 ai 開發的基準測試,這些測試未必能真實反映現實工作任務。it之家從報道中獲悉,效率變慢的主要原因,是開發者需要花時間檢查和修正 ai 給出的代碼建議

貝克說:“ai 提出的建議方向基本正確,但細節上並非完全符合實際需求。”

作者強調,這種變慢不太可能出現在初級開發者或對不熟悉代碼庫的工程師身上。

不過大部分參與研究的開發者和作者本人依然使用 cursor。他們認為,ai 讓開發過程更輕鬆愉快,就像修改一篇文章,而不是從空白開始寫作。貝克表示:“開發者的目標不僅是儘快完成任務,他們更願意選擇這條付出更少努力的路。”

科技分類資訊推薦

小米頂級拍照旗艦狂降3000元,16GB+512GB+120倍變焦,最後還是等到了 - 天天要聞

小米頂級拍照旗艦狂降3000元,16GB+512GB+120倍變焦,最後還是等到了

早幾年提到“拍照手機”,不少人腦海里第一個蹦出來的還是華為。但眼下這個市場早已悄悄發生了變化。如今的消費者在選影像旗艦時,早已不再盯着某一家看,尤其是價格敏感型用戶,面對溢價較高、性能受限的情況,開始把注意力轉向了性價比更高、影像體驗同樣出
英特爾發布 6862 圖形驅動,相比 Q1 版本性能最高提升 37% - 天天要聞

英特爾發布 6862 圖形驅動,相比 Q1 版本性能最高提升 37%

IT之家 7 月 11 日消息,英特爾公司於 7 月 8 日,面向銳炫(Arc) B、A 系列顯卡、集成 Arc 核顯的酷睿 Ultra 系列處理器,發布了 32.0.101.6862(Q2.25)圖形驅動,主要提升性能。IT之家查詢英特爾官方公告,本次驅動更新為 710.5MB,相比較 2025 年第 1 季度驅動,在 SPECviewperf 15 基準
OpenAI悄然將Shopify納入購物搜索合作夥伴 - 天天要聞

OpenAI悄然將Shopify納入購物搜索合作夥伴

OpenAI 已悄然將 Shopify 添加為第三方搜索合作夥伴,以增強其購物搜索功能,從而呈現豐富的購物搜索結果。Shopify 的加入並未正式宣布,但已悄然嵌入 OpenAI ChatGPT 搜索文檔中。
ACL 2025 | 數據多不如風格齊?SCAR精選 - 天天要聞

ACL 2025 | 數據多不如風格齊?SCAR精選

本文共3600字,建議閱讀10分鐘SCAR 方法在大語言模型指令微調領域取得了重要突破。一、總覽這是 RMIT 大學、新南威爾士大學和莫納什大學聯合發表的論文。