剛剛,OpenAI最強編程智能體上線ChatGPT!AI的「終極外掛」來了

2025年05月17日05:00:15 科技 2498
altman 昨天早上還在 x 上賣關子,說有個研究預覽版本快上線,要給它起個「如果它成了會很好記」的名字。
就在剛剛,openai 正式發佈 codex。
這是一款基於雲端運行的軟件工程智能 agent,能夠並行處理多個開發任務,協助開發者高效完成編程工作。
剛剛,OpenAI最強編程智能體上線ChatGPT!AI的「終極外掛」來了 - 天天要聞
ui 設計沒整花活,codex 提供一個輸入框和兩個按鈕——「ask」(提問)和 「code」(編碼)。你只需明確描述任務,它就會開始執行。
興奮的 altman 在 x 平台連發數條推文表示:
像這樣的工具,讓一個人能開發出的軟件數量,實在令人驚嘆又令人興奮。「你其實可以直接去做」是我最喜歡的梗之一;我原本沒想到,它會這麼快以如此重要的方式應用到 ai 本身以及它的使用者身上。
剛剛,OpenAI最強編程智能體上線ChatGPT!AI的「終極外掛」來了 - 天天要聞
codex 能勝任的工作不僅僅是編寫功能代碼,還包括理解代碼結構、回答關於代碼庫的問題、修復 bug,甚至直接提交可審查的拉取請求(pull request)。
每個任務都在雲端獨立的沙箱環境中執行,自動加載用戶的代碼倉庫。運行時長從 1 分鐘到 30 分鐘不等,取決於任務複雜度,同時用戶可以實時查看任務進度。
任務完成後,codex 會輸出一整套可追溯的執行結果,包括終端日誌、測試記錄等驗證信息。你可以對修改結果進行審查、提出建議,甚至直接在 github 上發起 pr,或者合併進本地項目。
藉助項目中的 agents.md 文件,用戶還可自定義 codex 的行為,讓它更貼合具體項目的開發規範與測試標準。
剛剛,OpenAI最強編程智能體上線ChatGPT!AI的「終極外掛」來了 - 天天要聞
codex 的核心模型為 codex-1,這是 openai o3 系列裏專為軟件工程微調過的版本。
基準測試結果顯示,codex-1 在 swe-bench 的得分為 72.1%,紙面參數優於 claude 3.7 以及 o3-high。
剛剛,OpenAI最強編程智能體上線ChatGPT!AI的「終極外掛」來了 - 天天要聞
訓練方式也很「實戰」,通過在真實開發環境中進行強化學習訓練,codex 能夠生成更符合人類編碼風格和審查偏好的代碼,嚴格按照指令執行,並不斷運行測試,直到測試通過為止。
從今天開始,codex 將向 chatgpt pro、enterprise 和 team 用戶開放,而 plus 和 edu 用戶的支持也將很快上線。
剛剛,OpenAI最強編程智能體上線ChatGPT!AI的「終極外掛」來了 - 天天要聞
安全性方面,codex 做得也夠剋制。執行任務時,它只會訪問你提供的代碼庫和預設依賴,不能聯網、不能訪問外部 api,遇到不確定問題會停下來提示你處理。
並且,codex 經過專門訓練,能夠識別並拒絕與惡意開發相關的請求,避免被濫用於開發惡意軟件。
目前,openai 已在內部廣泛使用 codex,協助工程師完成重構、命名規範、編寫測試等重複性任務,顯著提升開發效率。一些外部合作團隊也給出了積極反饋,比如 cisco 與 temporal 藉助 codex 加快了開發與調試節奏。

在深夜直播中,openai 的員工展示了 codex 更具實用性的能力:

它能夠理解整個代碼庫的結構,自動定位並修復 bug,處理超時設置或拼寫錯誤等常見問題。即使是在命令行報錯時,codex 也能分析出錯原因,自動生成修復腳本和相應的測試用例。

此外,它還具備代碼審查功能,能梳理所有改動點,並指出可能導致測試失敗的風險。換句話說,codex 正在逐步進化為一個真正可用的編程協作助手。

剛剛,OpenAI最強編程智能體上線ChatGPT!AI的「終極外掛」來了 - 天天要聞
openai 員工也分享了他們用 codex 管理大型代碼變更的經驗,即使這些變更代碼從未跑過本地環境,也能順利合併、通過測試。
知名科技作者 dan shipper 提前體驗了 codex,並用一篇博客分享了他的使用感受。
在他看來,通過 codex,用戶可以像管理團隊一樣分配任務,而不需要編寫代碼。codex 特別適合資深開發者,在執行任務時能夠產生簡潔高效的代碼變更,並自動生成 pull request 提交到 github。
然而,codex 也有一些局限性,比如對於新手工程師不太友好,不擅長處理後續的修改與補充任務,並且尚未完全整合到主流開發平台如 github 和 slack。
剛剛,OpenAI最強編程智能體上線ChatGPT!AI的「終極外掛」來了 - 天天要聞
它的設計主要面向專業開發者,而不是那些喜歡邊聊邊編程的用戶。codex 的核心優勢在於提高高級開發者的工作效率,使他們能夠同時管理多個任務,從而加速開發進程。
如果你是技術主管、需要在已有項目中添加功能或修復 bug,那麼 codex 是你會常用的工具;但如果你是在從零開始搞一個 「一人十億級美元 saas」,可能就用不上它。
簡單來說,如果你一個人做了一個網站或工具,用戶通過訂閱使用,每月收入達到幾百萬,年收入破千萬甚至過億,那麼你就是在做「一人十億級美元 saas」。
剛剛,OpenAI最強編程智能體上線ChatGPT!AI的「終極外掛」來了 - 天天要聞
除了雲端主力模型之外,openai 還同步推出了專為命令行優化的輕量模型 codex-mini-latest,支持開發者在本地環境快速接入 ai。
codex cli 登錄流程簡潔,可直接使用 chatgpt 賬號接入,並享受基礎的免費 api 配額。目前已向全球範圍內的 pro、enterprise 和 team 用戶開放,未來幾周內還將陸續支持 plus 與 edu 用戶。
對於接入 codex-mini-latest 的開發者,該模型可通過 responses api 調用,價格為每百萬輸入 tokens 花費 1.5 美元、每百萬輸出 tokens 花費 6 美元,支持高達 75% 的提示緩存摺扣,進一步降低調用成本。
剛剛,OpenAI最強編程智能體上線ChatGPT!AI的「終極外掛」來了 - 天天要聞
openai 對 codex 的長線願景很明確:
它不僅是一個寫代碼的工具,更是未來協作模式的雛形。多代理、異步執行、自動彙報進度,這一套邏輯未來可能內嵌進 ide、git 工具、甚至 slack 里,成為開發者真正的「副駕駛」。
目前 codex 仍處於研究預覽階段,圖像輸入等高級功能尚未開放。
但過去那些對 ai 編程助手的暢想,比如自動寫代碼、提 pr、修 bug,終於在 codex 身上以可用工具的形式落地,成為真正能上手、能跑進實際工作流的產品。

科技分類資訊推薦

Nothing 首款頭戴式耳機 Headphone (1) 發佈,復古透明設計 - 天天要聞

Nothing 首款頭戴式耳機 Headphone (1) 發佈,復古透明設計

IT之家 7 月 2 日消息,Nothing 首款頭戴式耳機 —— Nothing Headphone (1) 今日正式發佈。這款耳機延續了該品牌復古、透明的設計風格,摒棄了觸控設計,採用了更復古的物理滾輪和按鍵控制。Nothing Headphone (1) 採用 CNC 鋁製外殼,內部記憶泡沫耳墊可以貼合耳朵。硬件方面,Nothing 與音響品牌 KEF
小米YU7支持車外呼叫小愛開前備箱:三個條件都滿足才能用 - 天天要聞

小米YU7支持車外呼叫小愛開前備箱:三個條件都滿足才能用

快科技7月2日消息,小米YU7上首發了車外小愛同學的功能,在車外有8個麥克風和1個揚聲器。無論在哪個角度,都可以很容易使用語音控車,比如在車外直接讓小愛同學打開前備箱。這也讓很多網友和准車主疑惑,會不會存在安全問題?對此,小米汽車在最新一期問答中表示,出於安全的考量,在車外通過小愛同學打開小米YU7的前備箱,...
小米汽車闢謠YU7交付插隊費:都是假的 - 天天要聞

小米汽車闢謠YU7交付插隊費:都是假的

快科技7月2日消息,小米汽車日前發佈第166集答網友問。對於「網上有人自稱小米汽車交付專員,宣稱可以提前交付車輛,是真的嗎?」小米汽車表示:如有收到類似短訊,請大家切勿相信,更不要涉及金錢交易,以避免經濟損失。涉及類似「提前交付」、「提前交付需轉賬給個人」或「支付插隊費」等信息,請大家一定要仔細甄別。涉...
甜品上市!七彩虹iGameRTX 5050 Ultra顯卡:溫控性能兩開花 - 天天要聞

甜品上市!七彩虹iGameRTX 5050 Ultra顯卡:溫控性能兩開花

據悉,一線顯卡品牌七彩虹的又一甜品級裝備iGameGeForce RTX 5050 Ultra系列顯卡現已正式上架各大電商平台和線下授權零售商!該系列RTX5050顯卡搭載8GBGDDR6高速顯存,2560個CUDACores,配合革命性DLSS4多幀生成技術,3A遊戲全特效暢玩無壓力,內容創作如虎添翼!更配備強勁的散熱系統,性能與溫控雙優表現,讓每一分預算
光追入門但超流暢!映眾RTX5050 8GB曜夜發佈 - 天天要聞

光追入門但超流暢!映眾RTX5050 8GB曜夜發佈

映眾GeForceRTX 5050 8GB曜夜顯卡現已和大家見面。基於NVIDIABlackwell架構打造,以緊湊雙槽設計、高效散熱及AI加速能力,為新一代RTX50系入門級市場注入新活力。作為GeForceRTX 50系列的入門主力,映眾RTX5050 8GB曜夜憑藉NVIDIABlackwell架構的革新設計,在AI與圖形處理效率上有着不俗的性能表現。
從SEO到CRO:搜索優化的時代變革 - 天天要聞

從SEO到CRO:搜索優化的時代變革

在數字營銷領域,搜索引擎優化(SEO)曾經是獲取流量的黃金法則。我們習慣於在搜索引擎輸入關鍵詞,然後結果頁面中尋找答案。但隨着ChatGPT、DeepSeek等生成式AI的崛起,這個延續了二十多年的搜索模式正在被徹底改寫。當AI能夠直接生成完整答案時,傳統的SEO策略突然變得力不從心——這就是為什麼我們需要重新認識AI時代的...
全球可持續交通創新聯盟可持續航空燃料專委會成立 - 天天要聞

全球可持續交通創新聯盟可持續航空燃料專委會成立

7月1日,全球可持續交通創新聯盟的第一個國際性專委會—可持續航空燃料專委會成立。該專委會的成立旨在整合產業鏈力量,構建「技術創新-產業協同-價值共享」三位一體的生態體系,為中國乃至全球能源綠色轉型和航空業低碳未來發展提供「中國方案」。啟動儀式上,中國能建聯合行業頭部企業共同發佈《可持續航空燃料(SAF)產...
張勇出局,蔣凡上位:阿里權力大地震 - 天天要聞

張勇出局,蔣凡上位:阿里權力大地震

英雄難過美人關。京東創始人劉強東,曾因「明州事件」一度沉寂,事隔七年之後才真正重回公眾視野。當年的天貓總裁蔣凡,亦因一場「桃色風波」消失在鎂光燈下,直至近期才鋒芒再現。
2025第25周銷量最高的30款機型曝光 前三隻有一款國產 - 天天要聞

2025第25周銷量最高的30款機型曝光 前三隻有一款國產

【CNMO科技消息】近日,有數碼博主曝光了2025年第25周(6月16日到6月22日)中國智能手機市場上銷量最高的30款機型: 第一名,iPhone 16 Pro 第二名,iPhone 16 Pro Max 第三名,OPPO Reno 14 第四名,iPhone 16 第五名,REDMI K80 第六名,小米15 第七名,華為nova 14 第八名,榮耀40