OpenAI最強寫代碼AI智能體來了:周五ChatGPT上線Codex研究預覽版

ai編程工具的競爭正在白熱化。傳聞的30億美元收購編程神器windsurf消息還未證實,openai已經先給chatgpt配置了自研的最強寫代碼ai智能體。

ai編程市場迅速擴大至數十億美元規模。對投資者而言,這標誌着ai應用場景從"玩具"轉向真正的生產力工具,將重塑軟件行業價值鏈和投資格局。

o3優化的新一代codex 同時運行多任務

5月16日周五,openai宣布推出codex研究預覽版,周五當天起向chatgpt的pro、enterprise 和team版的用戶推出,plus 和 edu版用戶也將能很快使用codex的服務。

據openai博客介紹,周五上線的codex是一個基於雲的軟件工程智能體,能夠同時處理多項任務。與2021年推出的原始codex模型不同,新版codex由codex-1驅動,這是openai o3模型的軟件工程優化版本。

優化後的codex使用強化學習在各種環境中對真實編碼任務進行訓練,生成的代碼能夠高度反映人類的風格和pr偏好,精確遵循指令,並能夠迭代運行測試,直到獲得合格結果。。

codex可以執行編寫功能、回答有關代碼庫的問題、修復bug以及提出拉取請求等任務。每項任務都在預加載了用戶代碼庫的獨立雲沙盒環境中運行。視任務複雜性而定,新版codex完成任務通常需要1到30分鐘,用戶可以實時監控進度。

openai的ceo sam altman在社交媒體發帖力捧codex,稱它是一個在雲端運行的軟件工程智能體,能同時運行多個任務,還稱:

「一個人能就用這樣的工具創造出如此多的軟件,真是令人驚嘆和興奮。『你只管做事』(you can just do things)是我最喜歡的一個梗,沒想到它會這麼快就以如此重要的方式用在ai自身及其用戶上。」

altman還轉貼了開發者對codex的花式吐槽、間接好評。有人說,用這個工具等於你招了個軟件工程師,可每月花20美元的套餐竟然不能無限制用它,去你的吧;還有人說,這工具等於,你招了一名軟件工程師,每月薪資都沒有2萬美元,搞什麼鬼。

openai代理研究團隊負責人josh tobin表示:

「我們認為智能體是能夠通過與現實世界交互來代表你執行更長時間工作的ai系統。我們的願景是chatgpt將成為一個虛擬同事——不僅回答快速問題,還能在各種任務上進行實質性合作。」

發佈codex的同時,openai也更新了開源編碼代理codex cli。該cli是用於本地開發的輕量級終端智能體,現在使用更小的模型codex-mini-latest,並針對低延遲編輯和問答進行了優化。它的定價為每百萬輸入token 1.50 美元,每百萬輸出token 6 美元,並提供75%的緩存摺扣。

如何操作codex?不聯網就能執行任務

用戶可以通過chatgpt側邊欄訪問codex,輸入提示並點擊"code"按鈕分配新的編碼任務,或點擊"ask"按鈕詢問關於代碼庫的問題。每個任務在一個單獨的環境中獨立處理,該環境預加載了用戶的代碼庫。

codex可以讀取和編輯文件,並運行包括測試工具、代碼檢查器和類型檢查器在內的命令。完成任務後,它會在環境中提交更改,並通過終端日誌和測試輸出的引用提供可驗證的證據。

值得注意的是,codex在沒有互聯網連接的環境下即可執行任務,僅依賴用戶提供的代碼和依賴項。這種設計確保了操作安全,並最大限度地減少了潛在的濫用。

openai的桌面與智能體團隊負責人alexander embiricos表示:"這不僅僅是一個模型api。因為它在有人工審查的隔離環境中運行,我們可以安全地給模型更多自由。"

為開發團隊打造 不僅僅服務個人開發者

codex的設計初衷是服務專業開發者。現在看來,openai目的是讓這款工具為整個開發團隊、而不是開發者個人服務。

openai設想將 codex 打造為全新開發工作流程的核心,工程師可以將高級任務分配給智能體,並與之進行異步協作。openai正在努力實現與 github、chatgpt desktop、問題跟蹤器和持續集成 (ci) 系統的深度集成。其長期目標是將實時配對和長期任務委派融合到無縫的開發體驗中。

embiricos 指出,即使是產品經理也發現,在引入人類軟件工程師 (swe) 之前,它有助於提出或驗證變更。這種多功能性體現了 openai 構建工具以提升技術團隊生產力的戰略。

該項目的工程負責人trini 總結,codex背後的宏偉願景是:「將徹底改變軟件工程師與人工智能和計算機交互的方式。它能夠放大每個人的潛力。」

除了codex openai可能還收購熱門ai編碼工具

openai上線codex的時機引人注目。ai編碼工具正成為增長最快的技術領域之一。谷歌和微軟的ceo各自表示,兩家公司約30%的代碼現在都是由ai編寫。

最近媒體稱,openai正在磋商,可能進行約30億美元收購ai編碼初創公司windsurf的交易。而就在codex發佈前一天,windsurf推出了自己的編碼基礎模型系列swe-1。

還有媒體稱,除了可能收購windsurf,openai之前還商談過收購另一款快速增長的ai開發工具cursor,不過cursor一方據稱已退出談判。

媒體稱,作為最受歡迎的ai編碼工具之一,cursor今年4月達到了約3億美元的年化收入。本月初,有媒體獲悉,cursor的開發機構anysphere在進行新一輪融資,融資規模已達9億美元,公司估值90億美元。

similarweb數據顯示,過去12周,面向開發者的ai工具流量增長了75%,這表明對編碼助手的需求正在迅速增長。

對投資者而言,ai編程領域出現重大機遇,不僅因為像cursor這樣的工具已經實現了可觀收入,還因為這些工具正在改變整個軟件開發過程。技術公司正越來越依賴這些工具,這意味着投資於此領域的公司或提供相關服務的公司可能會看到持續增長。

本文來自華爾街見聞,歡迎下載app查看更多