it之家 4 月 3 日消息,上周,負責維護和管理 arc-agi 的 arc prize foundation 對 openai 的 o3 “推理”人工智能模型在 arc-agi 基準測試中的成本估算進行了重大修訂,現在看起來 o3 的運行成本沒有那麼低。
去年 12 月 openai 推出 o3 模型時,與 arc-agi 的開發者合作,展示了該模型在解決複雜問題上的強大能力。然而,幾個月後,其成本估算結果卻發生了顯著變化。arc prize foundation 最新估計,o3 模型中表現最佳的配置 o3 high,解決一個單一的 arc-agi 問題的成本可能高達約 3 萬美元(it之家註:現匯率約合 21.8 萬元人民幣),而此前的估算僅為約 3000 美元(現匯率約合 21821 元人民幣)。
這一成本估算的大幅上調,凸顯了目前最先進 ai 模型在特定任務上可能面臨的高昂成本。儘管 openai 尚未公布 o3 模型的定價,也未正式發布該模型,但 arc prize foundation 認為,openai 目前最昂貴的 o1-pro 模型的定價可以作為參考。
“我們認為 o1-pro 更接近 o3 真實成本的比較對象,因為兩者在測試時使用的計算量相近。”arc prize foundation 的聯合創始人邁克・庫諾(mike knoop)在接受 techcrunch 採訪時表示,“但這仍然只是一個參考值,我們在排行榜上仍將 o3 標記為預覽版,以反映在官方定價公布前的不確定性。”
o3 high 的高成本並非毫無依據。據 arc prize foundation 介紹,o3 high 在處理 arc-agi 任務時,使用的計算資源是 o3 模型中計算量最低的 o3 low 配置的 172 倍。如此巨大的計算資源消耗,使得 o3 high 的成本大幅上升。
此外,有關 openai 計劃為面向企業客戶的高端定製服務收取高額費用的傳聞也由來已久。今年 3 月初 the information 報道稱,該公司可能計劃每月收取高達 2 萬美元(現匯率約合 14.5 萬元人民幣)的費用,為企業提供像軟件開發人員代理這樣的專業 ai “代理”服務。
儘管有人認為,即使是最昂貴的 ai 模型,其成本也遠低於人類承包商或員工的薪酬,但 ai 研究員托比・奧德(toby ord)在 x 網站上發表的一篇文章指出,這些模型的效率可能並不如人們預期的那麼高。例如,o3 high 在 arc-agi 測試中,需要嘗試 1024 次才能達到最佳成績。
隨着 ai 技術的不斷發展和商業化進程的加速,如何在保持模型高性能的同時,有效控制成本,將成為行業面臨的重要挑戰之一。