當開源ai模型正成為技術巨頭必爭之地,openai卻出人意料地按下暫停鍵。openai首席執行官sam altman宣布其備受期待的開源模型將延期至“今年夏天晚些時候”,而非原定的6月。這場技術突襲恰逢中國deepseek等開源強敵加速搶灘,延期背後是技術豪賭還是市場狙擊?
6月11日周三,altman在x平台發文稱:
我們將對開源權重模型投入更多時間,也就是說,預計會在今年夏天晚些時候推出,而不是六月。我們的研究團隊做了一些出乎意料且相當令人驚嘆的事情,我們認為這將非常非常值得等待,但需要稍長時間。
據此前規劃,該模型將具備與gpt-4o相當的複雜推理能力,性能目標直指超越當前頂尖開源推理模型——包括中國深度求索(deepseek)的r1模型。
當前ai市場競爭已經顯著加劇。周二,法國ai實驗室mistral推出了其首個ai推理模型系列magistral;4月,中國ai實驗室通義千問(qwen)發布了一系列混合ai推理模型,能夠在深入推理和傳統快速響應間切換。
據techcrunch此前報道,openai領導層曾討論為開源ai模型增加複雜功能,包括開源模型添加連接雲端大模型的接口功能,以處理超複雜查詢。然而,這些功能是否會被納入最終版本尚不清楚。
更深層壓力來自企業戰略轉型。altman曾公開承認,openai過去在開源方面一直站在“歷史錯誤的一邊”。此次開源模型被視為修復開發者關係的核心舉措,若無法在性能上匹敵deepseek r1等頭部開源產品,openai將面臨巨大聲譽風險。
網友也猜測,openai此舉可能是為了狙擊deepseek r2。“如果現在匆忙發一個,等deepseek r2出來,打不過就很尷尬了。”
deepseek r2指日可待
deepseek r2是深度求索公司研發的新一代多模態大語言模型,作為其前代產品r1的迭代版本,r2在技術架構、功能特性、資源效率等方面實現了顯著升級。
摩根士丹利6月初一篇研報預測,deepseek r2的ai調用成本大降87%,推理能力升級,圖像、語音、視頻全能處理。
華爾街見聞此前文章提及,deepseek創始人梁文鋒曾表示:“中國也要逐步成為創新貢獻者,而不是一直搭便車。” 他將探索通用人工智能的本質作為核心使命。
根據《中國企業家》的報道,deepseek創始人梁文鋒帶領的ai團隊一直保持着與國際巨頭同步的產品迭代節奏——2024年9月推出v2.5版本,12月發布v3基礎架構,次年3月升級至v3-0324版本,形成每季度重大更新的開發範式。
如此穩健而高效的產品迭代節奏,傳言已久的deepseek r2或指日可待。
本文來自華爾街見聞,歡迎下載app查看更多