5月28日晚,deepseek再次傳來大消息。
當天,deepseek官方宣布deepseek r1模型已完成小版本試升級,歡迎前往官方網頁、app、小程序測試(打開深度思考),api 介面和使用方式保持不變。
不過,deepseek官方此次並沒有公布版本更新的具體內容。今年3月,deepseek曾對v3模型進行小版本升級,同樣是通過官方交流群率先宣布,隨後公布了具體更新內容。此前,也有許多關於r2大模型的傳聞出現,比如「參數規模被曝達到驚人的1.2萬億,相比前代r1的6710億參數幾乎翻倍等」。但截至目前,並未獲得官方證實。
deepseek的本次升級是在英偉達發布最新財報前數小時宣布的。作為全球領先的ai晶元製造商,英偉達的股價在1月因r1的發布而遭遇重挫。
據中國基金報報道,據用戶反饋,deepseek升級後的模型,思維鏈 (cot) 的行為似乎發生了顯著變化。
也有用戶總結了更新後的幾個亮點,其中包括:現在像google模型一樣進行深度推理;改進寫作任務——更自然、格式更好;獨特的推理風格——不僅快速,而且深思熟慮;長時間思考——每個任務最多30~60分鐘。
另外,據財聯社援引aigc開放社區的信息,已經有網友迫不及待的對新版r1進行測試,在著名代碼測試平台live codebench中顯示,其性能可以媲美openai最新的o3模型高版本。也有網友對新版r1的風格進行了測試,幾乎和openai的o3差不多。
據券商中國報道,這是自3月底以來,deepseek的一次最新動作。3月25日晚,deepseek公司在官方賬號上正式宣布v3模型完成小版本升級的消息,並介紹了新版本deepseek-v3-0324模型的提升細節,包括推理、前端開發、中文寫作、中文搜索幾個方面的能力優化。彼時,據海外專業ai模型評測機構最新排名,新版v3模型是得分最高的非推理模型,超過xai的grok3和openai的gpt-4.5(preview)。
然而,自那之後,deepseek的熱度就開始下降,使用率也有所回落,並且引發了一些質疑。當前,市場最關注的依然是其r2模型的發布。4月底,有傳聞稱,其r2大模型的參數規模被曝達到驚人的1.2萬億,相比前代r1的6710億參數幾乎翻倍。這一數字接近國際頂尖模型如gpt-4turbo和谷歌gemini2.0pro的水平。r2的動態激活參數為780億,實際消耗的計算量僅為總參數的6.5%。這種設計讓模型在保持高性能的同時,顯著降低了運行成本。然而,種種跡象表明,這些似乎只是市場人士的臆測,截至目前也未獲得官方證實,r2模型亦未推出。反觀open ai的動作卻相對較多,人工智慧大模型的競爭依然在持續。
編輯|何小桃 杜恆峰
校對|趙慶
封面圖片來源:每經記者 蘭素英 攝
每日經濟新聞綜合中國基金報、券商中國、財聯社
每日經濟新聞