外界熱議DeepSeek低調「上新」

2025年03月26日07:10:13 娛樂 3485

【環球時報報道 記者 劉揚】中國人工智慧初創公司深度求索(deepseek)24日深夜低調上線了deepseek-v3的新版本deepseek-v3-0324,參數量為6850億,在代碼、數學、推理等多個方面的能力再次顯著提升,甚至代碼能力追平美國anthropic公司大模型claude 3.7。不過,外界對於deepseek-v3-0324的關注並不僅僅因為該版本的能力提升,而是猜測它的發布是否意味著deepseek更新一代的v4與r2大模型的發布不遠了。

外界熱議DeepSeek低調「上新」 - 天天要聞

deepseek移動端頁面 圖源:視覺中國

在回答《環球時報》記者有關deepseek-v3新版本有哪些能力提升時,deepseek表示,一是新版本代碼能力顯著提升,接近claude 3.7水平。例如,有用戶在實測中發現,v3-0324能一次性生成800行無錯誤的網頁代碼,並實現動態響應式布局和交互效果。二是數學與邏輯推理能力增強。例如經典的「4升水壺問題」和數學競賽題(如aime 2025題目),部分表現接近專業推理模型。三是模型架構與開源生態。v3-0324採用mit許可證,允許自由修改、分發及商業化應用,進一步降低了開發者的使用門檻。

清華大學新聞學院、人工智慧學院教授瀋陽25日對《環球時報》記者表示,deepseek-v3-0324不僅是v3系列的一次迭代,更是中國ai技術崛起的又一力證。其在性能、效率和開源策略上的綜合優勢使其在全球大語言模型領域佔據重要地位。未來,deepseek可能通過推理能力提升和多模態擴展來鞏固技術領先優勢,同時在中美競爭和社區生態中尋找平衡。瀋陽認為,deepseek-v3-0324的發布看似是一次「小更新」,但其性能跳躍表明該團隊可能在為後續重大版本(如傳言中的deepseek-r2或v4)鋪路。

路透社今年2月底引述3名知情人士的說法宣稱,deepseek原計劃在今年5月初發布r2,但現在希望儘早推出,具體時間尚未透露。此外,deepseek希望新模型在代碼生成和多語言推理方面的表現進一步提升。不過,外媒的相關傳言並沒有得到deepseek公司的證實與回應。

瀋陽表示,deepseek-v3-0324的推出進一步凸顯中國ai企業在技術與成本上的競爭力。美國對華gpu出口限制可能促使中國企業加速國產硬體適配,同時其開源模式或引發西方廠商的連鎖動作,例如推出更強閉源模型。2025年可能是中美ai競爭的分水嶺。

瀋陽認為,在openai公司的gpt大模型要把通用大模型和推理大模型融合在一起的背景下,外界關注包括deepseek在內的中國頭部大模型是不是最終也會出現這種合併的趨勢。「這種可能是存在的,因為對於用戶來說,並不關心大模型在回應自身問題時用的是什麼類型的模型,更關心大模型能不能給出更為智能、合理的參考答案。」

娛樂分類資訊推薦

《親愛的仇敵》:直到陳凱西被丈夫罵,才知,羅曼算計她的真相 - 天天要聞

《親愛的仇敵》:直到陳凱西被丈夫罵,才知,羅曼算計她的真相

最近熱播的《親愛的仇敵》真的是越看越上頭。閨蜜之間的嫉妒,婚姻里的背叛,被演繹的淋漓盡致。劇中的每一個角色都如一面鏡子,映照出人性的多面和複雜。羅曼,自由撰稿人,因為吳浩劈腿的拋棄,她因禍得福完成了一部原創劇本,還火了。從此,她一直以事業為
三看《大宅門》原著才發現:大宅門裡真心幫助楊九紅的是他 - 天天要聞

三看《大宅門》原著才發現:大宅門裡真心幫助楊九紅的是他

楊九紅從濟南到了北京,沒有一天開心的,原本指望著生了孩子,能被二奶奶承認,最後不僅不被白家接納,孩子也被二奶奶抱走了……楊九紅心裡的委屈和苦楚只有她自己知道,隨著佳莉一天天長大,母女相認的希望越來越渺茫,白景琦夾在中間左右為難,他不敢忤逆母
細說2段婚姻1段熱戀!王菲愛情路為何被嘲又引贊,背後的情感 - 天天要聞

細說2段婚姻1段熱戀!王菲愛情路為何被嘲又引贊,背後的情感

家人們,誰又能預料到,謝霆鋒演唱會當晚,當鏡頭捕捉到台下安靜聆聽的王菲時,網路瞬間炸開了鍋,「他真的來了」的驚嘆如潮水般湧起。有人被這一幕觸動,感慨這是愛情最美的模樣;也有人尖酸刻薄,拿她兩段婚姻說事,質疑離過兩次婚還配談真愛。