4月24日,深度求索公司正式上線並開源DeepSeek-V4預覽版,這個從春節一直預期到現在終於落地了。
據DeepSeek官方介紹,DeepSeek-V4擁有百萬字超長上下文,在Agent能力、世界知識和推理性能上均實現國內與開源領域的領先。這一次官方一共更新了兩個版本,相比於傳統方法大幅降低了對計算和顯存的需求。其1.6萬億參數,只用了同業大概四分之一的GPU,以及10%的存儲。
此前OpenAI和Google早就支持超長上下文了,問題是Token成本比較高。同樣的Deepseek-V4目前兩個版本其中pro的價格確實略高,但也僅有國外主流模型的五分之一,flash版本則是1/30至1/60。而且按官方的說法,這是受限於高端算力緊缺,還明確提到預計下半年價格會大幅下調,意思華為卡交付上來後還可以更便宜。
那為啥這次Deepseek V4更新這麼受關注?
這就不得不說AI當前的王者英偉達了。4月15日黃仁勛接受播客專訪時,說了一句分量很重的話:“如果DeepSeek先在華為平台上發布,那對我們國家來說將是災難性的。
要知道英偉達真正的護城河從來不是GPU本身的算力,而是CUDA作為“事實標準”的軟件生態位。過去近二十年里,幾乎所有主流AI框架、算子庫、開源模型的首發優化,都把CUDA作為默認起點,要想換賽道沒那麼容易,可以說CUDA在AI界的地位就相當於電腦界的windows。
實際邏輯很簡單,只要新模型先在CUDA上調通跑順,那麼哪怕華為、谷歌TPU、AMD MI300在紙面上單卡性能不差,它們在客戶那裡也只能是“備選方案”。因為遷移意味着重寫算子、重做精度校準、重新調參,工程代價可能以月計。“事實標準”的地位一旦建立,就會自我強化。
但這次DeepSeek-V4在芯片選擇上做出了一個非常具有戰略意義的決定:它在推理部署方面主要使用了華為的昇騰系列國產芯片,並全面轉向華為的CANN架構。這次昇騰950通過融合kernel和多流並行技術降低Attention計算和訪存開銷,大幅提升推理性能。這意味着出現了一條真實、可運行、被頂級模型驗證過的非CUDA路徑,並且這條路徑上會沉澱下一批熟練的工程師、一套可複製的優化經驗、以及第一批用戶信心,這就打破了英偉達CUDA的護城河。
去年Deepseek-V3發布中國能做好大模型,這一次V4是要證明的是中國能在自己的硬件上做好模型。當然,由於模型剛發布,很多測試估計會在周末進行,這方面咱也不是專業,下周可以看看反饋情況。
回到市場,今天指數下探能拉回來,Deepseek-V4的發布也是功不可沒,因為國產芯片替代這塊能驗證了,新版本發布後科創50直接拉起來,國產算力相關的走強,抵消了部分由於CPO二哥業績利空帶來的負面影響,但由於相關發布會在晚上,所以資金還是出現了分歧,不少相關個股也是沖高回落。板塊能否發酵,還是要看周末相關消息的反饋。
今天盤面另一個值得注意的就是CPO二哥成交額超500億,超越中芯國際創下的480億元紀錄,成為科技股成交王,榮登A股歷史第四位。我翻了一下此前創紀錄的個股,這前後基本都是當時的頂部了。今天跌幅和成交體現出市場分歧還是很大,主要是公司一季度業績低於預期,營收環比持平利潤下滑,而作為對比中際來說營收凈利潤雙增。公司方面解釋是說匯兌損失5億,你把這塊算回去不就符合預期了,反正就原諒唄?我是覺得這階段CPO方向謹慎點吧,你看看液冷那個龍頭,前兩天衝進去的現在啥樣了。
下周還有3000多家公司業績待拆,這裡面類似的公司絕對不會少,小心別踩坑,所以之前我就說盡量做一些之前預期比較少,或者已經出業績且趨勢比較好的方向,這幾天鋰電和化工的強勢已經驗證了我的觀點了。
今天指數跌穿5日線也就是本輪上漲趨勢,市場確定進入震蕩期,短線風格轉為輪動,另外下周只有4個交易日,然後就到五一小長假了,資金也會趨于謹慎,所以指數層面別期待太高。而過了5月假期回來,由於業績真空期,資金大概會重回抱團和新題材炒作,盡量去看一下業績超預期的方向,等待市場主線確定,那時候會有一些新機會再跟隨也不遲。