4月24日,深度求索公司正式上线并开源DeepSeek-V4预览版,这个从春节一直预期到现在终于落地了。

据DeepSeek官方介绍,DeepSeek-V4拥有百万字超长上下文,在Agent能力、世界知识和推理性能上均实现国内与开源领域的领先。这一次官方一共更新了两个版本,相比于传统方法大幅降低了对计算和显存的需求。其1.6万亿参数,只用了同业大概四分之一的GPU,以及10%的存储。

此前OpenAI和Google早就支持超长上下文了,问题是Token成本比较高。同样的Deepseek-V4目前两个版本其中pro的价格确实略高,但也仅有国外主流模型的五分之一,flash版本则是1/30至1/60。而且按官方的说法,这是受限于高端算力紧缺,还明确提到预计下半年价格会大幅下调,意思华为卡交付上来后还可以更便宜。
那为啥这次Deepseek V4更新这么受关注?
这就不得不说AI当前的王者英伟达了。4月15日黄仁勋接受播客专访时,说了一句分量很重的话:“如果DeepSeek先在华为平台上发布,那对我们国家来说将是灾难性的。
要知道英伟达真正的护城河从来不是GPU本身的算力,而是CUDA作为“事实标准”的软件生态位。过去近二十年里,几乎所有主流AI框架、算子库、开源模型的首发优化,都把CUDA作为默认起点,要想换赛道没那么容易,可以说CUDA在AI界的地位就相当于电脑界的windows。
实际逻辑很简单,只要新模型先在CUDA上调通跑顺,那么哪怕华为、谷歌TPU、AMD MI300在纸面上单卡性能不差,它们在客户那里也只能是“备选方案”。因为迁移意味着重写算子、重做精度校准、重新调参,工程代价可能以月计。“事实标准”的地位一旦建立,就会自我强化。
但这次DeepSeek-V4在芯片选择上做出了一个非常具有战略意义的决定:它在推理部署方面主要使用了华为的升腾系列国产芯片,并全面转向华为的CANN架构。这次升腾950通过融合kernel和多流并行技术降低Attention计算和访存开销,大幅提升推理性能。这意味着出现了一条真实、可运行、被顶级模型验证过的非CUDA路径,并且这条路径上会沉淀下一批熟练的工程师、一套可复制的优化经验、以及第一批用户信心,这就打破了英伟达CUDA的护城河。
去年Deepseek-V3发布中国能做好大模型,这一次V4是要证明的是中国能在自己的硬件上做好模型。当然,由于模型刚发布,很多测试估计会在周末进行,这方面咱也不是专业,下周可以看看反馈情况。

回到市场,今天指数下探能拉回来,Deepseek-V4的发布也是功不可没,因为国产芯片替代这块能验证了,新版本发布后科创50直接拉起来,国产算力相关的走强,抵消了部分由于CPO二哥业绩利空带来的负面影响,但由于相关发布会在晚上,所以资金还是出现了分歧,不少相关个股也是冲高回落。板块能否发酵,还是要看周末相关消息的反馈。

今天盘面另一个值得注意的就是CPO二哥成交额超500亿,超越中芯国际创下的480亿元纪录,成为科技股成交王,荣登A股历史第四位。我翻了一下此前创纪录的个股,这前后基本都是当时的顶部了。今天跌幅和成交体现出市场分歧还是很大,主要是公司一季度业绩低于预期,营收环比持平利润下滑,而作为对比中际来说营收净利润双增。公司方面解释是说汇兑损失5亿,你把这块算回去不就符合预期了,反正就原谅呗?我是觉得这阶段CPO方向谨慎点吧,你看看液冷那个龙头,前两天冲进去的现在啥样了。
下周还有3000多家公司业绩待拆,这里面类似的公司绝对不会少,小心别踩坑,所以之前我就说尽量做一些之前预期比较少,或者已经出业绩且趋势比较好的方向,这几天锂电和化工的强势已经验证了我的观点了。
今天指数跌穿5日线也就是本轮上涨趋势,市场确定进入震荡期,短线风格转为轮动,另外下周只有4个交易日,然后就到五一小长假了,资金也会趋于谨慎,所以指数层面别期待太高。而过了5月假期回来,由于业绩真空期,资金大概会重回抱团和新题材炒作,尽量去看一下业绩超预期的方向,等待市场主线确定,那时候会有一些新机会再跟随也不迟。