DeepSeek-V4发布意味着什么？

2026年04月24日20:43:10 科技 1173

4月24日，深度求索公司正式上线并开源DeepSeek-V4预览版，这个从春节一直预期到现在终于落地了。

据DeepSeek官方介绍，DeepSeek-V4拥有百万字超长上下文，在Agent能力、世界知识和推理性能上均实现国内与开源领域的领先。这一次官方一共更新了两个版本，相比于传统方法大幅降低了对计算和显存的需求。其1.6万亿参数，只用了同业大概四分之一的GPU，以及10%的存储。

此前OpenAI和Google早就支持超长上下文了，问题是Token成本比较高。同样的Deepseek-V4目前两个版本其中pro的价格确实略高，但也仅有国外主流模型的五分之一，flash版本则是1/30至1/60。而且按官方的说法，这是受限于高端算力紧缺，还明确提到预计下半年价格会大幅下调，意思华为卡交付上来后还可以更便宜。

那为啥这次Deepseek V4更新这么受关注？

这就不得不说AI当前的王者英伟达了。4月15日黄仁勋接受播客专访时，说了一句分量很重的话：“如果DeepSeek先在华为平台上发布，那对我们国家来说将是灾难性的。

要知道英伟达真正的护城河从来不是GPU本身的算力，而是CUDA作为“事实标准”的软件生态位。过去近二十年里，几乎所有主流AI框架、算子库、开源模型的首发优化，都把CUDA作为默认起点，要想换赛道没那么容易，可以说CUDA在AI界的地位就相当于电脑界的windows。

实际逻辑很简单，只要新模型先在CUDA上调通跑顺，那么哪怕华为、谷歌TPU、AMD MI300在纸面上单卡性能不差，它们在客户那里也只能是“备选方案”。因为迁移意味着重写算子、重做精度校准、重新调参，工程代价可能以月计。“事实标准”的地位一旦建立，就会自我强化。

但这次DeepSeek-V4在芯片选择上做出了一个非常具有战略意义的决定：它在推理部署方面主要使用了华为的升腾系列国产芯片，并全面转向华为的CANN架构。这次升腾950通过融合kernel和多流并行技术降低Attention计算和访存开销，大幅提升推理性能。这意味着出现了一条真实、可运行、被顶级模型验证过的非CUDA路径，并且这条路径上会沉淀下一批熟练的工程师、一套可复制的优化经验、以及第一批用户信心，这就打破了英伟达CUDA的护城河。

去年Deepseek-V3发布中国能做好大模型，这一次V4是要证明的是中国能在自己的硬件上做好模型。当然，由于模型刚发布，很多测试估计会在周末进行，这方面咱也不是专业，下周可以看看反馈情况。

回到市场，今天指数下探能拉回来，Deepseek-V4的发布也是功不可没，因为国产芯片替代这块能验证了，新版本发布后科创50直接拉起来，国产算力相关的走强，抵消了部分由于CPO二哥业绩利空带来的负面影响，但由于相关发布会在晚上，所以资金还是出现了分歧，不少相关个股也是冲高回落。板块能否发酵，还是要看周末相关消息的反馈。

今天盘面另一个值得注意的就是CPO二哥成交额超500亿，超越中芯国际创下的480亿元纪录，成为科技股成交王，荣登A股历史第四位。我翻了一下此前创纪录的个股，这前后基本都是当时的顶部了。今天跌幅和成交体现出市场分歧还是很大，主要是公司一季度业绩低于预期，营收环比持平利润下滑，而作为对比中际来说营收净利润双增。公司方面解释是说汇兑损失5亿，你把这块算回去不就符合预期了，反正就原谅呗？我是觉得这阶段CPO方向谨慎点吧，你看看液冷那个龙头，前两天冲进去的现在啥样了。

下周还有3000多家公司业绩待拆，这里面类似的公司绝对不会少，小心别踩坑，所以之前我就说尽量做一些之前预期比较少，或者已经出业绩且趋势比较好的方向，这几天锂电和化工的强势已经验证了我的观点了。

今天指数跌穿5日线也就是本轮上涨趋势，市场确定进入震荡期，短线风格转为轮动，另外下周只有4个交易日，然后就到五一小长假了，资金也会趋于谨慎，所以指数层面别期待太高。而过了5月假期回来，由于业绩真空期，资金大概会重回抱团和新题材炒作，尽量去看一下业绩超预期的方向，等待市场主线确定，那时候会有一些新机会再跟随也不迟。