V4杀疯了!价格屠夫掀翻桌

GPT-5.5的余温还未散去,大洋彼岸的“鲸鱼”就带着一身绝技跃出水面。4月24日,蛰伏15个月的DeepSeek毫无预兆地甩出了V4系列大模型。1.6万亿参数的Pro版硬刚顶级闭源,130亿激活的Flash版主打极速经济,消息一出,海外社区瞬间炸锅,“鲸鱼回来了”“便宜又强大”的惊呼声刷屏评论区,更有技术党直呼“这太震撼了,如果那些效率突破成立的话”。

性能上的狂飙是这代模型最直接的底牌。V4-Pro在智能体编程上直接超越了Anthropic的Sonnet 4.5,在世界知识和数理逻辑竞赛中把一众开源对手按在地上摩擦,甚至能在基准测试里和OpenAI的GPT-5.2、谷歌Gemini-3.0-Pro掰掰手腕。而V4-Flash看似轻量,但在简单任务上与Pro版平分秋色。这种“高低搭配”不仅展现了技术纵深,更暴露出DeepSeek精准卡位不同应用场景的野心。

支撑起这套组合拳的,是彻底重构的底层魔法。在长达58页的技术论文中,DeepSeek抛出了在token维度进行压缩的DSA稀疏注意力机制。这套略显激进的架构不仅让百万字超长上下文成了全系标配,还把传统长文本拉满显存的痛点给治了。配合流形约束超连接和Muon优化器,这头巨兽在信号传播和训练收敛上实现了质的飞跃,直接把长周期多轮智能体任务的门槛踩在了脚下。

然而,最能点燃国内开发者情绪的永远是账单。V4-Pro每百万tokens输入仅需1元、输出12元,Flash版更是把输入打到了0.2元。看到这份定价,大批网友感慨“太普惠了,还是那个DeepSeek”。在算力即权力的时代,这种骨折价无异于对整个API市场进行降维打击。但有趣的是,这次极致性价比背后多了一个关键注脚——华为升腾。官方坦言受限于高端算力目前Pro版吞吐有限,等下半年升腾950超节点批量上市后价格还将跳水,国产算力生态正从“可用”向“好用”完成关键跃迁。

看似无坚不摧的攻势下,其实也藏着隐秘的软肋。V4-Pro的极限思考能力仍落后前沿闭源模型3到6个月,复杂指令和极端摘要仍有瑕疵,而最让外界揪心的是多模态能力的缺失。就在发布前夕,这家一直标榜独立性的公司罕见传出以超100亿美元估值启动外部融资的消息。算力饥渴与人才防守,正逼迫DeepSeek做出战略转向。

从惊艳四座到走向AGI,从来不是一场仅靠技术偏执就能赢的无限游戏。DeepSeek-V4用开源和低价撕开了垄断的口子,但也把算力与资金的现实考卷摆在了台面上。当国产大模型开始在底层架构上与巨头近身肉搏,你认为DeepSeek引入资本并拥抱升腾,会成为它登顶的加速器,还是打破初心的双刃剑?