GPT-5.5的餘溫還未散去,大洋彼岸的「鯨魚」就帶着一身絕技躍出水面。4月24日,蟄伏15個月的DeepSeek毫無預兆地甩出了V4系列大模型。1.6萬億參數的Pro版硬剛頂級閉源,130億激活的Flash版主打極速經濟,消息一出,海外社區瞬間炸鍋,「鯨魚回來了」「便宜又強大」的驚呼聲刷屏評論區,更有技術黨直呼「這太震撼了,如果那些效率突破成立的話」。

性能上的狂飆是這代模型最直接的底牌。V4-Pro在智能體編程上直接超越了Anthropic的Sonnet 4.5,在世界知識和數理邏輯競賽中把一眾開源對手按在地上摩擦,甚至能在基準測試里和OpenAI的GPT-5.2、谷歌Gemini-3.0-Pro掰掰手腕。而V4-Flash看似輕量,但在簡單任務上與Pro版平分秋色。這種「高低搭配」不僅展現了技術縱深,更暴露出DeepSeek精準卡位不同應用場景的野心。
支撐起這套組合拳的,是徹底重構的底層魔法。在長達58頁的技術論文中,DeepSeek拋出了在token維度進行壓縮的DSA稀疏注意力機制。這套略顯激進的架構不僅讓百萬字超長上下文成了全系標配,還把傳統長文本拉滿顯存的痛點給治了。配合流形約束超連接和Muon優化器,這頭巨獸在信號傳播和訓練收斂上實現了質的飛躍,直接把長周期多輪智能體任務的門檻踩在了腳下。

然而,最能點燃國內開發者情緒的永遠是賬單。V4-Pro每百萬tokens輸入僅需1元、輸出12元,Flash版更是把輸入打到了0.2元。看到這份定價,大批網友感慨「太普惠了,還是那個DeepSeek」。在算力即權力的時代,這種骨折價無異於對整個API市場進行降維打擊。但有趣的是,這次極致性價比背後多了一個關鍵註腳——華為昇騰。官方坦言受限於高端算力目前Pro版吞吐有限,等下半年昇騰950超節點批量上市後價格還將跳水,國產算力生態正從「可用」向「好用」完成關鍵躍遷。
看似無堅不摧的攻勢下,其實也藏着隱秘的軟肋。V4-Pro的極限思考能力仍落後前沿閉源模型3到6個月,複雜指令和極端摘要仍有瑕疵,而最讓外界揪心的是多模態能力的缺失。就在發佈前夕,這家一直標榜獨立性的公司罕見傳出以超100億美元估值啟動外部融資的消息。算力饑渴與人才防守,正逼迫DeepSeek做出戰略轉向。

從驚艷四座到走向AGI,從來不是一場僅靠技術偏執就能贏的無限遊戲。DeepSeek-V4用開源和低價撕開了壟斷的口子,但也把算力與資金的現實考卷擺在了檯面上。當國產大模型開始在底層架構上與巨頭近身肉搏,你認為DeepSeek引入資本並擁抱昇騰,會成為它登頂的加速器,還是打破初心的雙刃劍?