一體機，阻礙DeepSeek性能的最大絆腳石！

2025年03月25日10:30:25 財經 4976

一體機是DeepSeek交付的最佳方式嗎？

恰恰相反，一體機是阻礙DeepSeek提升推理性能的最大絆腳石。

為啥？

只因DeepSeek這個模型有點特殊，它是個高稀疏度的MoE模型。

MoE這種混合專家模型，設計的初衷是通過「激活一堆專家中的少量專家」，來達到減少計算量、提升推理效率的目標。

舉個例子，MoE模型好比是一個超級大飯店的後廚，這個後廚里有幾百個大廚，每個大廚擅長做不同菜系川菜廚子、魯菜廚子、湘菜廚子…

這些廚子就相當於不同領域的專家。

其中有個人是廚師長，廚師長不負責炒菜，他清楚地知道每個廚師擅長做什麼菜。

這個廚師長就是MoE模型中的門控網路。

每次顧客點菜的時候，廚師長（門控網路）會根據顧客點菜的需求以及自己對廚師能力的了解，安排擅長做這些菜的廚子炒菜。

這樣，酒店的後廚就不必為每位廚師安排灶眼，只需少量灶眼（比如8個），供那些需要上崗炒菜（被激活）的廚師使用就可以了。

這就相當於MoE的原理：只激活少量專家，從而大幅降低計算量。

是不是看起來很不錯，但是有一點很重要：不參與炒菜的廚子們雖然不佔用灶眼，但是還是要擠在後廚隨時等待召喚。

也就是說，MoE模型里那些未激活專家，雖然不消耗算力，但它們的參數量仍然要佔用顯存/內存，帶來巨大的存儲開銷和調度複雜性。

回過頭來，我們再來看DeepSeek-R1/V3，是稀疏度極高的MoE模型（總參數量6710億，激活量370億）。

按照DeepSeek官方的最新披露，模型每層256個專家，只有8個被激活（V3的Transformer 層數設置為 61 層）。

好比你的飯店有60多個後廚房間，每個屋裡放256個廚師，同時只有8個廚師幹活，其他待命。

你想想，恐怕只有新東方廚師專修學院才這麼干吧。

這就意味著，你需要配置超高的一體機（大顯存、大內存），才能夠運行滿血版DeepSeek。

事實證明，目前的狀況也的確如此，市面上的「真·滿血DeepSeek一體機」價格都是100萬起，甚至要大幾百萬。

把MoE模型裝進一體機的不科學之處在於↓

我花了大錢買了一堆不能同時幹活的專家，只為他們可以減少計算量。
然而，這種一體機部署模式算力是我買斷的，難道不應該讓他們盡量都幹活，從而讓算力最大化使用嗎？
我的顯存/內存/硬碟都是為了裝下6710億參數，但實際幹活只有370億參數…

所以，我們的觀點是：

一體機其實是運行DeepSeek這種MoE模型的最差選擇，更適合運行那些非MoE的全參數激活模型。

這一點，大家如果仔細看上周DeepSeek官方在知乎披露的推理優化架構就明白了。

人家說的很清楚，要想獲得「更大的吞吐、更低的延遲」，核心就是要使用「大規模跨節點專家並行」。

你一體機就單個節點、8張卡，勉強裝下所有專家，還並行個毛線啊？

按照DeepSeek給出的官方參考推理架構（專家並行、數據並行、PD分離）：

Prefill階段：部署單元4節點（32張H800），32路專家並行和數據並行。
Decode階段：部署單元18節點（144張H800），144路專家並行和數據並行。

這就意味著，一個22節點的集群（176張卡），才能發揮出最優的推理吞吐和延遲。（讓每個專家獲得足夠的輸入，都忙活起來，而不是「占著茅坑不拉屎」）

正因為這種採用這種大規模並行架構，DeepSeek官方給出的單伺服器平均推理性能才高得離譜（輸入：73.7k tokens/s，輸出14.8k tokens/s）。

而一體機廠商們給出的性能，輸出+輸入的總和最多也不過4k tokens/s。

當然，我們並不是要否定大模型一體機，只是一體機不適合部署MoE模型，讓它跑個稠密模型，不需要大規模並行的，還是很好的。

眼下DeepSeek一體機滿天飛，更多的還是滿足客戶的情緒價值：本地化、開箱即用、專屬性……

尤其在數據隱私方面，一體機有著無與倫比的優勢，不只是合規，更能切實有效的保護數據不出域。

比如，很多通過API、WEB或APP提供DeepSeek服務的供應商，在他們的用戶協議里可能赫然寫著「…我們可能會將服務所收集的輸入及對應輸出，用於本協議下服務的優化…」。

這對於大部分企業級客戶來說，這都是無法接受的，所以本地化部署肯定是剛需，這也是目前DeepSeek一體機火爆的原因（即便性能不佳）。

其實，很多企業過去兩年自己囤過算力，此時參考DeepSeek的大規模並行架構，部署起來，相信會有不錯的效果。

而滿血版的DeepSeek一體機，企業可以量預算而行，不要硬上：

第一，蒸餾版，體積小性能好，效果差點不耽誤練手；
第二，最近新模型層出不窮，可以嘗試下非MoE架構的小體積新模型；
第三，相信不久的將來下一代DeepSeek就會發布，屆時再下手也不遲。

大模型的前方是星辰大海，但我們，才剛剛上路呢。

財經

時間定了！油價將下調，加滿一箱油或少花8元

近日，國際油價下跌，國內油價或有下行趨勢。自7月1日24時，國內油價迎本年第六次上調，多地95號汽油進入「8元」時代。據悉，新一輪油價調整窗口將於7月15日24時開啟，預計下調200元/噸，摺合每升下調約0.16元，加滿一箱油或少花8元。

07月11日 1804

地產股突然罕見爆發，釋放了什麼信號？

就在7月10日，A股三大指數集體上漲，上證指數收報3509.68點，站穩3500點關口。盤面上，房地產板塊強勢領漲。一時再次引發熱議。此次房地產板塊的爆發，或跟近期政策面釋放的積極信號直接相關。這次地產股集體爆發，最直接反應源或許來自新型城鎮化進程的表態。7月10日，據人民財訊報道稱，國家發改委城市和小城鎮改革發展中...

07月11日 5501

行業ETF風向標丨小金屬全線爆發，稀有金屬ETF半日漲幅達5%

每經記者：劉明濤每經編輯：肖芮冬在稀土永磁板塊的帶動下，整個小金屬行業今日也集體爆發。ETF市場方面，多隻稀土相關ETF漲幅超6%，連續兩日處於領漲地位。而稀有金屬ETF（562800）半日漲幅也達到5%，漲幅靠前。ETF份額變化方面，今年以來，稀有金屬相關ETF份額均出現不同程度減少。其中，稀有金屬ETF（562800）年內份額...

07月11日 5690

瑞為技術衝刺港股：年營收4億利潤829萬英特爾與賽富是股東

雷遞網雷建平 7月11日廈門瑞為信息技術股份有限公司（簡稱「瑞為技術」）日前遞交招股書，準備在港股上市。年營收3.95億利潤829萬瑞為技術是一家面向企業客戶提供視覺智能技術和產品的人工智慧公司。依託人工智慧演算法能力和光學成像技術，瑞為技術提供一系列視覺感知、視覺認知及視覺推理智能產品，並深度應用於民航、商...

07月11日 3385

幸福人壽重慶分公司開展「7.8全國保險公眾宣傳日」系列活動

今年的7月8日是第13個「全國保險公眾宣傳日」。為積極響應監管及行業協會號召，踐行「愛和責任，保險讓生活更美好」的年度主題，幸福人壽重慶分公司通過多樣化的活動形式，積極開展金融知識普及與公益服務，用實際行動詮釋了保險企業的責任擔當，彰顯了紅

07月11日 1658

網約車合規化提速，一次性註銷超6000台網約車，平台請停止給不合規車派單！

新一輪整治來了，不合規網約車，或將徹底出局。今年網約車大整頓哪裡力度最大？西安絕對能排到前列。最近一個月，再政治網約車合規問題上西安可以說是動作不斷，先是全市範圍內張貼網約車合規碼，要求所有合規網約車必須在副駕中控台、前排座椅頭枕後側及車前門外兩側等位置張貼二維碼，從7月1日開始，乘客一旦發現不合規網...

07月11日 3214

6月新能源車銷量TOP10：特斯拉止跌回暖，鴻蒙智行迎爆發期

財聯社7月11日訊（編輯沈超）在「兩新」政策及多地促消費政策持續發力的背景下，6月新能源汽車市場熱度依舊不減。自主品牌與新勢力車企持續發力，市場競爭格局加速重構。伴隨國內新能源車企半年「成績單」塵埃落定，6月新能源車企零售銷量TOP10榜單正式公布。整體市場來看，據乘聯分會發布數據顯示，6月份新能源狹義乘用車...

07月11日 1740

7月11日中午收盤，主力資金大幅流出這些個股！

序股票代碼股票名稱最新價(元)成交額換手率%當日凈流入額1601127賽力斯131.5844.80億2.24-14.5億2300476勝宏科技143.5940.19億3.29-4.85億3002640跨境通5.7424.48億30.61-4

07月11日 1647

7月11日中午收盤，這些個股迎來主力資金買入！

序股票代碼股票名稱最新價(元)成交額換手率%當日凈流入額1300059東方財富24.31152.25億4.7812.7億2600010包鋼股份2.0926.58億4.145.62億3600030中信證券29.1340.76億1.174.91

07月11日 1763

徹底瘋狂！訂單暴漲、收入翻倍，有人干到凌晨3點……

最近你參加「史詩級的外賣大戰」了嗎？在淘寶閃購、美團等平台使用大額滿減券後，幾乎能用免費的方式點到奶茶、漢堡、中式快餐等外賣，有網友面對各種奶茶的誘惑感慨：吃不動，實在吃不動了。這波突如其來的補貼源自平台對分食即時零售蛋糕的渴望，也打開了很多人點外賣的新世界：除了奶茶咖啡和美食，日用品、服裝、化妝品...

07月11日 8774