DeepSeek重磅披露:理論成本利潤率545%,每天GPU成本8.7萬美元

2025年03月01日18:52:09 科技 1477

每經編輯:張錦河

3月1日,DeepSeek在知乎上發表題為《DeepSeek-V3/R1 推理系統概覽》的文章,全面揭曉V3/R1 推理系統背後的關鍵秘密。

DeepSeek重磅披露:理論成本利潤率545%,每天GPU成本8.7萬美元 - 天天要聞

據文章介紹,DeepSeek-V3/R1推理系統的優化目標是更大的吞吐、更低的延遲。為了實現這兩個目標,DeepSeek使用了大規模跨節點專家並行(Expert Parallelism / EP)的方法,並通過一系列技術策略,最大程度地優化了大模型推理系統,實現了驚人的性能和效率。

具體而言,在更大的吞吐的方面,大規模跨節點專家並行能夠使得batch size(批尺寸)大大增加,從而提高GPU矩陣乘法的效率,提高吞吐。

batch size在深度學習中是一個非常重要的超參數,指模型在訓練過程中每次使用的數據量大小。它決定了每次模型更新時使用的訓練樣本數量,調整batch size可以影響模型的訓練速度、內存消耗以及模型權重的更新方式。

在更低的延遲方面,大規模跨節點專家並行使得專家分散在不同的GPU上,每個GPU只需要計算很少的專家(因此更少的訪存需求),從而降低延遲。

但是,由於大規模跨節點專家並行會大幅增加系統的複雜性,帶來了跨節點通信、多節點數據並行、負載均衡等挑戰,因此DeepSeek在文章中也重點論述了使用大規模跨節點專家並行增大batch size的同時,如何隱藏傳輸的耗時,如何進行負載均衡。

具體來看,DeepSeek團隊主要通過規模化跨節點專家並行、雙批次重疊策略、最優負載均衡等方式,最大化資源利用率,保證高性能和穩定性。

值得注意的是,文章還披露了DeepSeek的理論成本和利潤率等關鍵信息。據介紹,DeepSeek V3 和R1的所有服務均使用英偉達的H800 GPU,由於白天的服務負荷高,晚上的服務負荷低,DeepSeek實現了一套機制,在白天負荷高的時候,用所有節點部署推理服務。晚上負荷低的時候,減少推理節點,以用來做研究和訓練。

通過時間上的成本控制,DeepSeek表示DeepSeek V3和R1推理服務佔用節點總和,峰值佔用為278個節點,平均佔用226.75個節點(每個節點為8個H800 GPU)。假定GPU租賃成本為2美元/小時,總成本為87072美元/天;如果所有tokens全部按照DeepSeek R1的定價計算,理論上一天的總收入為562027美元/天,成本利潤率為545%。

DeepSeek重磅披露:理論成本利潤率545%,每天GPU成本8.7萬美元 - 天天要聞

不過,DeepSeek也強調,實際上的收入或許並沒有那麼多,因為V3的定價相較於R1要更低,另外夜間還會有折扣。記者注意到,2月26日,DeepSeek在其API開放平台發佈錯峰優惠活動通知。根據通知,北京時間每日00:30-08:30為錯峰時段,API調用價格大幅下調,其中DeepSeek-V3降至原價的50%,DeepSeek-R1降至25%。DeepSeek鼓勵用戶在該時段調用,享受更經濟更流暢的服務體驗。

上周五(2月21日),DeepSeek宣布連續五天開源五大軟件庫。2月25日DeepSeek選擇了先在GitHub上線,然後再在官推發佈上新通知。該公司25日宣布將DeepEP向公眾開放。在宣布後的約20分鐘內,DeepEP已在GitHub、微軟(MSFT.US)等平台上獲得超過1000個Star收藏。

DeepSeek重磅披露:理論成本利潤率545%,每天GPU成本8.7萬美元 - 天天要聞

據悉,DeepEP是MoE模型訓練和推理的ExpertParallelism通信基礎,可實現高效優化的全到全通信,以支持包括FP8在內的低精度計算,適用於現代高性能計算。DeepEP還針對從NVLink到RDMA的非對稱帶寬轉發場景進行了深度優化,不僅提供高吞吐量,還支持流式多處理器數量控制,從而在訓練和推理任務中實現高吞吐量性能。

每日經濟新聞綜合自公開信息

免責聲明:本文內容與數據僅供參考,不構成投資建議,使用前請核實。據此操作,風險自擔。

每日經濟新聞

科技分類資訊推薦

亞馬遜近千項產品均漲價三成 外國人凌晨排隊搶購中國品牌 - 天天要聞

亞馬遜近千項產品均漲價三成 外國人凌晨排隊搶購中國品牌

英國泡泡瑪特的排隊人數有幾百人。 圖源:小紅書網友 「本來購物車的東西加起來有300美元,現在變成400多美元了。」「Shein平台上,女同事一直在看的一款外套,原價23美元,現在漲價到了53美元」。近日,Temu、Shein均發佈公告稱,由於「近期全球貿易規則及關稅變動」導致運營成本上升,從4月25日開始實施價格調整。但另一...
全力服務科技創新,上海各家金融機構表態了 - 天天要聞

全力服務科技創新,上海各家金融機構表態了

4月29日,習近平總書記在上海考察時強調,上海承擔著建設國際科技創新中心的歷史使命,要搶抓機遇,以服務國家戰略為牽引,不斷增強科技創新策源功能和高端產業引領功能,加快建成具有全球影響力的科技創新高地。習近平總書記重要講話精神在上海金融界引發強烈反響,令正在奮力做好科技金融大文章的上海金融人倍感振奮、深...
突發,華為nova14這次要降維打擊! - 天天要聞

突發,華為nova14這次要降維打擊!

時間已經來到5月份了,距離上一代華為nova13系列的發佈,已經過去7個月了。按照目前華為新機的發佈排期,也輪到華為nova新機的發佈了。而且,這次華為nova14系列的硬件配置很高,據稱將要降維打擊。根據渠道消息顯示,華為已經正在準備這個
年薪3.63億元!黃仁勛,基本工資10年來首漲 - 天天要聞

年薪3.63億元!黃仁勛,基本工資10年來首漲

據新浪財經報道,根據英偉達於當地時間5月1日遞交給美國證交所(SEC)的一份新文件顯示,黃仁勛2025財年的基本年薪漲至150萬美元,較2024財年增長了49%。他的可變現金也比2024財年增加了100萬美元,增幅為50%。
哪吒汽車App被曝斷網!官網已無法訪問 - 天天要聞

哪吒汽車App被曝斷網!官網已無法訪問

5月4日,哪吒汽車再次被曝出App斷網的問題,相關話題也迅速登上抖音、微博等平台熱搜。據多位哪吒車主在社交平台發佈的消息,從5月2日開始,不少車主都遇到了哪吒汽車App斷網、App控車無法使用等問題。
360雲盤使用教程:存儲與同步文件更便捷 - 天天要聞

360雲盤使用教程:存儲與同步文件更便捷

初次使用360雲盤的用戶可能會感到困惑,不清楚如何操作。下面我來介紹其使用方法。360雲盤有多個版本,今天主要講解客戶端的使用,其他版本與此類似。掌握客戶端的用法後,其餘版本也就容易理解了。1、 首先,打開瀏覽器,在地址欄輸入360雲盤客戶端,然後進行搜索。2、 第二步,選擇下載PC版,以好搜為例,其他軟件操作類...
Win7文件夾加密軟件:保護您的隱私和重要文件 - 天天要聞

Win7文件夾加密軟件:保護您的隱私和重要文件

我的電腦長期使用Win7系統,我對其情有獨鍾。有次朋友問起,是否知道Win7文件夾加密軟件?這類軟件確實存在,今天就來為大家詳細介紹這款實用工具的功能與特點。1、 下載安裝win7文件夾加密軟件十分簡便,只需輕點一下即可開始安裝。2、 接着,我打開了軟件中的加密文件。3、 選中我們的win7文件夾即可。4、 護密軟件會彈出...
保障隱私:免費文件夾加密軟件推薦 - 天天要聞

保障隱私:免費文件夾加密軟件推薦

網上有許多免費的文件夾加密軟件,但並非都好用。這裡介紹一款實用的免費工具,值得一試。1、 讓我們下載免費的文件夾加密軟件來保護隱私。2、 安裝完成後,運行軟件並點擊加密文件夾。3、 選擇一個需要加密的文件夾,例如名為工作重要內容的文件夾。4、 為文件夾設置密碼後,採用閃電加密方式保護。5、 軟件開始快速加密,...