梁文鋒署名，DeepSeek再發論文

2025年05月17日12:42:09 科技 1421

近日

DeepSeek團隊發表新論文

論文以DeepSeek-V3為核心案例

披露其在AI硬體架構

與模型設計方面的關鍵創新

為實現具有成本效益的

大規模訓練和推理提供思路

論文顯示

DeepSeek創始人兼CEO梁文鋒

也是參與者之一

DeepSeek論文《深入解讀 DeepSeek-V3：AI 架構的擴展挑戰與硬體思考》

圖源：論文截圖

有業內人士表示

該論文聚焦「硬體-模型」

協同創新底層邏輯

直擊當前大模型訓練

與推理的效率痛點

一起來看↓

揭秘DeepSeek模型設計原則

在訓練大模型這條路上

可以說一直有「三大難題」

內存不夠用

計算效率低

通信速度慢

而這篇論文所要解決的

正是上述的這些問題

與此前發布的V3技術報告不同

這篇論文詳細闡述了DeepSeek

如何做到在硬體資源的「緊箍咒」下

通過精妙的「軟硬一體」協同設計

將成本效益這筆賬算好

DeepSeek在論文中提到

本文的目的不是重申

DeepSeek-V3的詳細架構和演算法細節

是跨越硬體架構和模型設計

採用雙重視角來探索它們之間

錯綜複雜的相互作用

以實現具有成本效益的

大規模訓練和推理

DeepSeek-V3的基本架構

圖源：論文截圖

具體而言

論文聚焦內存效率、成本控制、

推理速度等方面展開說明

DeepSeek模型設計原則

在內存效率方面

多頭潛在注意力（MLA）技術

通過壓縮鍵值（KV）緩存

緩存顯著降低了內存消耗

FP8混合精度訓練技術

將內存消耗顯著降低了一半

從數據來看

相比其他模型

（如LLaMA-3、Qwen-2.5）

DeepSeek-V3的KV緩存大小

每token僅需70 KB

是傳統方法的1/7到1/4

大幅降低顯存壓力

尤其適合長文本處理

在成本控制方面

DeepSeek開發了DeepSeek MoE架構

其兩大優勢包括降低訓練成本

和利於個人使用和本地部署

在提高推理速度方面

DeepSeek-V3採用的是

多token預測（MTP）的方法

傳統模型每次只能生成1個token

而MTP通過輕量級子模型並行

預測多個候選token

驗證後選擇最優結果。

實驗效果顯示

生成速度提升1.8倍

OpenAI聯合創始人

Andrej Karpathy此前讚歎

「DeepSeek-V3的出現

實現了高性能與低成本的平衡

未來或許不需要

超大規模的GPU集群了」

六大關鍵探索未來AI基礎設施

下一代AI基礎設施

將如何升級？

DeepSeek從硬體架構的角度

提出六大方向

涉及內存、互連、網路、

計算等核心領域

圖源：虎嗅

整體來看，包括

「魯棒性優先：

構建不易崩潰的訓練系統」

「顛覆互連架構：

CPU-GPU直連消除節點瓶頸」

「智能網路升級：

動態路由實現低延遲」

「通信順序『硬體化』：

消除軟體額外開銷」

「網路計算融合：

硬體加速通信效率」

「內存架構重構：

從『晶元堆疊』到『晶圓集成』」

這些專業名詞

非行家乍一看有些難懂

有業內人士「翻譯」稱

就是下一代AI硬體要向

算數快（低精度計算+本地細粒度量化）

傳話快（直連網路+智能路由）

記性好（3D內存+近存計算）

不宕機（自愈網路）的方向改進

才能更好地應用於大模型訓練

實現高效擴展

圖源：網路

DeepSeek表示

這些內存中心的架構創新

旨在打破當前內存發展

滯後於模型規模擴張的瓶頸

是下一代AI系統持續邁向

「更大、更快、更穩」的關鍵路徑之一

同時這些方案也在DeepSeek-V3

訓練與推理實踐中均取得了實效

為下一代高性能AI系統

構建了堅實的內存支撐基礎

科技

從聊天機器人到協作夥伴：AI智能體如何重塑企業工作

Scott White至今仍對人工智慧從新奇技術轉變為真正工作夥伴的速度感到驚嘆。僅僅一年多前，這位Anthropic公司Claude AI產品負責人目睹了早期AI編程工具甚至無法完成一行代碼的窘境。如今，儘管並非專業程序員，他卻能親自構建

07月01日 1078

小米 16 系列迎最新爆料，Pro 系列鏡頭模組大改，橫向延伸全尺寸設計

近日，包括數碼閑聊站在內等多個消息源，就下一代旗艦新機紛紛進行了最新爆料，其中小米 16 系列也在近日迎來了最新消息。根據最新爆料來看，小米 16 系列將會在以往的標準版、Pro 版、Ultra 的基礎上新增一款 Pro Max 型號。但一一對應來看，新款的小米 16 Pro 即對標標準版 , 為大家熟悉的 6.3 英寸小尺寸旗艦機型。而 1...

07月01日 6874

魅族 22 系列手機本月到來，提供全新開模小尺寸旗艦版本

伴隨著時間來到 7 月，各大手機廠商的新機更新計劃有所放緩，不過根據多方爆料來看，「小廠代表」星紀魅族旗下的魅族 22 系列將會在本月與大家見面。目前魅族 22 系列仍然十分「神秘」，欠缺主要的配置爆料與外觀圖片作為參考。但根據部分什麼爆料者的消息來看，魅族 22 系列將會全新開模，並提供小尺寸旗艦版本可供選擇...

07月01日 2203

vivo X300 Pro 更多細節曝光，大 R 角直面屏，新款大底主攝方案加持

今天數碼博主數碼閑聊站在與網友互動中，透露了一款搭載聯發科天璣 9500 的「大杯」工程機的最新進展。參考爆料內容與評論區互動來看，預計為 vivo X300 Pro。除搭載聯發科天璣 9500 外，據悉該機一大變化之處在於屏幕部分，根據最新消息來看將會搭載一塊大 R 角直屏，不再採用曲面屏或微曲面屏設計。而這也將成為下一代...

07月01日 4059

35mm之眼重構皇城美學：努比亞Z70S Ultra攝影師版瀋陽故宮實戰錄

35mm之眼重構皇城美學：努比亞Z70S Ultra攝影師版瀋陽故宮實戰錄，最近一直在玩努比亞Z70S Ultra攝影師版，這次不扯其他的，只單純的聊一下影像、拍攝和實際使用體驗，看看這款機器，到底好在哪？又有哪些需要提高和改進的呢？

07月01日 1433

數據驅動，柔性智能建造平台助力高效管理

長沙晚報掌上長沙7月1日訊（全媒體記者劉嘉）6月30日，由長沙市智能建造產業鏈推進辦公室與中建五局三公司聯合承辦的「創新驅動智建未來」科技活動舉行。該活動不僅展示了長沙在智能建造領域的創新成果，也為行業高質量發展提供了可複製的實踐經驗。

07月01日 1302

IPO研究 | 全球3D列印在航空航天和國防市場的價值預計2030年將達86.6億美元

瑞財經王敏 6月30日，杭州易加三維增材技術股份有限公司（以下簡稱「易加增材」）科創板IPO獲受理，保薦機構為中信證券，保薦代表人為董超、余啟東，會計師事務所為天健。

07月01日 1450

6月交付情況匯總，零跑領跑，小米下滑，小鵬保持高位！

7月1日，各大車企交出了2025年6月份交付量的成績單，新的排名也隨之出爐。在這裡劃一下重點：零跑汽車6月交付48,006台，創歷史新高；小鵬汽車6月共交付新車34,611台，同比增長224%，連續....

07月01日 3915

以前不敢想，機械革命搭配出4959元的RTX5050本，還有2.5K屏

最近RTX5050本開始大面積登場，很多消費者也想知道，廠商到底能搭配出什麼樣配置？結果機械革命沒有讓大家失望，搭配出一個6199元的新品，補貼後價格4959元，再一次刷新新顯卡筆記本的價格新低。同時，其配置還不是很潦草，還是很平衡的，讓我們來看看。這款本配置了R9 7845HX處理器，12核心，24線程，台積電5nm工藝，Zen4...

07月01日 8567