英偉達GPU調研紀要:芯片供需情況,液冷及相關技術進展

2025年05月03日18:43:05 科技 1026

GPU 需求、供應與產品迭代

1.B200/GB200

需求旺盛,但產能爬坡緩慢: 主要瓶頸在於NVLink的安裝環節,而非GPU封裝或模組板/液冷技術。模組板已發給合作夥伴,但安裝調試流程複雜,導致交付速度慢。

交付模式: 部分客戶直接採購HGX B200八卡基板(確認收入周期較短,預計到2025年1月底發出約2萬模組,相當於十幾萬張B200卡)。

定價差異: Nvidia原廠HGX整機約45萬美元(含質保服務),合作夥伴(如戴爾)定製整機通常30萬美元以上,差價約30%。

GB200 vs GB300 架構差異: GB200是焊接在基板上,GPU和Grace CPU無法獨立替換。GB300採用模塊化設計,類似OEM插槽板,CPU/GPU可獨立替換。GB300升級為CX8的800G網絡,採用22層高密度PCB替代GB200的複雜線纜設計。性能提升:FP4算力+50%,顯存容量+50%,顯存總帶寬+約10%。

英偉達GPU調研紀要:芯片供需情況,液冷及相關技術進展 - 天天要聞

2.B300

封裝: 使用CoWoS-S封裝(不同於B200/GB200的L封裝,與Hopper類似)。

量產時間: 預計最早8月底後才能逐漸上量,不會很快。原因在於B200遇到的問題(特別是NVLink安裝)B300也會遇到,且CX8交換板的PCB設計非常複雜,調試需要時間。

產能預期(B系列): 基於CoWoS-L產能,預計B系列年產能可達300萬張B卡(約600萬die)。

定價: 預計比GB200整體模組上漲20%以上,主要因顯存增加50%。

英偉達GPU調研紀要:芯片供需情況,液冷及相關技術進展 - 天天要聞

3.H100/H200/H20

產品切換: H100已全面停產,目前生產切換至H200。

H20:交付: Q1已確認大部分訂單,交付周期12-16周,4月底後收入確認比例高。

中國市場: H20是針對中國市場的主力產品,不會停產。因應對MoE模型(pre-fill需要算力,decoding更依賴顯存帶寬),H20仍有需求。

國內採購: 2025年Q1國內市場確認訂單超70萬張,騰訊約35萬,阿里約20萬,位元組跳動去年已大量採購。H20被認為是當前性價比高且最實用的選擇。

定價: 舉例,從96g HBM升級到141g HBM,單價從12,000美元漲至14,000-15,000美元。

H200/北美需求: B系列(NVL72)在北美CSP中緩慢上量,導致對H200需求猶豫不決。但NVL72被視為最具性價比方案,預計Q2後上量會加快,可能影響H200訂單。

英偉達GPU調研紀要:芯片供需情況,液冷及相關技術進展 - 天天要聞

02

主要客戶與部署情況

NVL72 最大客戶: CoreWeave 和 微軟

CoreWeave: 主要部署在美國東部麻省,3個數據中心總容量12萬多卡(1500個機架),近期安裝已加速,應已完成安裝150個機架。供應商包括Dell緯創Vertiv安費諾等。

微軟: 已安裝至少120個機架,預計全年需求達15,000個機架。鳳凰城數據中心規模最大(含1,500機架,對應11萬多張卡)。加州項目約1,100-1,200機架(對應8.5萬多張卡)。安裝合作方包括富士康、Vertiv、安費諾、英偉達團隊。

谷歌、AWSMeta (2025年計劃):需求明確,但計劃靠後一些。明確計劃採購5,000台機架。

上半年主要以NVL36為主(亞馬遜用廣達,Meta用廣達與緯創合作)。NVL36部分採用風冷,交換機用液冷,整體安裝難度較低。

目前三家在實驗室階段已完成20-30個試驗性機架部署,4-5月間逐步擴展到400-500台。

03

相關技術與生態

CoWoS 產能: 是B系列GPU供應的關鍵因素之一。

Dynamo 軟件框架:Nvidia英偉達開源的推理框架,用於大規模分佈式模型(特別是MoE)推理。

背景:應對DeepSeek等使用大量GPU(如320張卡、40台8卡服務器)並行推理的需求。

應用:適用於微信等日訪問量千億級的平台。單台H20機器做推理吞吐量低(支持32客戶,每秒15 token/客戶),但擴展到40台機器可支持2000用戶並發,每秒20-25 token/客戶。

部署估算:應對每天調用量達10億次的業務場景,約需20萬張H20。

網絡技術 (Nvidia/Mellanox):現狀: 通過收購Mellanox進入網絡領域,產品涵蓋網卡、交換機、光模塊等,支持NVLink。業務增長迅速,但面臨BroadcomMarvell等競爭,在以太網領域未形成絕對主導。

配置推薦: Nvidia推薦CX8作為GB300的標準配置,但非強制。客戶(如AWS用自家網卡,Google/Meta選CX7)會根據自身需求選擇ODM和網絡配置。

服務器組網成本: Scale up(機架內互聯,如NVL72用NVLink)成本占服務器總成本30%以上;Scale out(機架間互聯)用IB(如Quantum)或以太網(如Spectrum-X)。

Quantum (IB): 144口800G產品8月預計量產,但主要上量在明年。全球單組網超4萬張的大客戶可能不超過5家。

CPO (Co-Packaged Optics):Nvidia 進展: 涉及11家關鍵供應商(如Coherent提供PIC中的MMA微透鏡,Lumentum提供激光發射器,台積電/矽品負責封裝等)。

競爭與挑戰: Broadcom起步早,但Nvidia正追趕。早期穩定性問題(前液冷技術和封裝良率)通過供應商技術提升和液冷應用推廣得到改善。

量產預期: 明年是CPO上量的重要年份。Nvidia今年上半年仍在試產(僅3-4個客戶),但明年預計會翻10倍以上,年預計千台起,明年至少1萬多台。

04

總結

Nvidia在新一代GPU(B系列/GB系列)上面臨旺盛需求和複雜的生產/安裝瓶頸,特別是NVLink和先進封裝。H20在中國市場需求強勁。客戶部署規模巨大(CoreWeave, 微軟),其他雲巨頭也在積極規劃。網絡技術(NVLink, IB, CPO)是關鍵配套,Nvidia在此領域持續投入並追趕競爭對手。Dynamo軟件框架旨在配合硬件解決大模型推理挑戰。整體看,AI硬件市場持續高速發展,但也伴隨着供應鏈、技術和部署上的挑戰。

科技分類資訊推薦

5月又一款新機官宣:5月8日,正式發佈 - 天天要聞

5月又一款新機官宣:5月8日,正式發佈

隨着新機市場不斷更新,今年所發佈的新機大部分圍繞着影像和遊戲方面,並且湧現出不少核心技術,主要是提升定向性能。影像核心有影像系統、影像芯片、AI影像功能等,而遊戲同樣推出遊戲芯片、性能引擎、獨顯芯片等,向著專業級別發展,提升新機競爭力。
守護袁昆:企業互聯網營銷推廣有什麼絕招? - 天天要聞

守護袁昆:企業互聯網營銷推廣有什麼絕招?

(文/守護袁昆)經常有朋友問到互聯網營銷推廣有什麼絕招,現在做互聯網營銷有什麼新技巧和新渠道。每次遇到這樣的問題,解釋的太多最後得到一個反饋結果:有絕招不願意公開。互聯網營銷推廣有技巧和方法嗎?這是肯定的。互聯網營銷推廣有絕招嗎?什麼才算絕
假期 我選擇在家當「賽博熊貓飼養員」 - 天天要聞

假期 我選擇在家當「賽博熊貓飼養員」

五一朋友圈攝影大賽已經開賽,本「前參賽選手」選擇提前退賽。與其去景區表演「人類遷徙」,不如宅家干點別的。玩手機、打遊戲、看電影?格局打開,我選擇在家當「賽博熊貓飼養員」。宅家往沙發上一躺,身邊還有隻圓滾滾的電子熊貓24小時待命,治癒值直接拉
這個五一,用長虹熊貓AI TV rua熊貓可太香了! - 天天要聞

這個五一,用長虹熊貓AI TV rua熊貓可太香了!

五一正確的打開方式:在家沉浸式吸熊貓,這可太香了!長虹電視不久前發佈了新品長虹熊貓AI TV,本熊貓愛好者正好想買新電視,美美下單。沒想到,五一派上了大用場。不得不說,長虹真可以,我願稱它為「沉浸式熊貓周邊」。
小米又一款頂配Ultra終於來了,有點刺激啊 - 天天要聞

小米又一款頂配Ultra終於來了,有點刺激啊

最近機哥經常聊到,下半年會出很多旗艦小平板。 9 英寸不到可以一手掌握的大小,對於遊戲黨來說,確實比常規大屏舒服太多。 但有的機友覺得,小平板看視頻不得勁,問機哥有沒有更大更猛的....
懷化電信:五一「不打烊」  服務「不斷線」 - 天天要聞

懷化電信:五一「不打烊」 服務「不斷線」

(五一期間,中國電信懷化分公司做好值守工作,持續為廣大客戶服務,保障業務受理與雲網通信正常運營。)懷化日報全媒體訊五一期間,中國電信懷化分公司秉持「用戶至上,用心服務」理念,堅守在通信保障一線。