GPU 需求、供應與產品迭代
1.B200/GB200
需求旺盛,但產能爬坡緩慢: 主要瓶頸在於NVLink的安裝環節,而非GPU封裝或模組板/液冷技術。模組板已發給合作夥伴,但安裝調試流程複雜,導致交付速度慢。
交付模式: 部分客戶直接採購HGX B200八卡基板(確認收入周期較短,預計到2025年1月底發出約2萬模組,相當於十幾萬張B200卡)。
定價差異: Nvidia原廠HGX整機約45萬美元(含質保服務),合作夥伴(如戴爾)定製整機通常30萬美元以上,差價約30%。
GB200 vs GB300 架構差異: GB200是焊接在基板上,GPU和Grace CPU無法獨立替換。GB300採用模塊化設計,類似OEM插槽板,CPU/GPU可獨立替換。GB300升級為CX8的800G網路,採用22層高密度PCB替代GB200的複雜線纜設計。性能提升:FP4算力+50%,顯存容量+50%,顯存總帶寬+約10%。
2.B300
封裝: 使用CoWoS-S封裝(不同於B200/GB200的L封裝,與Hopper類似)。
量產時間: 預計最早8月底後才能逐漸上量,不會很快。原因在於B200遇到的問題(特別是NVLink安裝)B300也會遇到,且CX8交換板的PCB設計非常複雜,調試需要時間。
產能預期(B系列): 基於CoWoS-L產能,預計B系列年產能可達300萬張B卡(約600萬die)。
定價: 預計比GB200整體模組上漲20%以上,主要因顯存增加50%。
3.H100/H200/H20
產品切換: H100已全面停產,目前生產切換至H200。
H20:交付: Q1已確認大部分訂單,交付周期12-16周,4月底後收入確認比例高。
中國市場: H20是針對中國市場的主力產品,不會停產。因應對MoE模型(pre-fill需要算力,decoding更依賴顯存帶寬),H20仍有需求。
國內採購: 2025年Q1國內市場確認訂單超70萬張,騰訊約35萬,阿里約20萬,位元組跳動去年已大量採購。H20被認為是當前性價比高且最實用的選擇。
定價: 舉例,從96g HBM升級到141g HBM,單價從12,000美元漲至14,000-15,000美元。
H200/北美需求: B系列(NVL72)在北美CSP中緩慢上量,導致對H200需求猶豫不決。但NVL72被視為最具性價比方案,預計Q2後上量會加快,可能影響H200訂單。
02
主要客戶與部署情況
NVL72 最大客戶: CoreWeave 和 微軟
CoreWeave: 主要部署在美國東部麻省,3個數據中心總容量12萬多卡(1500個機架),近期安裝已加速,應已完成安裝150個機架。供應商包括Dell、緯創、Vertiv、安費諾等。
微軟: 已安裝至少120個機架,預計全年需求達15,000個機架。鳳凰城數據中心規模最大(含1,500機架,對應11萬多張卡)。加州項目約1,100-1,200機架(對應8.5萬多張卡)。安裝合作方包括富士康、Vertiv、安費諾、英偉達團隊。
谷歌、AWS、Meta (2025年計劃):需求明確,但計劃靠後一些。明確計劃採購5,000台機架。
上半年主要以NVL36為主(亞馬遜用廣達,Meta用廣達與緯創合作)。NVL36部分採用風冷,交換機用液冷,整體安裝難度較低。
目前三家在實驗室階段已完成20-30個試驗性機架部署,4-5月間逐步擴展到400-500台。
03
相關技術與生態
CoWoS 產能: 是B系列GPU供應的關鍵因素之一。
Dynamo 軟體框架:Nvidia英偉達開源的推理框架,用於大規模分散式模型(特別是MoE)推理。
背景:應對DeepSeek等使用大量GPU(如320張卡、40台8卡伺服器)並行推理的需求。
應用:適用於微信等日訪問量千億級的平台。單台H20機器做推理吞吐量低(支持32客戶,每秒15 token/客戶),但擴展到40台機器可支持2000用戶並發,每秒20-25 token/客戶。
部署估算:應對每天調用量達10億次的業務場景,約需20萬張H20。
網路技術 (Nvidia/Mellanox):現狀: 通過收購Mellanox進入網路領域,產品涵蓋網卡、交換機、光模塊等,支持NVLink。業務增長迅速,但面臨Broadcom、Marvell等競爭,在乙太網領域未形成絕對主導。
配置推薦: Nvidia推薦CX8作為GB300的標準配置,但非強制。客戶(如AWS用自家網卡,Google/Meta選CX7)會根據自身需求選擇ODM和網路配置。
伺服器組網成本: Scale up(機架內互聯,如NVL72用NVLink)成本占伺服器總成本30%以上;Scale out(機架間互聯)用IB(如Quantum)或乙太網(如Spectrum-X)。
Quantum (IB): 144口800G產品8月預計量產,但主要上量在明年。全球單組網超4萬張的大客戶可能不超過5家。
CPO (Co-Packaged Optics):Nvidia 進展: 涉及11家關鍵供應商(如Coherent提供PIC中的MMA微透鏡,Lumentum提供激光發射器,台積電/矽品負責封裝等)。
競爭與挑戰: Broadcom起步早,但Nvidia正追趕。早期穩定性問題(前液冷技術和封裝良率)通過供應商技術提升和液冷應用推廣得到改善。
量產預期: 明年是CPO上量的重要年份。Nvidia今年上半年仍在試產(僅3-4個客戶),但明年預計會翻10倍以上,年預計千台起,明年至少1萬多台。
04
總結
Nvidia在新一代GPU(B系列/GB系列)上面臨旺盛需求和複雜的生產/安裝瓶頸,特別是NVLink和先進封裝。H20在中國市場需求強勁。客戶部署規模巨大(CoreWeave, 微軟),其他雲巨頭也在積極規劃。網路技術(NVLink, IB, CPO)是關鍵配套,Nvidia在此領域持續投入並追趕競爭對手。Dynamo軟體框架旨在配合硬體解決大模型推理挑戰。整體看,AI硬體市場持續高速發展,但也伴隨著供應鏈、技術和部署上的挑戰。