英伟达GPU调研纪要：芯片供需情况，液冷及相关技术进展

2025年05月03日18:43:05 科技 1026

GPU 需求、供应与产品迭代

1.B200/GB200

需求旺盛，但产能爬坡缓慢：主要瓶颈在于NVLink的安装环节，而非GPU封装或模组板/液冷技术。模组板已发给合作伙伴，但安装调试流程复杂，导致交付速度慢。

交付模式：部分客户直接采购HGX B200八卡基板（确认收入周期较短，预计到2025年1月底发出约2万模组，相当于十几万张B200卡）。

定价差异： Nvidia原厂HGX整机约45万美元（含质保服务），合作伙伴（如戴尔）定制整机通常30万美元以上，差价约30%。

GB200 vs GB300 架构差异： GB200是焊接在基板上，GPU和Grace CPU无法独立替换。GB300采用模块化设计，类似OEM插槽板，CPU/GPU可独立替换。GB300升级为CX8的800G网络，采用22层高密度PCB替代GB200的复杂线缆设计。性能提升：FP4算力+50%，显存容量+50%，显存总带宽+约10%。

2.B300

封装：使用CoWoS-S封装（不同于B200/GB200的L封装，与Hopper类似）。

量产时间：预计最早8月底后才能逐渐上量，不会很快。原因在于B200遇到的问题（特别是NVLink安装）B300也会遇到，且CX8交换板的PCB设计非常复杂，调试需要时间。

产能预期（B系列）：基于CoWoS-L产能，预计B系列年产能可达300万张B卡（约600万die）。

定价：预计比GB200整体模组上涨20%以上，主要因显存增加50%。

3.H100/H200/H20

产品切换： H100已全面停产，目前生产切换至H200。

H20:交付： Q1已确认大部分订单，交付周期12-16周，4月底后收入确认比例高。

中国市场： H20是针对中国市场的主力产品，不会停产。因应对MoE模型（pre-fill需要算力，decoding更依赖显存带宽），H20仍有需求。

国内采购： 2025年Q1国内市场确认订单超70万张，腾讯约35万，阿里约20万，字节跳动去年已大量采购。H20被认为是当前性价比高且最实用的选择。

定价：举例，从96g HBM升级到141g HBM，单价从12,000美元涨至14,000-15,000美元。

H200/北美需求： B系列（NVL72）在北美CSP中缓慢上量，导致对H200需求犹豫不决。但NVL72被视为最具性价比方案，预计Q2后上量会加快，可能影响H200订单。

主要客户与部署情况

NVL72 最大客户： CoreWeave 和微软

CoreWeave: 主要部署在美国东部麻省，3个数据中心总容量12万多卡（1500个机架），近期安装已加速，应已完成安装150个机架。供应商包括Dell、纬创、Vertiv、安费诺等。

微软：已安装至少120个机架，预计全年需求达15,000个机架。凤凰城数据中心规模最大（含1,500机架，对应11万多张卡）。加州项目约1,100-1,200机架（对应8.5万多张卡）。安装合作方包括富士康、Vertiv、安费诺、英伟达团队。

谷歌、AWS、Meta (2025年计划):需求明确，但计划靠后一些。明确计划采购5,000台机架。

上半年主要以NVL36为主（亚马逊用广达，Meta用广达与纬创合作）。NVL36部分采用风冷，交换机用液冷，整体安装难度较低。

目前三家在实验室阶段已完成20-30个试验性机架部署，4-5月间逐步扩展到400-500台。

相关技术与生态

CoWoS 产能: 是B系列GPU供应的关键因素之一。

Dynamo 软件框架:Nvidia英伟达开源的推理框架，用于大规模分布式模型（特别是MoE）推理。

背景：应对DeepSeek等使用大量GPU（如320张卡、40台8卡服务器）并行推理的需求。

应用：适用于微信等日访问量千亿级的平台。单台H20机器做推理吞吐量低（支持32客户，每秒15 token/客户），但扩展到40台机器可支持2000用户并发，每秒20-25 token/客户。

部署估算：应对每天调用量达10亿次的业务场景，约需20万张H20。

网络技术 (Nvidia/Mellanox):现状：通过收购Mellanox进入网络领域，产品涵盖网卡、交换机、光模块等，支持NVLink。业务增长迅速，但面临Broadcom、Marvell等竞争，在以太网领域未形成绝对主导。

配置推荐： Nvidia推荐CX8作为GB300的标准配置，但非强制。客户（如AWS用自家网卡，Google/Meta选CX7）会根据自身需求选择ODM和网络配置。

服务器组网成本： Scale up（机架内互联，如NVL72用NVLink）成本占服务器总成本30%以上；Scale out（机架间互联）用IB（如Quantum）或以太网（如Spectrum-X）。

Quantum (IB): 144口800G产品8月预计量产，但主要上量在明年。全球单组网超4万张的大客户可能不超过5家。

CPO (Co-Packaged Optics):Nvidia 进展: 涉及11家关键供应商（如Coherent提供PIC中的MMA微透镜，Lumentum提供激光发射器，台积电/硅品负责封装等）。

竞争与挑战: Broadcom起步早，但Nvidia正追赶。早期稳定性问题（前液冷技术和封装良率）通过供应商技术提升和液冷应用推广得到改善。

量产预期: 明年是CPO上量的重要年份。Nvidia今年上半年仍在试产（仅3-4个客户），但明年预计会翻10倍以上，年预计千台起，明年至少1万多台。

总结

Nvidia在新一代GPU（B系列/GB系列）上面临旺盛需求和复杂的生产/安装瓶颈，特别是NVLink和先进封装。H20在中国市场需求强劲。客户部署规模巨大（CoreWeave, 微软），其他云巨头也在积极规划。网络技术（NVLink, IB, CPO）是关键配套，Nvidia在此领域持续投入并追赶竞争对手。Dynamo软件框架旨在配合硬件解决大模型推理挑战。整体看，AI硬件市场持续高速发展，但也伴随着供应链、技术和部署上的挑战。