英伟达GPU调研纪要:芯片供需情况,液冷及相关技术进展

2025年05月03日18:43:05 科技 1026

GPU 需求、供应与产品迭代

1.B200/GB200

需求旺盛,但产能爬坡缓慢: 主要瓶颈在于NVLink的安装环节,而非GPU封装或模组板/液冷技术。模组板已发给合作伙伴,但安装调试流程复杂,导致交付速度慢。

交付模式: 部分客户直接采购HGX B200八卡基板(确认收入周期较短,预计到2025年1月底发出约2万模组,相当于十几万张B200卡)。

定价差异: Nvidia原厂HGX整机约45万美元(含质保服务),合作伙伴(如戴尔)定制整机通常30万美元以上,差价约30%。

GB200 vs GB300 架构差异: GB200是焊接在基板上,GPU和Grace CPU无法独立替换。GB300采用模块化设计,类似OEM插槽板,CPU/GPU可独立替换。GB300升级为CX8的800G网络,采用22层高密度PCB替代GB200的复杂线缆设计。性能提升:FP4算力+50%,显存容量+50%,显存总带宽+约10%。

英伟达GPU调研纪要:芯片供需情况,液冷及相关技术进展 - 天天要闻

2.B300

封装: 使用CoWoS-S封装(不同于B200/GB200的L封装,与Hopper类似)。

量产时间: 预计最早8月底后才能逐渐上量,不会很快。原因在于B200遇到的问题(特别是NVLink安装)B300也会遇到,且CX8交换板的PCB设计非常复杂,调试需要时间。

产能预期(B系列): 基于CoWoS-L产能,预计B系列年产能可达300万张B卡(约600万die)。

定价: 预计比GB200整体模组上涨20%以上,主要因显存增加50%。

英伟达GPU调研纪要:芯片供需情况,液冷及相关技术进展 - 天天要闻

3.H100/H200/H20

产品切换: H100已全面停产,目前生产切换至H200。

H20:交付: Q1已确认大部分订单,交付周期12-16周,4月底后收入确认比例高。

中国市场: H20是针对中国市场的主力产品,不会停产。因应对MoE模型(pre-fill需要算力,decoding更依赖显存带宽),H20仍有需求。

国内采购: 2025年Q1国内市场确认订单超70万张,腾讯约35万,阿里约20万,字节跳动去年已大量采购。H20被认为是当前性价比高且最实用的选择。

定价: 举例,从96g HBM升级到141g HBM,单价从12,000美元涨至14,000-15,000美元。

H200/北美需求: B系列(NVL72)在北美CSP中缓慢上量,导致对H200需求犹豫不决。但NVL72被视为最具性价比方案,预计Q2后上量会加快,可能影响H200订单。

英伟达GPU调研纪要:芯片供需情况,液冷及相关技术进展 - 天天要闻

02

主要客户与部署情况

NVL72 最大客户: CoreWeave 和 微软

CoreWeave: 主要部署在美国东部麻省,3个数据中心总容量12万多卡(1500个机架),近期安装已加速,应已完成安装150个机架。供应商包括Dell纬创Vertiv安费诺等。

微软: 已安装至少120个机架,预计全年需求达15,000个机架。凤凰城数据中心规模最大(含1,500机架,对应11万多张卡)。加州项目约1,100-1,200机架(对应8.5万多张卡)。安装合作方包括富士康、Vertiv、安费诺、英伟达团队。

谷歌、AWSMeta (2025年计划):需求明确,但计划靠后一些。明确计划采购5,000台机架。

上半年主要以NVL36为主(亚马逊用广达,Meta用广达与纬创合作)。NVL36部分采用风冷,交换机用液冷,整体安装难度较低。

目前三家在实验室阶段已完成20-30个试验性机架部署,4-5月间逐步扩展到400-500台。

03

相关技术与生态

CoWoS 产能: 是B系列GPU供应的关键因素之一。

Dynamo 软件框架:Nvidia英伟达开源的推理框架,用于大规模分布式模型(特别是MoE)推理。

背景:应对DeepSeek等使用大量GPU(如320张卡、40台8卡服务器)并行推理的需求。

应用:适用于微信等日访问量千亿级的平台。单台H20机器做推理吞吐量低(支持32客户,每秒15 token/客户),但扩展到40台机器可支持2000用户并发,每秒20-25 token/客户。

部署估算:应对每天调用量达10亿次的业务场景,约需20万张H20。

网络技术 (Nvidia/Mellanox):现状: 通过收购Mellanox进入网络领域,产品涵盖网卡、交换机、光模块等,支持NVLink。业务增长迅速,但面临BroadcomMarvell等竞争,在以太网领域未形成绝对主导。

配置推荐: Nvidia推荐CX8作为GB300的标准配置,但非强制。客户(如AWS用自家网卡,Google/Meta选CX7)会根据自身需求选择ODM和网络配置。

服务器组网成本: Scale up(机架内互联,如NVL72用NVLink)成本占服务器总成本30%以上;Scale out(机架间互联)用IB(如Quantum)或以太网(如Spectrum-X)。

Quantum (IB): 144口800G产品8月预计量产,但主要上量在明年。全球单组网超4万张的大客户可能不超过5家。

CPO (Co-Packaged Optics):Nvidia 进展: 涉及11家关键供应商(如Coherent提供PIC中的MMA微透镜,Lumentum提供激光发射器,台积电/硅品负责封装等)。

竞争与挑战: Broadcom起步早,但Nvidia正追赶。早期稳定性问题(前液冷技术和封装良率)通过供应商技术提升和液冷应用推广得到改善。

量产预期: 明年是CPO上量的重要年份。Nvidia今年上半年仍在试产(仅3-4个客户),但明年预计会翻10倍以上,年预计千台起,明年至少1万多台。

04

总结

Nvidia在新一代GPU(B系列/GB系列)上面临旺盛需求和复杂的生产/安装瓶颈,特别是NVLink和先进封装。H20在中国市场需求强劲。客户部署规模巨大(CoreWeave, 微软),其他云巨头也在积极规划。网络技术(NVLink, IB, CPO)是关键配套,Nvidia在此领域持续投入并追赶竞争对手。Dynamo软件框架旨在配合硬件解决大模型推理挑战。整体看,AI硬件市场持续高速发展,但也伴随着供应链、技术和部署上的挑战。

科技分类资讯推荐

苹果 macOS 26 开发者预览版 Beta 3 发布 - 天天要闻

苹果 macOS 26 开发者预览版 Beta 3 发布

IT之家 7 月 8 日消息,苹果今日向 Mac 电脑用户推送了 macOS 26 开发者预览版 Beta 3 更新(内部版本号:25A5306g),本次更新距离上次发布 Beta/RC 间隔 14 天。 本文由机器人发布,IT之家稍后将为大家带来具体更新内容。 附 macOS 26 发布历史: IT之家小伙伴如果找到更多新内容,可以在投稿或评论区中提出你的
苹果 watchOS 26 开发者预览版 Beta 3 发布 - 天天要闻

苹果 watchOS 26 开发者预览版 Beta 3 发布

IT之家 7 月 8 日消息,苹果今日向 Apple Watch 用户推送了 watchOS 26 开发者预览版 Beta 3 更新(内部版本号:23R5307g),本次更新距离上次发布 Beta/RC 间隔 14 天。 本文由机器人发布,IT之家稍后将为大家带来具体更新内容。 附 watchOS 26 发布历史: IT之家小伙伴如果找到更多新内容,可以在投
苹果 iOS/iPadOS 26 开发者预览版 Beta 3 发布 - 天天要闻

苹果 iOS/iPadOS 26 开发者预览版 Beta 3 发布

IT之家 7 月 8 日消息,苹果今日向 iPhone 和 iPad 用户推送了 iOS/iPadOS 26 开发者预览版 Beta 3 更新(内部版本号:23A5287g),本次更新距离上次发布 Beta/RC 间隔 14 天。 本文由机器人发布,IT之家稍后将为大家带来具体更新内容。 附 iOS/iPadOS 26 发布历史: IT之家小伙伴如果找到更多
2025年亚马逊Prime日音响特惠直播 - 天天要闻

2025年亚马逊Prime日音响特惠直播

#迎瑞午粽香纳福#快速导读Grado SR325x 耳机是市场上备受推崇的有线耳机,以其卓越音质和复古设计获得多项奖项,价格为247美元,折扣幅度显著。
互联网系数字银行抢滩港险分销,能否重塑香港保险生态? - 天天要闻

互联网系数字银行抢滩港险分销,能否重塑香港保险生态?

在低利率环境下,香港保险产品的高回报率吸引着越来越多的投资者。近期,蚂蚁银行、PAO Bank等持牌数字银行纷纷进军保险市场,分销险企的储蓄险、人寿险等高收益产品。 虽然银保合作在香港保险市场并非新鲜事物,但市场份额长期受限。部分市场观察人士期待,拥有内地互联网背景的数字银行能够凭借其技术优势和数字化运营经...
启动招募!面向全球AI创业者—— - 天天要闻

启动招募!面向全球AI创业者——

在中关村科学城北部核心区一座瞄准全球人工智能顶峰的生态地标正在崛起“中关村AI北纬社区”正式启动全球招募“中关村AI北纬社区”以“从这里,定义AI的千万种可能”为核心理念定位于建设“全球顶级人工智能生态圈”致力成为AI创业者的首选地和风向标
“婉约派”流行人声塞——浅谈达音科Vulkan2 - 天天要闻

“婉约派”流行人声塞——浅谈达音科Vulkan2

一个品牌的发展,既要考虑自身的奋斗,也要考虑历史的进程......达音科就是那个在国产便携HIFI圈子里必能史上留名的牌子,也是主流的一线品牌里最早开始卷硬件配置的那个,但是放在2025年,当年那套数单元数量再对比价格去衡量“性价比”的路线
清华大学校巴接入高德地图:可规划最优路径、查看车辆实时位置 - 天天要闻

清华大学校巴接入高德地图:可规划最优路径、查看车辆实时位置

IT之家 7 月 7 日消息,根据清华大学校园交通管理服务官方公众号“行在清华”今晚的推文,经该校学生部、保卫部、信息办及接待中心等部门协同推进,清华校园巴士线路信息正式接入高德地图导航系统。用户可通过高德地图便捷查询校园巴士路线、获取导航服务,实现校内外出行路线的无缝衔接。校方表示,升级后的导航功能支持智...