NVIDIA公布2026-2028年两大GPU架构:搭配1TB HBM4e内存

快科技3月19日消息,nvidia blackwell架构虽然在加速卡、游戏卡上都遭遇诸多波折,但这并不影响nvidia对于未来的宏伟规划,不但公布了下一代rubin架构的具体产品规划,还首次宣布了再下一代架构“feynman”。

feynman就是理查德·费曼,美籍犹太裔人,20世纪最伟大的物理学家之一,诺贝尔物理学奖获得者,在量子电动力学、量子计算、纳米技术等领域都有开创性的成就,还撰写了《费曼物理学讲义》、提出了“费曼学习法”,1986年挑战者号航天飞机爆炸失事的根本原因也是他查明的。

nvidia这次一共宣布了三款产品,首先是“blackwell ultra nv72”,今年下半年发布,每个节点配备两颗升级版的blackwell gpu、一颗grace cpu,搭配多达288gb hbm3e高带宽内存,dense fp4性能高达15pflops(每秒1.5亿亿次)。

整台服务器一共72个节点,也就是144颗gpu、72颗cpu、20tb hbm3e、40tb ddr5内存,比上代增加50%,cx8互连带宽14.4tb/s,增加100%。

整机的dense fp4推理性高达1.1eflops(每秒110亿亿次),fp8训练性能高达0.36eflps(36亿亿次),还有新的注意力指令。

2026年下半年,我们将迎来全新的rubin架构,首发服务器产品为“vera rubin nv144”,每个节点两颗rubin gpu搭配一颗全新的vera cpu。

其中,rubin gpu搭配288gb容量的下一代hbm4内存,fp4浮点性能跃升到50pflops(每秒5亿亿次)。

vera cpu则包含88个自研arm架构核心,首次支持多线程而达到176线程,彼此之间通过1.8tb/s带宽的nvlink-c2c总线连接在一起。

整台服务器一共144个节点,也就是288颗gpu、144颗cpu、41.5tb hbm4内存(带宽13tb/s),还有75tb的系统内存,nvlink6带宽达260tb/s,cx9总线带宽达28.8tb/s。

fp4推理性能来到3.6eflops(每秒360亿亿次),fp8训练性能则是1.2eflops(每秒120亿亿次)。

2027年下半年,我们将看到升级版的“rubin ultra nv576”,每个节点包含四颗rubin gpu、一颗vera gpu,并升级1tb hbm4e内存,fp4浮点性能高达100pflops(10亿亿次)。

整机一共多达576个节点,也就是拥有2304颗rubin gpu、576颗vera cpu、576tb hbm5e(带宽4.6pb/s),还有365tb系统内存。

nvlink互连总线升级到第七代nvlink7,带宽惊人的1.5pb/s,另外cx9总线带宽115.2tb/s。

fp4推理性能高达15eflops(每秒1500亿亿次),fp8训练性能5eflops(每秒500亿亿次)。

至于新的feynman架构,将在2028年首次登场,搭配下一代hbm内存(hbm5?),但具体细节暂未披露。