NVIDIA公布2026-2028年兩大GPU架構:搭配1TB HBM4e內存

快科技3月19日消息,nvidia blackwell架構雖然在加速卡、遊戲卡上都遭遇諸多波折,但這並不影響nvidia對於未來的宏偉規劃,不但公布了下一代rubin架構的具體產品規劃,還首次宣布了再下一代架構「feynman」。

feynman就是理乍得·費曼,美籍猶太裔人,20世紀最偉大的物理學家之一,諾貝爾物理學獎獲得者,在量子電動力學、量子計算、納米技術等領域都有開創性的成就,還撰寫了《費曼物理學講義》、提出了「費曼學習法」,1986年挑戰者號穿梭機爆炸失事的根本原因也是他查明的。

nvidia這次一共宣布了三款產品,首先是「blackwell ultra nv72」,今年下半年發佈,每個節點配備兩顆升級版的blackwell gpu、一顆grace cpu,搭配多達288gb hbm3e高帶寬內存,dense fp4性能高達15pflops(每秒1.5億億次)。

整台服務器一共72個節點,也就是144顆gpu、72顆cpu、20tb hbm3e、40tb ddr5內存,比上代增加50%,cx8互連帶寬14.4tb/s,增加100%。

整機的dense fp4推理性高達1.1eflops(每秒110億億次),fp8訓練性能高達0.36eflps(36億億次),還有新的注意力指令。

2026年下半年,我們將迎來全新的rubin架構,首發服務器產品為「vera rubin nv144」,每個節點兩顆rubin gpu搭配一顆全新的vera cpu。

其中,rubin gpu搭配288gb容量的下一代hbm4內存,fp4浮點性能躍升到50pflops(每秒5億億次)。

vera cpu則包含88個自研arm架構核心,首次支持多線程而達到176線程,彼此之間通過1.8tb/s帶寬的nvlink-c2c總線連接在一起。

整台服務器一共144個節點,也就是288顆gpu、144顆cpu、41.5tb hbm4內存(帶寬13tb/s),還有75tb的系統內存,nvlink6帶寬達260tb/s,cx9總線帶寬達28.8tb/s。

fp4推理性能來到3.6eflops(每秒360億億次),fp8訓練性能則是1.2eflops(每秒120億億次)。

2027年下半年,我們將看到升級版的「rubin ultra nv576」,每個節點包含四顆rubin gpu、一顆vera gpu,並升級1tb hbm4e內存,fp4浮點性能高達100pflops(10億億次)。

整機一共多達576個節點,也就是擁有2304顆rubin gpu、576顆vera cpu、576tb hbm5e(帶寬4.6pb/s),還有365tb系統內存。

nvlink互連總線升級到第七代nvlink7,帶寬驚人的1.5pb/s,另外cx9總線帶寬115.2tb/s。

fp4推理性能高達15eflops(每秒1500億億次),fp8訓練性能5eflops(每秒500億億次)。

至於新的feynman架構,將在2028年首次登場,搭配下一代hbm內存(hbm5?),但具體細節暫未披露。