大模型提升45倍!2024 GTC大会重磅开幕

英伟达于当地时间3月18日在加州圣何塞举办了2024gtc大会,隆重推出了基于下一代blackwell超级计算架构打造的ai超级计算机。在此次发布会上,英伟达率先揭晓了一款配备gb200 graceblackwell超级芯片的dgx superpod计算机,专为处理具有万亿参数级别的模型设计,以确保超大规模生成式ai训练和推理任务能够连续高效运行。

这款新型ai超级计算机创新采用了先进的液冷机架级扩展架构,具备卓越性能,在fp4精度下可提供高达11.5exaflops的ai超级计算能力以及240tb的高速显存,并且其性能可通过增加机架进一步扩展。据悉,每个dgx gb200系统内部集成了36颗nvidiagb200超级芯片,其中包括36个nvidia gracecpu核心和72个nvidia blackwell gpu,所有这些超级芯片通过第五代nvidia nvlink技术无缝连接成一台强大的超级计算机。相较于上一代nvidiah100 tensor core gpu,gb200超级芯片在处理大语言模型推理工作负载时,性能提升了最高30倍。

此外,英伟达还发布了通用型ai超级计算平台——nvidia dgx b200系统,该系统同样构建于全新的blackwell架构之上,配置了8块nvidiab200 tensor core gpu以及两颗英特尔处理器,用于支持ai模型的训练、微调及推理操作。dgx b200系统在fp4精度下的ai计算性能可达144petaflops,配备1.4tb的gpu显存和64tb/s的显存带宽,其万亿参数模型的实时推理速度相比前一代产品提升了15倍之多。

(8613024)