AMD推出首款RDNA4专业显卡Radeon AI PRO R9700，拥有128个AI内核

2025年05月21日23:32:06 科技 1733

5月21日消息，AMD近日在台北电脑展（Computex 2025）正式推出了一款面向专业用户和工作站用户设计的 PCIe 5.0 显卡Radeon AI Pro R9700，旨在取代基于 RDNA 3 架构的 Radeon Pro W7800显卡。

据介绍，Radeon AI Pro R9700基于AMD最新的RDNA 4 架构的 Navi 48 GPU芯片，它是迄今为止最大的 RDNA 4 架构芯片，芯片尺寸为 357 mm²，拥有 539 亿个晶体管。Navi 48 也出现在了 Radeon RX 9070 系列显卡当中。

Navi 48 的芯片面积比上一代的 Navi 31 小得多，后者为 529 平方毫米，拥有 577 亿个晶体管。这主要的是得益于，Navi 48 采用了台积电 N4P （4nm） FinFET 工艺节点的产品，并且是单片设计。

而Navi 31 则采用的是 MCM（多芯片模块）设计，由互连成一个大芯片的多个小芯片组成。单独的 GCD（图形复杂晶粒）的尺寸为 304.35 mm²，而六个 MCD（内存缓存晶粒）中的每一个都是 37.52 mm²。这也是为什么的Navi 48 芯片面积小了大约 33%，但仍然拥有 Navi 31 的 93%的晶体管。

在 Navi 48 中，AMD 回归了单片芯片，并在台积电N4P制程的帮助下，将芯片尺寸减小了 33%。尽管如此，Navi 48 的密度比 Navi 38 高出 31%。Navi 48 的密度为每平方毫米 1.51 亿个晶体管，而Navi 38 的密度为每平方毫米 1.091 亿个晶体管。

在内核架构方面，Navi 48 具有 64 个 RDNA 4 计算单元（CU），最多可支持 4,096 个流处理器（SP）。相比之下，Navi 31 配备了 96 个 RDNA 3 CU，总共有 6,144 个 SP。更多的 CU 并不一定意味着更高的性能，因为与 RDNA 3 相比，RDNA 4 提供了相当大的代际性能提升。

具体配置方面，Radeon AI Pro R9700基于Navi 48 GPU芯片，配备64个CU计算单元(共计4096个流处理器)、64个光追加速器、128个AI加速器，峰值性能FP16半精度浮点下位96 TOPS，INT4精度下则是1531 TOPS，是上代Radeon PRO W7800的最多两倍。显存位宽仍然是256-bit，但是容量翻番到了32GB GDDR6，可以更好地满足AI负载需求，整卡功耗是300W。

Radeon AI Pro R9700实际性能暂未公开，但官方表示32GB显存的Radeon AI Pro R9700可以轻松运行24B、32B参数规模的大模型，对比16GB显存的RTX 5080，性能可以领先3-5倍之多。事实上，24B、32B大模型普遍需要至少接近30GB的显存空间，即便是文生图应用普遍需要20GB左右显存，16GB的已经基本跑不动了。