在显卡的激烈竞争市场中,msi geforce rtx5090 suprim soc凭借其卓越的性能和独特设计脱颖而出。这款显卡基于全新的rtx5090 blackwell旗舰gpu打造,是微星最顶级的风冷定制显卡,目标是在4k超高清分辨率下畅玩所有当前及未来游戏,甚至能解锁8k 60hz或120hz的全新游戏体验。今天,就让我们一同深入了解这款显卡的魅力所在。
geforce blackwell架构作为nvidia rtx技术的第四代革新成果,延续并深化了实时光线追踪与传统光栅化3d图形融合的理念。它带来的神经渲染技术,是图形处理领域的一大突破。与dlss基于训练数据、时间帧和运动向量在放大帧中重建细节不同,神经渲染赋予gpu借助生成式ai创建部分画面帧的能力,开启了图形渲染的新篇章。
我们评测的msi rtx5090 suprim soc,其核心是采用5nm工艺的gb202芯片。这款芯片堪称nvidia的“巨无霸”,面积达到750mm²,相比ad102芯片的608.5mm²更大,容纳了多达922亿个晶体管,比ad102增加了20%。尽管两代芯片都基于台积电4n(nvidia定制的5nmeuv变体)工艺,但gb202的性能提升并非依赖工艺升级,而是架构优化的成果。
gb202芯片在组件布局上继承了nvidia gpu的传统层级结构,但也有不少令人瞩目的改进。它率先在游戏gpu中支持pci-express5.0 x16,这意味着它能与自英特尔12代酷睿“alder lake”和amd锐龙7000“zen4”发布后众多支持pcie gen5的系统完美适配,同时向下兼容旧版本pcie。此外,gb202还是首款采用gddr7内存标准的gpu,相比gddr6,gddr7速度翻倍且带宽能耗更低。rtx5090配备的32gb、28gbpsgddr7内存,通过512位宽的内存接口,为高性能图形处理提供了充足的数据带宽保障。
giga thread引擎负责gb202的主要图形渲染工作负载分配,新加入的ai管理处理器(amp)则是一大亮点。amp就像一位智能调度大师,专门管理gpu上的所有ai加速资源。它能让gpu在运行游戏实时图形渲染的同时,高效运行大语言模型(llm),且两者互不干扰。这一特性对于dlss4的多帧生成技术至关重要,确保了gpu在复杂的ai和图形任务混合场景下也能稳定高效运行。
每个图形处理集群(gpc)作为gpu的重要细分单元,包含16个流处理器(sm)、8个纹理处理集群(tpc)和一个由16个rop组成的光栅化引擎。gb202上的sm相较于ada代有显著升级,每个sm拥有128个cuda核心,且所有128个simd单元都具备并发fp32+int32处理能力。这些cuda核心被划分为四个切片,每个切片都配备独立的寄存器文件、l0指令缓存、warp调度器、两组加载存储单元和一个特殊函数单元(sfu),用于处理三角函数、指数、对数、倒数和平方根等特殊数学运算。四个切片共享128kb的l1数据缓存和四个纹理映射单元(tmu)。
值得一提的是,blackwell sm引入了神经着色器的概念,微软在directx12最新更新中通过cooperative vectors api为神经着色器标准化奠定了基础,使得tensor核心可通过神经着色器接入工作负载。blackwell sm的着色器执行重排序(ser)引擎也能更精准地为cuda核心和tensor核心重新排序工作负载,大幅提升处理效率。
5thgen tensor核心支持fp4数据格式(1/8精度),应用于快速移动的原子工作负载时,其吞吐量是volta架构初代tensor核心的32倍。随着ai技术发展,ai模型通过采用更低精度数据格式和稀疏性来提升性能,5thgen tensor核心的这一特性顺应了这一趋势。
4thgen rt核心同样表现出色,在光线测试和光线相交性能上实现了代际提升,降低了启用路径追踪和光线追踪效果的性能成本。它引入的mega geometry技术是一大创举,通过将对象中的三角形簇作为一级基元,并采用簇级加速结构,使光线追踪能够处理极高多边形数量的物体,显著提升物体细节。新的三角形簇相交引擎专门用于处理mega geometry,配合三角形簇压缩格式和无损解压引擎,更高效地处理复杂几何图形。
由于gb202与前代ada架构基于相同的台积电4n工艺节点,nvidia在电源管理和散热方面进行了创新。重新设计的电源管理引擎通过对各个gpc和其他顶级组件进行时钟门控、电源门控和轨控,优化了功耗。同时,提升了gpu在功率相关决策上的速度,并引入了在sm级别快速调整时钟速度的技术,实现更灵活的功耗控制。
在显示和媒体引擎方面,blackwell架构也有显著改进。前代ada架构因沿用display port1.4等旧显示i/o标准而备受诟病,此次blackwell支持dp2.1 uhbr20,可通过单根线缆实现8k60hz的视频输出。此外,nvdec和nvenc也得到升级,支持av1 uhq、h.264解码性能翻倍、mv-hevc以及4:2:2格式,为用户带来更出色的视频处理和显示体验。
msi延续了geforce40 suprim系列的设计风格,msi geforce rtx5090 suprim soc整体采用金属银色为主色调,搭配灰色点缀,呈现出简洁而大气的科技美感。显卡背部配备了金属背板,背板上精心设计的镂空部分,有效促进了空气流通,不仅增强了散热效果,还为显卡的整体外观增添了一份独特的工业质感。
从尺寸来看,这款显卡的长度为36.0厘米,宽度达15.0厘米,重量约2839克,在安装时需要占用系统中的四个插槽,实测其宽度为75毫米。这样的尺寸规格意味着在装机时,用户需要提前确认机箱内部空间是否足够,以确保显卡能够顺利安装。
在显示连接方面,msi geforce rtx5090 suprim soc提供了丰富且高性能的接口组合,包括三个标准的displayport2.1b接口和一个hdmi2.1b接口。这一配置符合geforce rtx50系列blackwell显卡的标准,其全新的显示引擎支持三个display port2.1b输出,每个接口都具备uhbr20的高速传输能力;hdmi2.1a接口同样表现出色,这两种接口均支持显示流压缩(dsc)技术。
借助dsc技术,该显卡的性能得到了极大的发挥。例如,单个display port接口就能轻松驱动4k分辨率、12位hdr且刷新率高达480hz的显示器,或者支持8k分辨率、12位hdr且刷新率最高达165hz的显示输出。此外,rtx5090配备的更新版媒体加速引擎,对4:2:2视频格式、av1uhq以及mv-hevc等都提供了有力支持,同时还内置了三个独立的nvenc编码单元和两个nv dec解码单元,为用户在视频处理、高清视频播放等方面带来了更流畅、更优质的体验。
在供电方面,显卡采用了单个16针连接器,这种设计能够满足显卡最高600w的功耗需求,为其稳定运行提供了充足的电力保障。
msi在显卡的外观细节上也下足了功夫,在风扇附近设置了可调节的rgb灯光区域。显卡上的“suprim”文字标识以及角落处的suprim logo在点亮后都会散发迷人的光芒,用户可以通过相关软件对灯光效果进行个性化设置,打造出独一无二的主机氛围。
另外,显卡还配备了双bios开关,这一设计为用户提供了更多的选择空间。通过这个开关,用户可以在默认的“静音”bios和“游戏”bios之间轻松切换。“静音”bios模式下,显卡的风扇曲线相对保守,运行时噪音更低,适合对噪音较为敏感的用户;而“游戏”bios则采用了更激进的风扇曲线,在游戏等高负载场景下,能够让风扇更快速地运转,从而更有效地降低显卡温度,确保显卡性能的稳定发挥。
对显卡进行拆解后可以发现,其主要散热器承担着为gpu、内存芯片以及vrm电路散热的重要任务。散热器采用了大面积的均热板底座,并搭配了11条热管。这种设计能够迅速将gpu产生的热量传导出去,通过热管高效地分散到整个散热鳍片上,再借助风扇的强劲风力将热量排出机箱外,从而保证显卡在高负载运行时的温度始终处于合理范围内。
金属材质的背板不仅在外观上提升了显卡的质感,更重要的是,它能够在安装和日常使用过程中对显卡起到保护作用,有效防止因碰撞、挤压等造成的损坏,延长了显卡的使用寿命。
从pcb正面可以看到,这款显卡为gpu配备了一套极为强大的22相供电vrm(voltage regulator module,电压调节模块),这些供电模块被标记在上方的红色矩形区域内。整个供电系统由monolithicpowersystems公司的mp29816控制器统一管理,确保供电的稳定性和精准性。
值得注意的是,所有gpu供电相位均采用了monolithic公司的mp87993 drmos芯片。虽然目前这款芯片的具体电流额定值尚未完全明确,但从型号中的“9”推测,其额定电流可能达到90a。如此强大的供电配置,能够为高性能的gb202 gpu提供稳定而充足的电力,确保其在高负载运行时性能不受供电瓶颈的限制。
除了gpu供电,为16颗gddr7显存芯片供电的vrm同样不容忽视。这部分采用了七相供电设计,并且同样由mp29816控制器负责调控。显存供电部分同样选用了mp87993 drmos芯片,与gpu供电保持了一致性,这有助于维持显存运行的稳定性,保证数据的高速读写。
这款显卡搭载的gddr7显存芯片来自三星,型号为k4vaf325zc-sc28,其数据传输速率高达28gbps,能够为显卡提供强大的数据带宽支持,满足复杂图形处理和高分辨率游戏对显存的苛刻要求。
位于显卡核心位置的nvidia gb202 gpu体积巨大,采用台积电的5纳米“nvidia 4n”工艺制造,与ada架构的gpu采用相同制程。其芯片面积达到750mm²,集成了922亿个晶体管,如此庞大的晶体管数量和先进的制程工艺,为显卡带来了卓越的计算性能和图形处理能力,是这款显卡能够在高端市场占据一席之地的核心硬件基础。
从测试数据来看,msi rtx5090 suprim soc在默认bios下,游戏时gpu温度为75°c,显存温度80°c,风扇转速1093rpm,噪音28.4dba;切换到性能bios后,gpu温度降至65°c,显存温度70°c,风扇转速提升至1651rpm,噪音为36.3dba。与其他竞品相比,该显卡在温度控制和噪音表现上具有一定优势,尤其是在默认bios下,噪音控制出色,能为用户带来相对安静的使用环境。
噪音测量使用经过校准的1/2英寸测量麦克风,通过数字音频处理管道将声音记录到主机pc上,且每月至少重新校准一次。测量距离设定为50cm,相较于之前的1m距离,缩短距离能更精准地分辨出低噪音显卡之间的差异。
通过测试,我们得到了不同显卡的噪音数据。在众多显卡中,msi rtx5090 suprim soc在默认bios下噪音为28.4dba,性能bios下为36.3dba。与其他显卡相比,默认bios模式下,其噪音水平低于多数竞品,仅略高于rx6800xt(27.4dba);切换到性能bios后,噪音有所上升,但仍处于可接受范围,在高端显卡中处于中等偏下水平。
msi geforce rtx5090 suprim soc在温度和噪音控制方面表现出色。其散热系统能够有效控制显卡在高负载下的温度,不同bios模式为用户提供了多样化的选择,可根据实际需求在温度、性能和噪音之间灵活权衡。对于追求高性能且对使用体验有较高要求的用户来说,这款显卡无疑是一个颇具竞争力的选择。
结结结:
msi rtx 5090 suprim soc拥有出色的散热和静音效果,是目前最好的风冷显卡之一。然而,对于消费者来说,这仍然是一笔不小的开支。 相比之下,amd的显卡在性能上与rtx 5090存在较大差距,且缺乏dlss多帧生成和新的超分模型等软件优势。虽然上一代rtx40系列显卡在dlss transformers技术的加持下,图像质量得到了免费升级,但对于追求极致性能的玩家来说,rtx 5090依然是首选。 msi geforce rtx 5090 suprim soc在性能、散热和技术创新方面表现卓越,是一款极具竞争力的高端显卡。然而,其高昂的价格和一些有待改进的地方,也让消费者在选择时需要谨慎考虑。如果你追求极致的游戏体验和图形性能,并且预算充足,那么这款显卡无疑是你的不二之选;但如果你的预算有限,或者对显卡性能要求不是特别高,那么上一代产品或其他性价比更高的显卡可能更适合你。