技嘉RTX 4090 MASTER顯卡評測超級雕開啟新時代

分類：數碼

瀏覽數：1735

2022-10-25

RTX 4090已經發布，各個非公版產品也已經與大家見面，今天為帶來的是老牌顯卡廠商技嘉帶來的AORUS GeForce RTX 4090 MASTER，是非公版顯卡中做工與散熱極為突出的代表產品。

雖然RTX 40系的供貨還沒有徹底穩定下來，但是玩家們的選購熱情會隨着時間的推移慢慢地冷靜下來，漸漸地從“誰有貨買誰”向“誰貨好買誰”的選購思路過渡。而這也就回歸到了非公版顯卡們最擅長的領域。

技嘉顯卡旗下共分為獵鷹、魔鷹、小雕、大雕、超級雕、水雕等眾多系列，本次我們評測的為超級雕，屬於旗艦系列。

作為RTX 40系首發的GeForce RTX 4090顯卡，最大的特點就是24GB的超大顯存，其實按以往的規律來看，“90”級別的顯卡屬於TITAN系列，更多的是生產力工具。

但RTX 40系中NVIDIA卻讓它“打頭陣”，並且着重介紹了其遊戲性能，所以本次我們也將着重進行DLSS 3的相關測試，首先我們先來看一下產品的外觀。

1 AORUS GeForce RTX 4090 MASTER 概覽

熟悉技嘉的朋友都知道，每一代超級雕系列顯卡都着重在散熱和光效兩個方面做文章，本世代也沒有例外。

AORUS GeForce RTX 4090 MASTER整體採用灰色和黑色交錯的外觀設計，僅在顯卡正面就運用了磨砂、線條、切割紋理三種表面工藝設計，三枚風扇的中心分別應用了AORUS的英文名稱和圖形LOGO外觀。

尺寸方面，本代的超級雕也是再次突破，達到了358.5×162.8×75.1mm，這樣一張顯卡甚至手小一點的都無法單手掌握。

AORUS GeForce RTX 4090 MASTER，採用了新一代風之力散熱系統設計，顯卡正面配備了三個110mm直徑的仿生鯊魚風扇，新的仿生鯊魚風扇，在扇葉表面進行了如同鯊魚皮膚上盾鱗一樣的紋理設計，實現了3dB的噪音下降和30%的風壓提升。

其中左右兩側為順時針旋轉，而中間的風扇則採用逆時針旋轉，這樣避免了三個風扇之間的渦流互相干擾，提升進風量。所有風扇均支持3D啟停技術，在低負載的情況下不轉或者降低降速，以獲得更低的噪音表現。

在內部的散熱模組上，AORUS GeForce RTX 4090 MASTER 採用140.4x122mm的均熱板直觸GPU和顯存，再配合13根複合式熱管，與散熱風扇一道提供更高的散熱效率，讓核心和顯存可以在超頻狀態下保持穩定的性能輸出。

顯卡右上角的“AORUS”字樣採用RGB可發光設計，三枚風扇的周圍也保留了經典的三環燈效配合GIGABY TECONTROL CENTER（GCC）可以實現豐富的燈效控制，也能夠與其他的設備實現光效同步。

在中間的風扇下方，技嘉還帶了一組具有“炫彩光輪”RGB效果，在不同角度下觀看能夠擁有璀璨的視覺效果，非常具有個性化。

AORUS GeForce RTX 4090 MASTER的背面同樣運用了拉絲和磨砂兩種工藝，銀色的金屬拉絲和灰色的磨砂設計融於一體，配合中心位置可發光的“AORUS”品牌印記，效果非常炫酷。

背板右側是鏤空的鱗片散熱窗口，與正面的散熱風扇配合，形成了通暢高效的散熱通道。

AORUS GeForce RTX 4090 MASTER 雖然採用了標準的雙槽設計，提供了三個DP1.4和1個HDMI2.1 顯示輸出接口。根據NVIDIA的要求，這一代RTX 4090顯卡的散熱器體積變大，需要佔用差不多4個PCIE插槽，所以小機箱用戶要注意。至於呼聲較高的DP2.0，其實目前絕大部分消費級遊戲顯示器都沒有實裝，且DP1.4a標準也能夠支持8K60Hz刷新率的顯示器。所以，綜合來看，絕對夠用。

金屬背板延伸到了顯卡頂部，進一步提升了顯卡的結構強度。

AORUS GeForce RTX 4090 MASTER 保留了個性化十足的LCD屏幕，用戶可以在這塊屏幕上自定義顯示內容，既可以顯示顯卡的溫度等信息，也可以自行上傳GIF動畫等內容。

AORUS GeForce RTX 4090 MASTER 同樣採用了新的16pin供電接口，在PCB板上提供了電源狀態指示燈，顯卡供電存在問題時會亮起以提示故障原因。官方建議電源功率為1000W，和其他的RTX4090顯卡基本一致，今年裝機的用戶，大功率電源肯定是免不了的。

目前已有部分電源廠商發布了最新的ATX3.0標準高端電源，自帶12VHPWR的16pin供電接口，單口最高可支持600W供電。所以不出意外的話，或許下一代顯卡也將採用這樣的單16pin來供電。另外需要注意的是，目前適用於RTX30系列的12pin接口和電源轉接器與RTX40系列顯卡不兼容。

AORUS GeForce RTX 4090 MASTER 提供了雙BIOS選項，用戶可以自行在靜音模式和OC模式中切換。

配件方面，除了必備的16pin電源轉接線，技嘉還帶來了官方的顯卡支架安裝套件和螺絲，不用再購買第三方品牌的支架了。

2 Ada Lovelace 是誰？

下面我們來看一下此次推出NVIDIA Ada Lovelace架構，我們先從Ada Lovelace這個人講起，相較於Ampere，這位似乎大家更陌生一些。

Ada Lovelace（1815-1852）是英國數學家、計算機程序創始人，建立了循環和子程序概念，被稱為世界上第一位程序員。

Ada從小對數學有極高天賦，其父稱她為“平行四邊形公主”，後來的合作夥伴Charles Babbage稱她為“數字女巫”。在19歲時Ada嫁給了自己曾經的科學家庭教師，婚後的她對數學熱情不減。

1842年到1843年花了9個月時間翻譯了Babbage的《分析機概論》的備忘錄，寫了很多註記，其中給出了用計算機進行Bernoulli數求解的詳細說明。由此，Ada被廣泛認為是世界上第一位程序員。

而以她名字命名的語言——ada語言，已經成為了美國軍方開發戰鬥機等尖端武器的語言。

從幾行簡短的生平簡介中，不難看出Ada的生命雖然只經歷了短暫的37個春秋，但卻足以被後人銘記。

這也是為什麼此次NVIDIA RTX 40的先行宣傳中，用到了“以未來敬傳奇”的slogan，下面我們詳細剖析一下，這次的Ada Lovelace還有哪些創新和超越。

3 NVIDIA Ada Lovelace架構

本次發布的GeForce RTX 40系顯卡由全新的NVIDIA Ada Lovelace架構打造，採用TSMC 4nm定製工藝（TSMC 4 nm NVIDIA Custom Process），旗艦核心AD102達到了恐怖的760億個晶體管，而在RTX 30系顯卡中為280億個。

與上一代NVIDIA Ampere相比，NVIDIA Ada Lovelace在相同功率下，具有2倍以上的性能提升。最高可達到90-TFLOPS的着色器數據吞吐量，而本次發布的GeForce RTX 4090則達到83-TFLOPs，相比上一代NVIDIA Ampere則只有40-TFOPs。

完整的AD102核心共有18432個CUDA，其中包含12個圖形處理集群(GPCs)， 72個紋理處理集群(TPCs)， 144個流式多處理器(SMs)。144個第三代光追核心（RT cores）、576個第四代張量核心（Tensor Cores）。另外可以看到Boost頻率也從1.9GHz猛增到了2.5GHz。

另外一點在架構圖上沒有體現的是，AD102核心還包含288個FP64雙精度浮點核心(每SM 2個)，用來確保FP64代碼正確處理，包括FP64張量核心代碼。

通常來講，單精度浮點運算會用於深度學習模型訓練，而雙精度浮點運算則用於數值模擬工作。通常遊戲卡都會砍掉FP64，這既節省了成本，又對遊戲本身沒有影響。而專業卡都保留有FP64，目的就是為了精度更高訓練與計算。

此次資料中只提到了AD102核心搭載了288個FP64，尚不知道後續的推出的產品有無變更。

了解了完整的GA102核心，我們再來看一下RTX 4090的核心，其實知道了RTX 4090的參數，我們大概也能了解到後續可能推出的“Ti”系列究竟相差在哪。

相比完整的GA102來說，RTX 4090共有16384個CUDA，其中包含11個GPC、64個TPC以及128個SM單元，第三代RT Cores為128個，第四代Tensor Cores為512個。

其實根據完整的架構圖就能看出，此次Ada架構整體結構性的改動並不大，這一點從SM單元便能清晰印證，同樣的FP32 CUDA核心，同樣的FP32/INT32混合CUDA核心，同樣的L1級緩存等等。當然，每個SM單元內部的Tensor Core升級為第四代。

不過變化最為顯著的，則是第三代光追核心，我們結合兩代架構來看。在第二代光追核心中，包含負責邊界交叉測試的Box Intersection Engine引擎，和負責三角形交叉測試的Triangle Intersection Engine引擎。

而在第三代光追核心中，還增加了兩個新的引擎：Opacity Micro-Map Engines（OMM）和Displaced Micro-Mesh Engines（DMM），這兩個新的硬件單元可以極大地提升光追性能（具體原理後文詳細介紹）。

至此，每2個SM單元組成一個TPC單元，每6組TPC單元組成一個完整的GPC頂層單元（在部分核心中，會出現5組TPC組成一個GPC單元的情況）。

而每個GPC單元又搭載一個獨立的光柵引擎、兩組ROP分區（每組包含8個ROP單元）。

過多關於數數的部分就不再介紹了，畢竟此次架構圖的大面上與NVIDIA Ampere架構基本相同，下面我們分別來看看，除了性能Ada架構還有哪些升級。

Shader Execution Reordering （SER）着色器執行重排序

SER主要的作用是提升着色器性能，它可以將效率低下的工作負載，動態重組為更高效的工作負載。主要針對光線追蹤的性能提升非常大。

簡單地說，GPU在執行類似工作的時候效率最高。但隨着光追效果越來越強大，每個場景可能有數百萬條光線照射在不同材質上，而我們知道不同材質的反射率，以及反射效果也是不同的。所以這樣就為著色器創建了大量的、發散的，效率低下的工作負載。

SER則可以將這些雜亂的指令重新分門別類，動態重組為更高效的工作負載。根據NVIDIA的說法，SER可將着色器性能最多提升2倍，並將遊戲幀率最高提升25%。

舉個簡單的例子，當光線第一次從發射端到碰撞端是非常有規律的射線，而碰撞到物體後的二次光追，則會出現大量發散的、無規律的反射，這對於光追負載是非常高的。而從圖中便能看到，SER可以將這些指令進行二次排序，以發揮出着色器的最大性能。

不過好在這麼實用的功能並不是RTX 40系的專利，它是一個易於集成的SDK，目前需要遊戲開發商集成在遊戲中。另外由於它是一個通用的邏輯，後續也有可能直接集成在Windows的API中，這樣遊戲開發者就無需特意引用，直接調用系統API即可。

可以說SER對於手持RTX 20系及以上（能夠開啟光線追蹤）的N卡用戶來說，是極大地福音。畢竟免費提升的光追性能，誰不喜歡呢。

第三代 RT Cores

RT Core的作用在於更快的光線追蹤計算能力，如果說在RTX 30系顯卡中，想要暢享4K高幀率遊戲有點吃力，那麼RTX 40系顯卡中，將顯得輕而易舉。

在GeForce RTX 4090這張顯卡上，達到了191 RT-TFLOPs的處理能力，而RTX 30系顯卡最快處理能力為78 RT-TFLOPs，足足為2.4倍。並且根據NVIDIA的官方說法，第三代RT Core的峰值RT-TFLOPs相比於前代提高了2.8倍。而這隻能說明，這張4090並非Ada Lovelace架構的最終形態。

Opacity Micro-Map Engines（OMM）

在第三代RT Cores中引入了兩個重要的硬件單元，首先是Opacity Micro-Map Engines，可以理解為微映射透明度引擎，它主要的作用是優化光線追蹤渲染，可大幅減輕着色器的工作負擔。

比如樹葉之類的複雜物體，不同的光線都會影響它的表現狀態，以及樹葉之間的光線反彈，所以對於光線追蹤的計算量是巨大的。

不過Opacity Micro-Map Engines可以將光線追蹤特性烘焙到不透明蒙版中，所以那些不規則形狀和半透明的對象，也就能夠更快更精準的渲染出來，從而極大減輕着色器的工作負擔。

Displaced Micro-Mesh Engines（DMM）

Displaced Micro-Mesh Engines可理解為微網格置換引擎，它構建光線追蹤的BVH（Bounding volume hierarchy）的速度提高了10倍！所使用的的顯存減少了20倍！

DMM由第三代RT core本地處理，與前幾代相比，它只使用基本三角形渲染複雜幾何圖形，極大減少了存儲和處理需求。

具體的工作原理從圖中一目了然，新的DMM可以將面數非常多的複雜圖形做簡化，創造出簡單的模型，但整體的光線追蹤效果不變。

通過一些模型數據我們可以具體看到，新的DMM將模型簡化了多少。原本1100萬三角面的模型，經過簡化後，只有15萬左右的微網格，BVH的構建速度提升了8.5倍，小了6.5倍。

而這還不是最誇張的，越複雜的模型往往優化的效果越好，在官方展示的這幾組對比示例中，最快可提升大於15倍的速度，容量簡化20倍的模型。

第四代 Tensor Cores

除了光追單元的升級外，第四代張量核心的升級更加恐怖。它採用了新的FP8張量引擎，在GeForce RTX 4090這張顯卡上，吞吐量達到了1.32 Tensor petaFLOPs，提高了5倍。

注意這裡的單位——petaFLOPs。以往的TFLOPs為萬億次浮點運算，而petaFLOPs則為千萬億次浮點運算。

DLSS 3 神經網絡渲染新時代

本次推出的DLSS 3也是RTX 40系一大賣點，從DLSS 2.3直接邁入了3.0版本，也能看出此次的升級之大。而DLSS 3也被NVIDIA官方稱為神經網絡渲染新時代。

全新的DLSS 3在原有的DLSS超分辨率的基礎上，添加了光學多幀生成技術，以生成全新的幀，而不像原來只能生成像素。

DLSS 3結合了DLSS超分辨率、DLSS幀生成和NVIDIA Reflex這三大技術，能夠重建八分之七的像素，極大提高性能。

在GPU受限的遊戲中，比如2K分辨率及以上的更高分辨率，DLSS 2能夠將幀率提高2倍，DLSS 3則能夠提升4倍。

本次DLSS 3跨越了一個大版本，從想法和原理上也再度升級，完全“猜想”1幀的技術，我們解釋起來簡單，但實施起來需要大量的推理與演算，以及絕對超前的想法。

不過“憑空”生成的1幀，在延遲上絕對要比DLSS 2高。所以此次完整的DLSS 3中，捆綁了NVIDIA Reflex，可以有效幫助減小延遲。

這也不負NVIDIA給它起了個“神經網絡渲染新時代”的名號。縱觀目前市面上的XeSS、FSR技術，DLSS絕對稱得上“巨人的肩膀”。當然，連年的創新，苦的是手持上一代顯卡的玩家，想體驗DLSS 3的幀生成，目前唯一的辦法就是購入一張RTX 40系顯卡。

New Optical Flow Accelerator

New Optical Flow Accelerator光流加速器是在第四代Tensor Cores中最新引入的，這也是為何DLSS 3中的幀生成為RTX 40系顯卡獨享。

光流加速器在原本DLSS 2的基礎上，還可以計算兩個連續幀內的光流場，能夠捕捉遊戲畫面從第1幀到第2幀的方向和速度，從中捕捉粒子、反射和光照等像素信息。並分別計算運動矢量和光流來獲得精準的陰影重建效果。

以《賽博朋克2077》為例，在第一幀，光流加速器會捕捉到每一個像素中的粒子、反射和光照等信息。並在第二幀中查找匹配的像素區域，計算幀之間的差值。

如果說原來DLSS 2能夠“猜”出一張圖剩下的像素，那麼DLSS 3除了這些，還能夠“猜”出下一幀的畫面。

另外由於DLSS 3的幀生成是在GPU中處理和運行的，所以即使遇到CPU瓶頸的遊戲，AI同樣能夠提升幀率。這也是為什麼在此次發布會中說到，DLSS 3能夠突破CPU的限制來提升幀數。

雙AV1編碼器

本次升級的第八代NVENC編碼器可以說是直播、視頻、後期工作者的極大福音。它首次加入了對AV1編碼的支持，最顯而易見的效果就是直播。

相比傳統的H.264編碼，AV1編碼的效率平均提升了40%，在同碼率下AV1編碼的畫質將更好。目前大部分直播的分辨率和清晰度，均受限於平台規定的最大比特率。以Twitch限制的8Mbps為例，可以看到在同等帶寬下，同為2K 60幀的畫面，採用AV1編碼的清晰度明顯比H.264更高。

說起直播，OBS相信大家都不陌生，在10月份即將發布的補丁中，OBS就加入了對NVENC的AV1編碼支持

當然，直播只是我們更容易見到的AV1優勢，在視頻工作的所有環節，AV1編碼都可以帶來極大提升。

所以，如圖所見。NVIDIA已經為廣大用戶鋪好了一條完整的生態鏈，從編碼API、軟件、平台到播放器，將全面支持AV1編碼。

另外再說一下NVIDIA一直強調的雙AV1編碼。顧名思義，即部分顯卡內搭載了兩個編碼器，它所帶來的效果也是顯而易見的。

首先，根據官方宣傳的，在4K H.265的導出速度上，RTX 4090是RTX 3090 Ti的2.2倍；在8K H.265的導出速度上更是達到了2.5倍。這部分的提升，大家常用的剪映同樣適用，感興趣的用戶不妨親自體驗一下。

除了導出速度，8K 60幀的視頻錄製在以前簡直難以想象，而雙編碼器的好處就是可以將圖像一分為二，兩個編碼器分別處理7680×2160的圖像信息，最後拼合完整。

關於編碼部分，可能大部分用戶的感受不深，但當有一天，你想錄屏的時候，卻發現顯卡不支持，才會發覺它的重要性……

隨着圖像逐漸進入到超清時代，硬件編碼和渲染幾乎已經成為不可或缺的幫手。雖然論質量，硬件編碼仍不及CPU軟編，但軟編做到了極限畫質，也要承受時間的無窮長。

甚至在一張8K渲染圖中，兩種編碼方式的時間差距就已經達到了幾個小時，遑論一段10秒的CG動畫。在不斷進步的硬件編碼中，質量和時間也在不斷地被挑戰和刷新。

4 測試平台簡介

首先介紹一下測試平台，為了保障AORUSGeForce RTX 4090 MASTER 的性能發揮，我們的平台也再次進行了全面更新。

不過由於手頭上沒有旗艦處理器，採用了12代中高端產品，並且在電源上進行了着重升級，採用了華碩ROG雷神2代1600W的鈦金牌全模組電源。

首先看一下GPU-Z的參數，AORUS GeForce RTX 4090 MASTER 採用AD102核心，採用TSMC 4nm 定製工藝（TSMC4 nm NVIDIA Custom Process），芯片面積608平方毫米，這裡相對於RTX30 系的GA102的628平方毫米更小。

擁有16384個CUDA，相比RTX3090 Ti 的10752多52%，Boost頻率達到了2550MHz，相比公版的2520MHz有小幅提升。

採用24GB GDDR6X Micron顯存，位寬為384bit，顯存帶寬達到了1008.4GB/s，光柵單元和紋理單元為176和512。

5 理論性能測試

下面先進行的是用來衡量顯卡DX11理論性能的3DMARKFS套裝，DX11的性能表現對於很多過去流行的3A大作來說都是可以參考的：FS,FSE,FSU三者分別對應顯卡在1080P、2K、4K的理論性能，取顯卡分數實際測試結果如下：

在針對顯卡DX11性能的3DMARKFS 套裝測試中，AORUS GeForce RTX 4090 MASTER 的提升非常驚人，可以看到在分辨率越高的情況下這張顯卡提升越大，其中FS提升了63%；FSE提升了76%；FSU則暴力提升了80%。

綜合來看，在整個FS套裝的測試中，AORUS GeForce RTX 4090 MASTER 相較GeForceRTX 3090 Ti 的提升約為73%，與我們之前測試過的其他4090相比，AORUS GeForce RTX 4090 MASTER 的性能表現也領先了不少。

而在針對DX12環境下的TimeSpy 和TimeSpy Extreme 測試中，AORUS GeForce RTX 4090 MASTER 相較GeForce RTX 3090 Ti 的提升分別為：TS提升68%；TSE提升74%，綜合下來約為71%。DX12作為當下最為主流的圖形協議，其性能表現對各種新遊戲的參考意義非常大，AORUS GeForce RTX 4090 MASTER的性能不負眾望，相對RTX3090Ti 的提升非常巨大。

PortRoyal是3DMARK中專門針對光追性能的測試項，AORUS GeForce RTX 4090 MASTER 相較GeForce RTX 3090 Ti 的提升約為79%。綜合來看，AORUS GeForce RTX 4090 MASTER 的理論性能相較GeForce RTX 3090 Ti的提升約為74%。

NVIDIA的光追單元到40系這一代已經進行了兩次進化，每一次給人帶來十足的驚喜，AORUS GeForce RTX 4090 MASTER 相比上一代的提升可以稱得上是質變。

Speed Way測試是3DMARK最新更新的用於測試 DirectX 12 Ultimate 性能的顯卡基準測試。要運行此測試，顯卡必須支持 DirectX 12 Ultimate 並包含 6GB 及以上顯存。

這項測試結合了實時光線追蹤和傳統渲染技術來測量顯卡性能。場景含有光線追蹤反射、實時全局光照、網格着色器、體積照明、粒子和後處理效果。並且有意思的是，Speed Way測試支持自由探索場景，可查看光照及攝像機設置的改變如何影響視覺效果。

Speed Way測試默認為2K分辨率，可手動調節為1080p或4K分辨率。由於該測試項剛剛推出，後續我們也會逐漸豐富對比顯卡的數據。

AORUSGeForce RTX 4090 MASTER DLSS 3 4K

在本次測試中，我們使用3DMARK的測試版進行了DLSS3 的相關測試。在4K分辨率下，DLSS關閉為57.62幀，DLSS3 開啟後為171.34幀。

RTX3090 Ti DLSS 2 4K

另外我們也測試了GeForce RTX 3090 Ti 在該程序下成績，其中DLSS關閉為32.73幀，由於不支持DLSS3，所以在DLSS2 下的成績為83.63幀。

AORUS GeForce RTX 4090 MASTER 在開啟DLSS3 後，相比關閉提升了199%；而GeForce RTX 3090 Ti 在開啟DLSS2 後，相比關閉提升了155%。無論是與DLSS關閉對比，還是與上一代的RTX 3090Ti 開啟DLSS2進行對比，AORUS GeForce RTX 4090 MASTER 都有着非常誇張的性能提升。

但是DLSS3最令人難以置信的還不止數字上這麼簡單，我們再來看看這張圖。

AORUS GeForce RTX 4090 MASTER DLSS 3 8K

在8K（7680x4320）分辨率下的 DLSS3 測試中，AORUS GeForce RTX 4090 MASTER 在DLSS關閉的情況下僅有13.31幀，已經無法正常運行遊戲，而在開啟DLSS3 後，一躍達到了92.80的流暢水準，提升了597%！

這個數據直接證明了AORUS GeForce RTX 4090 MASTER具備與8K遊戲進行親密接觸的能力，目前已經有部分廠商推出了8K分辨率的顯示設備，AORUS GeForce RTX 4090 MASTER 能夠為這些用戶帶來最為極致的遊戲畫面。

6 常規遊戲性能測試

由於本次RTX 40 系加入了DLSS3 新技術，所以後面會進行單獨測試，這裡依然選擇主流的幾款3A大作進行遊戲性能對比。

首先在《地平線5》中，可以明顯看到，不止在1080p分辨率下，即使在2K分辨率中，受限CPU的情況依然明顯。作為一款標準的3A遊戲，在4K分辨率下依然可以跑到147幀，這在以前絕對是無法想象的。

對於像《地平線5》這種主打真實畫面效果的賽車遊戲來說，AORUS GeForce RTX 4090 MASTER所帶來的不僅僅是更快的幀率，在4K分辨率下，每一幀畫面都凝聚了製作組的心血，“遊戲攝影師”們可以通過AORUSGeForce RTX 4090 MASTER 捕捉到更為清晰的光影，在遊戲中也能夠更暢快地享受駕駛樂趣。

性能方面，AORUS GeForce RTX 4090 MASTER 相比GeForce RTX 3090 Ti 的提升分別為：1080p提升52%；2K提升55%；4K提升73%，綜合提升60%。

在一度被稱為眾生平等的《刺客信條：英靈殿》中，AORUS GeForce RTX 4090 MASTER 相比GeForce RTX 3090Ti 的提升分別為：1080p提升59%；2K提升73%；4K提升63%，綜合提升65%。對於《英靈殿》來說，每一幀的fps提升都非常難得，而AORUS GeForce RTX 4090 MASTER在4K分辨率下取得了117的超高幀率，讓4K120Hz 顯示器在這款遊戲上也終於有了用武之地。

在《無主之地3》中，AORUS GeForce RTX 4090 MASTER 相比GeForceRTX 3090 Ti 的提升分別為：1080p提升62%；2K提升64%；4K提升66%，綜合提升64%。

《光明記憶：無限》的光追測試軟件是獨立於遊戲的測試工具，比遊戲中用到的光線追蹤技術更多，測試條件為“RTX最高/DLSS質量”。所以測試幀數相對較低，但實際遊戲配置相當親民。作為最老牌的光追性能測試工具之一，《光明記憶：無限》已經陪伴了我們三代顯卡，從初代20系列基本能用，到如今1080P下218fps、2K下149fps、4K分辨率也能取得78fps的性能表現，能夠看到AORUS GeForce RTX 4090 MASTER的超強實力。

性能方面，AORUS GeForce RTX 4090 MASTER 相比GeForce RTX 3090 Ti 的提升分別為：1080p提升74%；2K提升80%；4K提升73%，綜合提升76%。

在另外一款國產遊戲《邊境》的跑分軟件中，情況基本與《光明記憶：無限》相同，測試條件均在“RTX最高/DLSS質量”下進行。

在《邊境》中，AORUS GeForce RTX 4090 MASTER 相比GeForce RTX 3090 Ti 的提升分別為：1080p提升82%；2K提升89%；4K提升85%，綜合提升85%。

綜合來看，AORUS GeForce RTX 4090 MASTER 的光追性能相比上代顯卡有質的飛躍，基本保障了在4K分辨率下的流暢運行。

7 DLSS3性能測試

由於本次新技術DLSS3的推出，將有35款遊戲將於近期推出全新的DLSS3功能，本次我們也拿到了部分遊戲的測試版。

另外《超級人類》、《生死輪迴》、《逆水寒》“拂雲庭“、《微軟模擬飛行》、《瘟疫傳說：安魂曲》都將在10月陸續發布支持DLSS3 的版本。

其中《賽博朋克2077》、《F122》、《瘟疫傳說：安魂曲》、《微軟模擬飛行》、《逆水寒》本次進行了DLSS3 的測試，另外Unity和虛幻引擎也提供了本次的測試程序。

本次DLSS3 的測試圖表比較繁瑣，並且增加了1%Low FPS和延遲的測試，普通的FPS好理解，那麼這個1%Low FPS 是什麼意思。

首先，遊戲Benchmark通常測試的FPS即為，一段時間內的遊戲平均幀。而1%Low FPS 則是將一段時間內的幀數從大到小排列，取最小的1%出來，再對這1%的數求平均值。

其實簡單來說，這兩個數值都不能代表我們在遊玩時，具體哪一刻的感受，但FPS更注重整體，而1%Low FPS 則是從最差的裡面求平均，更謹慎一些。

看懂了1%LowFPS，我們再來看這張圖表，在坐標軸左側的為延遲（越低越好），坐標軸右側的均為幀數（越高越好），並且由於牽扯到正負坐標，所以兩側的值有可能會不同。

Frameview中的測試結果為小數點後三位，為了方便觀看，這裡在幀數上進行四捨五入，延遲則保留小數點後一位。

在《微軟模擬飛行》中，在開啟和關閉DLSS2 的時候，分數幾乎無變化。這款遊戲是極度吃CPU資源的遊戲，如果瓶頸卡在處理器上，那麼傳統的DLSS2 的確無法提供更多的幀數加成。

而在DLSS3 中，我們能夠明顯看到幀數的大幅提升，要知道我們所有DLSS3 的測試均在4K分辨率下進行。

不過幀生成並不是毫無弊端，這也是為什麼此次測試加入了延遲。並且在開啟DLSS3 後，NVIDIAReflex 是捆綁開啟的。但相對於DLSS2 增加的這點延遲，在實際體驗中的感受並不強。

在《賽博朋克2077》中的數據反映比較真實，可以看到在DLSS關的光線追蹤最高的情況下，即便AORUS GeForce RTX 4090 MASTER 顯卡也只有38幀，並且延遲達到了52.5毫秒。

而在開啟DLSS3 後，幀數為137，提升了261%。雖然相比DLSS2 的延遲高了9.5毫秒左右，但相比關閉DLSS來說，依然維持在較低的水平。

《瘟疫傳說：安魂曲》是即將發布的一款遊戲，在DLSS3 和DLSS關之間的幀數提升，同樣達到了129%。不過在這款遊戲中，DLSS3 相比DLSS2 的延遲增加了21.5ms，但依然比關閉DLSS狀態下要低一些。

目前《F122》的數據測試同樣有問題，在DLSS關和DLSS2 中均沒有延遲數據。

這一組主要看幀數的提升。其中DLSS3 相比DLSS關的幀數提升了143%，相比DLSS2 的提升也達到了22%。

最後則是國產遊戲《逆水寒》的光追測試，本次我們選擇的測試Demo採用了真正的全局光照。

在嘗試關閉DLSS運行後，幀數僅有個位數，而延遲早已上萬。還記得在純光線追蹤軟件中測試的《光明記憶無限》和《邊境》，在本次只有DLSS2 的情況下都能夠達到80幀左右。而《逆水寒》這款真正意義上的全局光照，在DLSS2 開啟後僅有48幀左右，着實恐怖。不過在開啟DLSS3 的情況下，4K分辨率也來到了80幀，已經可以保證基本的遊戲體驗了。

畫質方面，在上圖中我們截取《賽博朋克2077》中的一角，可以看到在兩種DLSS模式下，相較原畫質幾乎沒有明顯變化，只在柵欄處的光影效果有所不同，但對於如此大幅度的幀數提升，這點瑕疵幾乎可以忽略不計。

RTX3090 Ti即時幀數39幀

AORUS GeForce RTX 4090 MASTER 即時幀數99幀

在Unity的測試程序中，有一組實時演算的光線追蹤+DLSS的幀數對比。AORUSGeForce RTX 4090 MASTER 在開啟DLSS3 後，實時幀數為99；而GeForceRTX 3090 Ti在開啟 DLSS2 後，實時幀數為39幀，提升約為154%。

DLSS關80幀

DLSS2 155幀

DLSS3 190幀

在UE5提供的測試遊戲中，方便的給出了DLSS的快捷測試，這裡分為DLSS關（超分辨率關+幀生成關+Reflex關）；DLSS2（超分辨率性能+幀生成關+Reflex開）；DLSS3（超分辨率性能+幀生成開+Reflex開）三檔測試。

其中，AORUS GeForce RTX 4090 MASTER 在DLSS關的即時幀數為80幀，DLSS2 為155幀，DLSS3 為190幀。不過UE5這個測試的DLSS3 延遲為49.44ms，而DLSS2 為17.18ms，相對較高。

總體而言，AORUS GeForce RTX 4090 MASTER開啟DLSS3 後的性能改善非常明顯，最高超過3倍的畫面流暢度提升足以讓AORUS GeForce RTX 4090 MASTER 這塊顯卡應對眼下以及未來幾年內的大型3A遊戲。

8 專業軟件測試

作為“90”級別的顯卡，擁有24GB的超大顯存，內容創作者領域的應用是必不可少的。我們使用SPECviewperf13 這款工業、專業軟件跑分測試。

對比顯卡為AORUS GeForce RTX 4090 MASTER 顯卡、上一代旗艦GeForce RTX 3090 Ti 顯卡以及上一代遊戲旗艦GeForce RTX 3080 Ti 顯卡。

在SPECviewperf13 的軟件測試中，每款專業軟件對於性能提升的程度不盡相同，其中SW相比RTX3090Ti 提升了36%，MAYA相比RTX3090Ti 提升了42%，CREO相比RTX3090Ti 提升了42%，CATIA相比RTX3090 Ti 提升了54%，3DSMAX 相比RTX3090Ti 提升了55%。

對於有相關軟件使用需求的用戶來說，AORUS GeForce RTX 4090 MASTER帶來的效率提升是肉眼可見的。

AORUSGeForce RTX 4090 MASTER 測試得分

RTX3090 Ti 測試得分

Blender是一款專業的三維渲染軟件，本次推出了固定的Benchmark跑分軟件，省去了安裝軟件下載素材的麻煩。這款跑分軟件只需下載好啟動程序，軟件會自動渲染測試monster/junkshop/classroom共三個場景。

上圖為AORUSGeForce RTX 4090 MASTER 顯卡得分，分別為6376/2950/3013分，平均4113分；下圖為GeForceRTX 3090 Ti 顯卡得分，分別為3136/1812/1549分，平均2165分。通過平均分的比較不難發現提升非常明顯，達到了90%，這對於以幀為渲染單位的動畫來說，能夠大幅度節省時間，提升工作效率。

9 功耗及溫度測試

功耗測試中，我們選擇FurMark軟件進行拷機測試，並採用GPU-Z檢測溫度，功耗僅計算顯卡自身。

在本次的烤機測試中，AORUS GeForce RTX 4090 MASTER 的表現同樣出色，在100%TDP 滿載的情況下，功耗來到了450W左右，與公版相當，但對於電源的要求也非常恐怖了。

另外在滿載拷機測試中，AORUS GeForce RTX 4090 MASTER 峰值溫度為60.2℃，而熱點的峰值溫度為66.7℃，這對於RTX 4090 以及AD102核心來說，表現非常出彩，AORUS GeForce RTX 4090 MASTER 的風之力散熱系統的強大實力得到了淋漓盡致的展現。

10 超級雕開啟新世代

最近幾代的NVIDIA顯卡在性能、圖形技術等方面總是會給大家帶來不一樣的驚喜表現，除了純粹的性能提升之外，每一代顯卡在圖形技術上的革新進步都會給遊戲、創作等領域帶來新的發展空間。RTX40 系列所配備的第三代RTCores 和第四代TensorCores 帶來了革命性的技術進化，為RTX4090 的性能表現帶來了質的飛躍，無論是光追性能，還是DLSS效率提升，都遠超想象。

過去我們總說“4K時代來臨”，而到了RTX4090 這一代，配合著DLSS3 帶來的性能飛躍，遊戲畫面已經從60fps的及格線躍升到144fps的電競級體驗，4K@144Hz的高刷新顯示器甚至可以成為所有購買RTX4090 顯卡用戶的標配顯示器。

實際上，RTX4090 在8K分辨率下已經取得了超過60fps的遊戲畫面表現，這也就意味着現在市場上那些先進的8K分辨率顯示設備也可以用於遊戲需求，為玩家們帶來更加極致清晰的遊戲畫面。

對於工作室、創作者們來說，RTX4090進一步提升了專業軟件的運行效率，讓畫面渲染、工程製作等專業需求的等待時間再次減少，提升各位夢想家的工作效率，為我們這個星球帶來更多美妙的設計。

回到顯卡本身，AORUS GeForce RTX 4090 MASTER作為非公版顯卡中的豪華堆料、超強散熱的代表產品，以強悍的性能表現和穩定的溫度控制，完美地展現了AD102的實力。雖然他的標定頻率只比公版卡高了一點點，但從實測表現來看，它的實際性能甚至比一些標榜超頻的卡還要強悍，同時他的溫度和功耗控制也相當完美。

配合著炫酷的外觀設計，令人眼前一亮的燈光配置，以及極具個性化的屏幕，AORUS GeForce RTX 4090 MASTER 可以說是一線非公卡中最值得關注的產品之一。目前AORUS GeForce RTX 4090 MASTER 已經上市開賣，感興趣的朋友不要錯過。

(8050815)

“技嘉RTX 4090 MASTER顯卡評測超級雕開啟新時代”相關視頻

數碼分類資訊推薦