RTX 40系主力戰艦登場!NVIDIA GeForce RTX 4080 FoundersEdition首發測評

採用NVIDIA Ada Lovelace架構的RTX 4090顯卡已經開始在市場中銷售,其空前強大的性能獲得了發燒級玩家的一致追捧。而在9月20日與RTX 4090同時發佈的RTX 4080,也在約定的時間正式登場。作為RTX 40系列目前的次旗艦,RTX 4080也具備Ada Lovelace架構的一系列新特性與黑科技,如第三代RT Cores與第四代Tensor Cores,當然也包括可以讓遊戲的視覺效果與幀率大幅提升的DLSS 3,而價格方面則相對更甜品一些。因此,RTX 4080也受到了遊戲玩家與高性能用戶的廣泛關注,而11月15日RTX 4080也正式迎來了性能解禁。本次測試我們使用的是來自NVIDIA的GeForce RTX 4080 Founders Edition(以下簡稱RTX 4080 FE),想知道這款原廠信仰級神器到底實力如何?那就和我們一睹為快吧。

Ada Lovelace架構全面升級,RTX 4080堪稱旗艦中的甜品


之前我們對NVIDIA Ada Lovelace架構進行過全面的解析,這裡先簡單概括一下它的技術亮點。

●NVIDIA Ada Lovelace架構中全新設計的流式多處理器具有最高 83 TFLOPS 的着色能力,吞吐量超過上代產品2倍。

●第三代 RT Cores 有效光線追蹤計算能力達到 191 TFLOPS,是上代產品的 2.8 倍。

●第四代 Tensor Cores 新增FP8引擎,具有高達 1.32 PFlops 的張量處理性能,超過上代 5 倍。

●支持着色器執行重排序(SER),通過即時重新安排着色器負載來提高執行效率。SER可為光線追蹤帶來最高3倍的性能提升,整體遊戲性能可最高提升 25%。

●新增Ada光流加速器帶來2倍的性能提升,使DLSS 3能夠預測場景中幀和幀之間的運動變化,讓神經網絡能夠在保持圖像質量的同時提高幀率。

●架構進行大幅改進,採用TSMC定製4N工藝,此工藝專為GPU優化,實現高達2倍的能效飛躍。

●12GB顯存及以上型號提供雙NVIDIA編碼器(NVENC),可最多縮短一半的視頻導出時間,並提供了對AV1的硬件編碼支持。

Shader Executing Reordering(SER)着色器執行重排序

GPU在完成大量並行計算的時候效率最高,而隨着遊戲中光追效果越來越複雜,着色器面臨的可能就是大量發散的、無序的低效率工作任務,從而影響了渲染效率。SER技術的出現,就可以把這些雜亂的工作任務進行分類,動態重組為更高效的任務,從而提升着色器的執行效率。從NVIDIA官方數據來看,SER技術大約會帶來2倍的着色器性能提升。

第三代RT Core

從RTX 20到RTX 30再到RTX 40,RT Core進化到了第三代。簡單地從有效光線追蹤計算能力來看,NVIDIA Ada Lovelace 架構GPU的第三代RT Core吞吐量達到了191 TFLOPS,是上一代的2.8倍之多。

另外,NVIDIA Turing和Ampere 架構GPU中的RT Core包括了用於加速邊界體積層次(BVH)數據結構遍歷的加速單元,並執行射線三角形和光線邊界框相交測試計算。Ampere的RT Cores中,BVH遍歷由Box Intersection Engine進行加速,射線三角形相交測試由三角形相交引擎進行加速,這已經被證明是迄今為止處理光追工作負載最高效的引擎。而在Ada GPU的第三代RT Cores中,除了以上兩個功能外,還引入了稱為「微映射透明度引擎」(OMM)和「微網格置換引擎」(DMM)。

微映射透明度引擎的作用是優化光線追蹤渲染,大幅降低着色器的工作負載,這對於處理複雜物體光追特性來講提升是很大的。具體的原理是將光線追蹤特性烘焙到不透明的蒙版中,讓那些不規則的形狀與半透明的對象都能更快更精準地被渲染出來。

微網格置換引擎則可以將面數非常多的複雜圖形做簡化,創造出更加簡單的模型,從而實現用基本三角形渲染複雜幾何圖形的目的,大大減少了計算量和對顯存的佔用。從官方數據來看,微網格置換引擎可以讓光線追蹤的BVH速度最多提升15倍以上,而顯存佔用最多可降低到原先的1/20,總之就是越複雜的模型,微網格置換引擎的優化效果越突出。

第四代Tensor Core

在Ada GPU上,Tensor Cores已經進化到了第四代,而這次Tensor Cores的升級尤其重磅。它配備了全新的FP8引擎,張量處理性能高達1.32 PetaFlops(相對上代提升了五倍之多)。第四代Tensor Cores最具革命性的進步當然是全新加入的光流加速器(Optical Flow Accelerator),而它就是NVIDIA DLSS 3黑科技的核心所在。

DLSS 3技術

DLSS技術作為RTX系列顯卡提升畫質與幀率的專用黑科技,到RTX 40這一代進化到了DLSS 3,跨度之大證明其改進是革命性的,NVIDIA官方稱其代表了「神經網絡渲染新時代」。

和之前的DLSS不同,DLSS 3在原有的超分辨率功能基礎上進一步引入了光學多幀生成技術,簡單來說就是可以通過AI計算生成新的幀,而不像之前那樣只是生成像素。而這個幀生成的工作,這個幀生成的工作是在Ada架構中新的光流加速器完成的,當然這就意味着DLSS 3中的「光學幀生成」功能是RTX 40獨享的。

光流加速器可以在DLSS 2的基礎上計算兩幀之間的光流場,捕捉遊戲畫面中從第1幀到第2幀之間變化的方向與速度,包含粒子、光線照射、反射等像素信息,通過計算運動矢量和光流場來精確重建畫面。

總的來說,DLSS 2做的是通過AI計算出畫面上剩餘的像素,而DLSS 3則在此基礎上還能計算出下一幀完整的畫面,這樣算下來DLSS 3等於是完全重建了實際顯示畫面7/8的像素,也可以說是重建了相當於實際渲染像素7倍的像素。此外,由於DLSS 3的「幀生成」在GPU中後處理,所以即便是CPU性能出現瓶頸,也能提升遊戲幀率。

按照官方數據,DLSS 3最多可帶來4倍的遊戲性能提升。DLSS 3包含了「光學多幀生成」、「超分辨率」和「NVIDIA Reflex」三大部分,開發者只要整合DLSS 3,就可默認支持DLSS 2。目前DLSS 3已經得到了遊戲開發者與遊戲引擎的廣泛支持,在後面的詳細測試中我們會進一步介紹DLSS 3遊戲的情況。

NVIDIA Studio優化

在生產力方面,NVIDIA GPU打造的CUDA生態圈已經是業界無可匹敵的存在,RTX顯卡也是設計師們優先考慮的高效工具,因此RTX 40系列在NVIDIA Studio方面的優化配合NVIDIA Studio驅動也將會為內容創作者們提供更加出色的選擇。總的來說,目前RTX 可以加速 100 多款主流創意應用,此外,SDK的提供使這些應用更加高效,並提供獨家的功能,例如Optix、DLSS和Maxine。NVIDIA Studio 還提供了全套創意應用,包括 NVIDIA Omniverse、Broadcast、Canvas 和 RTX Remix。

AV1與AI直播

AV1相比H.264等編碼方式可以在同碼率下提供更加清晰的視頻畫面,而且AV1還支持一些更先進的編碼特性,例如HDR與低延遲。RTX 40的編碼器(顯存12GB以上的RTX 40系列,當然包括RTX 4080,都提供了NVENC A V1雙編碼器)提供了對AV1硬件編碼的支持,而OBS和Discord等推流軟件都將在不久之後提供對NVENC AV1的支持,讓玩家享受到更加精美而流暢的直播視頻畫面。解碼方面,RTX 40的NVENC也繼承了RTX 30上的第5代硬件解碼器,支持MPEG-2、VC-1、H.264(AVCHD)、H.265(HEVC)、VP8/9以及AV1的硬件解碼。AI直播部分,NVIDIA在直播應用技術上的更新有:面部表情預估,眼神追蹤(讓你看起來像是在看攝像頭),以及虛擬綠幕的質量改進,而開發者可以很容易地在自己的APP中集成NVIDIA Broadcast SDK的這些功能。

RTX 4080規格解析

完整的AD103 GPU核心圖

那麼RTX 4080作為RTX 40系列的次旗艦,規格如何呢?RTX 4080採用了AD103芯片,AD103相對AD102進行了一些削減,GPC為7組,另外其中1個GPC還縮減了2組TPC只有4組。而RTX 4080在此基礎上進一步減少了兩組TPC,總共擁有38組TPC。

RTX 4080 GPU核心圖

因此,RTX 4080 GPU具有 9728個CUDA 核心,可提供 49 Shader-TFLOPS 傳統光柵渲染能力;304個第四代Tensor Cores 為AI處理和DLSS提供780 Tensor-TFLOPS的計算性能;76個第三代RT Cores具有113 RT-TFLOPS的計算性能,為下一代光線追蹤提供強勁動力;配備256 bit/16 GB美光GDDR6X顯存。根據官方數據來看,RTX 4080的性能最高可達RTX 3080 Ti的2倍,而功耗則降低了近10%。當然,RTX 4080也具備Ada Lovelace架構的多項技術,包括着色器執行重排序(SER)、第三代 RT Cores 以及DLSS 3。

此外,細心的玩家也許注意到RTX 4080的RT Cores/Tensor Cores/TUs數量甚至要比RTX 3080 Ti少一些,顯存位寬也要低一些,那它是怎麼做到性能反而更高的呢?前面已經說過了,RTX 4080的SM單元經過了進一步優化且支持SER技術,同時RT Cores與Tensor Cores都要高出一代,效率自然不可同日而語,此外GPU的二級緩存是RTX 3080 Ti的10.7倍,核心頻率更是高出50%以上,綜合這些因素,RTX 4080最終的性能其實是遠遠超過RTX 3080 Ti的。而在TGP方面,RTX 4080設定為320 W,比RTX 3080 Ti還低30 W,可見其先進的製程確實帶來了極高的能效比。

接下來讓我們先看看RTX 4080 FE這款信仰神器實物。

「90旗艦」同款信仰級散熱方案,RTX 4080 FE實物賞析

NVIDIA的Founders Edition一直以來都是N飯心目中的信仰神器,在工業設計方面可以說是獨居特色,除了性能強悍之外也具備極高的收藏價值,而且在電氣性能方面也是眾多AIC廠商的參考標杆。

RTX 4080 FE的外觀造型與RTX 4090 FE完全相同,銀色與黑色的搭配相得益彰,顯卡中央的X造型盡顯科技與信仰的力量。散熱器正面有一隻軸流風扇負責推風,另一隻軸流風扇位於顯卡背面負責拉風,從而在機箱中製造出更為高效的散熱風道,提升整體的散熱效果。

RTX 4080 FE散熱器也搭載了新的散熱鰭片和氣流設計,相比上代旗艦的FE散熱器,RTX 4080 FE可產生的最大氣流高出20%,在同噪音等級情況下,氣流可以高出15%,從而提供更高的散熱效率。

和RTX 4090 FE一樣,RTX 4080 FE的厚度已經達到了3.5槽,重量接近2.2KG,散熱器的體積相當的誇張,旗艦的霸氣感十足。輔助電源接口當然也是12Pin+4pin,包裝盒也附送了一條12Pin+4Pin轉4×8Pin的轉接線。在RTX 4080 FE的側面,配備了GEFEORCE RTX信仰燈,通電後會亮起白光,信仰感爆棚。顯卡尾部設計了一個磁吸蓋板,打開後會露出機架安裝孔位,方便在服務器機櫃中安裝。

接口部分,RTX 4080 FE提供了3個DP 1.4接口和1個HDMI 2.1接口,可以支持8K/60Hz HDR10輸出。

RTX 4080 FE和上代FE一樣採用了異形PCB設計,整體布局和RTX 4090 FE在細節上有些不同,總供電相數為18,強大的供電設計可以提供更加平穩的高負載輸出曲線,讓RTX 4080 GPU穩定發揮全部性能。

接下來,就是大家最關心的性能測試部分,讓我們看看RTX 4080 FE的真正實力吧!

實戰測試:RTX 4080飛躍式升級,性能倍增

測試平台

顯卡:NVIDIA GeForce RTX 4080 Founders Edition

處理器:酷睿i9 13900K

內存:金士頓 DDR5 6000 16GB×2

主板:華碩ROG MAXIMUS Z790 HERO

硬盤:WD_BLACK SN850 2TB

電源:華碩ROG雷神Ⅱ 1200W

操作系統:Windows 11 專業版 22H2

測試中我們解鎖處理器功耗牆,並開啟BIOS中的Resize BAR選項。內存選擇XMP DDR5 6000模式,分頻設定為自動。此外,還選用了RTX 3080 Ti與RTX 4090進行對比。

基準性能測試

首先是3DMARK GPU基準測試部分,不管是基於DX11的FireStrike系列還是基於DX12的TimeSpy系列,RTX 4080都相對RTX 3080 Ti領先了大約43%~46%。

3DMARK在近期更新了針對DX12 Ultimate的測試SpeedWay,能夠更好的展現次世代GPU在使用DX12U API的次世代遊戲中的表現。在這個測試中,RTX 4080相對3080Ti的提升同樣達到了40%。

光追性能方面,PortRoyal測試中,RTX 4080比RTX 3080Ti提升了39%。在對GPU壓力較大的DXR純光追場景測試中,更是領先RTX 3080 Ti大約55%之多,Ada Lovelace的第三代RT Cores確實在效率方面更勝一籌。

DLSS部分,RTX 4080也保持了巨大的優勢,在DLSS 2模式下,也領先RTX 3080 Ti大約45%。在DLSS 3項目中,RTX 3080 Ti不支持光學多幀生成,所以只相當於運行DLSS 2的4K測試,而內置光流加速器、完整支持DLSS 3的RTX 4080自然效率更高,領先RTX 3080 Ti大約128%!可謂是飛躍式的升級了。同時,我們也可以看到,RTX 4080的基準性能大約為RTX 4090的70%~77%,和它的芯片規模是比較符合的。

光柵化遊戲性能測試

光柵化遊戲部分,《古墓麗影:暗影》在2K分辨率下,RTX 4080比3080Ti多出了75 fps,提升幅度為44%,在4K分辨率下多出了37 fps,提升達到了39%。和RTX 4090相比,4K下的性能大約為它的67%。

《COD 19》中,RTX 4080無論是在2K還是4K下相對3080Ti都有接近40%的幀率提升,在4K下則大約有RTX 4090的73%,相比《古墓麗影:暗影》表現要好一些。

《荒野大鏢客:救贖2》算是比較公平的遊戲,RTX 4080相對RTX 3080 Ti無論在2K還是4K下的提升都超過了30%,4K下的提升略高一點達到了38%。它在4K下的幀率大約為RTX 4090的76%,差距不算太大。

再看一下育碧系的遊戲,先是《刺客信條:英靈殿》,RTX 4080相對於RTX 3080 Ti同樣在2K和4K下都有30%出頭的優勢,而在這裡它只比RTX 4090低了15%左右。

孤島驚魂6》對旗艦顯卡的優化也不是很到位,2K下RTX 4080和RTX 4090隻有5%的差距,有可能在處理器方面出現瓶頸問題了。而到了4K下,差距就拉大到了21%。RTX 4080在4K下比RTX 3080 Ti的幀率也高出了30%左右。

RTX 3080 Ti跑4K的《看門狗:軍團》勉強能到60 fps多一點,而RTX 4080還是能接近90 fps,提升大約有38%。RTX 4080在4K下有RTX 4090大約75%的幀率。

優化超好的3A大作《毀滅戰士:永恆》中,RTX 4080在4K下能超過240 fps,雖然RTX 3080 Ti幀率也不低,但是RTX 4080的提升已經接近50%了,增幅非常可觀。

同樣有這麼大性能差距的遊戲還有《殺手3》,RTX 4080在2K和4K下相對RTX 3080 Ti的幀率優勢都超過了45%。

RTX 4080在《Control》中的表現相對平淡一些,相比RTX 3080 Ti在4K下大約有28%的幀率優勢,相比RTX 4090則落後了29%。

賽車遊戲《極限競速:地平線5》,4K下RTX 4080比RTX 3080 Ti多了35%的幀率,比RTX 4090低了18%。2K下的幀率和RTX 4090比較接近,顯然是處理器又出現了瓶頸。

再來看幾款電競網遊。玩《絕地求生》的話RTX 4080也能達到最高畫質4K/144Hz的標準,在4K下比RTX 3080 Ti高了33%,比RTX 4090低了31%,正好在中間位置。

暴雪的《守望先鋒2》里RTX 4080同樣也能達成最高畫質4K/144Hz的標準,相比RTX 3080 Ti在4K下的幀率提升也有34%,而比RTX 4090則是低了29%。

《最終幻想14》的表現則符合之前的差距,RTX 4080相比RTX 3080 Ti提升30%左右,相比RTX 4090在4K下落後26%。

從這這些主流遊戲的光柵化性能測試結果來看,2K下RTX 4080相對於RTX 3080 Ti的提升在24%~50%之間,平均為36%。4K下提升在28%~46%之間,平均也是36%。相比RTX 4090,2K下的平均差距為15%,4K下大約有25%。

光追遊戲性能測試

當然,光追和DLSS才是RTX顯卡真正的精髓,我們當然要用極限畫質下的光追遊戲來考驗RTX 4080的強悍性能。

同樣先來看看《古墓麗影:暗影》。之前在4K下不開光追,RTX 4080比RTX 3080 Ti的提升有39%,開啟光追後,提升進一步加大到了43%,雖然光追核心不如RTX 3080 Ti多,但RTX 4080的光追單元畢竟高出一代,同時頻率也高很多,所以性能大幅提升也是情理之中。

《地鐵:離去 增強版》4K下,RTX 3080 Ti不開DLSS已經只有35 fps了,即使開啟DLSS質量模式也達不到60 fps。RTX 4080在4K下的優勢達到了49%,開啟DLSS還可以跑到80 fps。

《看門狗:軍團》的硬件要求也比較高,也是同樣的情況,RTX 3080 Ti在開啟DLSS的情況下才能勉強達到4K/60 fps,RTX 4080在4K下有接近40%的優勢,開啟DLSS更是可以跑到79 fps。

《Control》中的表現也沒有什麼意外,不過在這裡RTX 4080相對於RTX 3080 Ti的優勢稍微小一些,4K下提升為26%,開啟DLSS後提升為31%。

《孤島驚魂6》再次展現了它對旗艦顯卡的優化不足,遊戲中2K分辨率下RTX 4080和RTX 4090的幀率居然是一樣的。不過4K下的表現就比較正常了,RTX 4080比RTX 3080 Ti高了27%。

硬件殺手遊戲《我的世界》RTX版里,DLSS默認就是和光追綁定的,開光追默認就開DLSS,如果手動關掉的話,RTX 3080 Ti就只有36 fps了,不過RTX 4080還是能接近60 fps,提升達到了50%,如果開啟DLSS的話,優勢可以達到55%。

賽車遊戲《F1 22》中,RTX 4080相對於RTX 3080 Ti的提升同樣在30%以上,自己則落後RTX 4090大約25%。

此外,我們還測試了《光明記憶:無限》《毀滅戰士:永恆》《生化危機8》,在這3款遊戲中,開啟光追後RTX 4080相對於RTX 3080 Ti在4K下的提升也都在40%以上。

總體來看,綜合這些遊戲的表現,在開啟光追後,RTX 4080相對於RTX 3080 Ti的提升大約為40%,達到了RTX 4090大約72%的性能。開啟DLSS後,RTX 4080相對於RTX 3080 Ti的提升為41%,和RTX 4090的差距大約為26%。

DLSS 3測試

我們知道,DLSS 3是RTX 40系列的重頭戲,它由DLSS 2超分辨率+幀生成+REFLEX三大部分組成。從RTX 4090發佈到現在支持DLSS 3的遊戲幾乎每月都在遞增,這次我們選取了其中幾款進行了測試(使用NVIDIA FramView工具監測幀率與PCL延遲)。

《賽博朋克2077》在4K超級光追預設下,RTX 4080開啟DLSS 3性能模式後,幀數從30 fps暴增至114 fps,如果和RTX 3080 Ti開DLSS 2性能模式相比,則提升了近一倍。

《生死輪迴》中RTX 4080開啟DLSS 3後可以提升近100 fps,RTX 3080 Ti開DLSS 2的話只有92 fps,RTX 4080的DLSS 3優勢還是比較明顯。

《瘟疫傳說:安魂曲》原生4K最高畫質下RTX 4080能跑到接近60 fps,開DLSS 3後暴增至160 fps,接近原生的2.8倍。對比RTX 3080 Ti開DLSS 2的表現,則是1.7倍。

二次元遊戲《幻塔》這次在新技術的支持上終於還是走到了老對頭米哈游前面,新版將加入光追和DLSS 3。從測試來看,開啟DLSS 3後RTX 4080的幀率是不開的3.3倍,對比RTX 3080 Ti開DLSS 2則是1.6倍。這種遊戲畫風開DLSS對畫質的影響其實很小,加入DLSS是個不錯的選擇。

《光明記憶:無限》開啟DLSS 3後,RTX 4080能跑到原生4K約2.5倍的幀率,約是RTX 3080 Ti開DLSS 2的1.5倍。

《微軟模擬飛行2020》在最新的UPDATE11更新後,性能表現變得更好。測試選用重慶到成都的航線,原生4K下RTX 4080能跑到74 fps,開啟DLSS 3性能模式後可以提升到172 fps,大概是原生的2.3倍。

延遲方面,由於RTX 40系自帶光流加速器,通過DLSS 3的光學多幀生成實現了更高的幀率,並通過Reflex有效降低了延遲,所以我們可以看所有測試的遊戲中,開啟DLSS 3的情況下PCL延遲都是遠遠低於4K原生設置的。因此,用RTX 40系顯卡玩支持DLSS 3的遊戲,請一定記得在遊戲中打開DLSS 3,不但畫面細節更豐富、遊戲幀率更高,操控延遲也會變得更低,體驗也就更加迅捷絲滑了。

DLSS 3畫質方面,從《賽博朋克2077》的截圖可以看到,即便是DLSS 3性能模式,畫面細節方面和原生也幾乎沒有什麼差別,質量模式更是完全看不出差別了。玩家完全可以放心開啟DLSS 3,同時享受精美的畫面與流暢的幀率。

此外,在RTX 40系列發佈之後,眾多DLSS 3遊戲也陸續到來。當11月15日GeForce RTX 4080發佈時,已有10款DLSS 3遊戲發佈,包括《瘟疫傳說:安魂曲》、《光明記憶:無限》、《毀滅全人類2:重新探測》、《暗影火炬城》、《F1 2022》、《逆水寒》、《生死輪迴》、《漫威蜘蛛俠:重製版》、《微軟模擬飛行》和《超級人類》。此外《WRC Generations》、《極品飛車:不羈》和《戰錘40K:暗潮》在RTX 4080推出後不久就會發佈,聖誕節前玩家就可暢玩這些DLSS 3遊戲。

生產力測試

SPEC包含了大量的工業軟件測試項目,在最新的2020V3.1版本中,RTX 4080相對於RTX 3080 Ti的提升還是比較明顯的。其中Energy能源測試集的提升最大,是RTX 3080 Ti的2.1倍。其實RTX 4080的表現甚至比RTX 3090 Ti還好。

常規的3D渲染軟件方面,Blender Benchmark 3.3中,RTX 4080對比RTX 3080 Ti提升也比較明顯,其中monster和classroom的性能是RTX 3080 Ti的1.6倍左右,而junkshop也有30%的提升。

RTX 4080在V-Ray中的表現也還可以,無論是使用RTX還是CUDA相對於RTX 3080 Ti都能實現50%的渲染效率提升。而OC渲染器中的性能提升則高達35%以上。

視頻剪輯方面,從PR2022來看,RTX 4080依舊要強過RTX 3080Ti的,這還是在PR不支持雙編碼器的情況下。

至於達芬奇的話,做MagicMask魔法遮罩的效率提升也非常明顯,RTX 3080 Ti需要31秒完成的工作RTX 4080隻要20秒就可以搞定。

至於新的AV1編碼,我們簡單看看達芬奇的輸出效率,RTX 4080和RTX 4090在輸出時間上的區別非常小,但是雙編碼器相對RTX 3080 Ti來說確實做到了成倍的效率提升。

此外,如果不考慮顯存容量話的,RTX 4080的單卡生產力性能甚至比RTX 3090 Ti還好一點。

總而言之,RTX 4080可以說是RTX 4090之下最強的消費級生產力GPU,3D渲染方面的綜合性能超越RTX 3080 Ti接近50%,視頻編碼性能更是成倍的提升,再考慮到CUDA與NVIDIA STUDIO生態圈在業界無可匹敵的地位,RTX 4080確實非常值得設計師用戶選擇。

功率與溫度測試

溫度方面其實完全沒有什麼可擔心的,畢竟RTX 4080 FE採用了和RTX 4090 FE一樣大的散熱器,既然這套散熱器搞定RTX 4090都沒問題,那應付TGP 320W的RTX 4080就更沒問題了。

說到功耗,這裡就不得不多說幾句了,從RTX 4090發佈到現在RTX 4080上市,很多玩家可能看到這一代的旗艦和次旗艦的標稱TGP功耗都不算低。對於TGP功耗而言,其實它是GPU運行在Boost狀態下的上限限制,用更容易理解的話來說,它其實是功耗牆上限。而作為功耗上限,並不是指GPU在日常使用和遊戲中必須會達到的功耗。

由於採用了新的TSMC 4N NVIDIA定製工藝,使得RTX 40系列GPU有着更好的能耗比,在實現相同甚至更高的性能時,功耗更低。這就帶來一個現象,那就是在RTX 40系列GPU跑到TGP功耗上限前,頻率或電壓可能就已經達到了上限,所以它無需更高的功耗才能滿足性能釋放需求。而在上一代Ampere架構的GPU上,通常就需要跑到極限功耗才能完成最高性能釋放。從而造成了為什麼RTX 40系列GPU總是跑不滿功耗的錯覺,實際上這是因為能耗比提升,無需更高功耗。

我們使用NVIDIA FramView工具監測了一些RTX 4080 FE在一些遊戲4K分辨率下的功耗表現,可以看到在這些遊戲中的平均功耗都沒有達到320W的TGP功耗。但是作為對比的上代對位的RTX 3080 Ti,幾乎都是頂着350W的上限在跑。

如果我們簡單計算一下,以《微軟模擬飛行2020》(原生4K最高畫質下)為例,在該遊戲中RTX 4080的幀速是RTX 3080 Ti的1.32倍左右,但功耗只有後者的73%。這樣可以計算出在該遊戲中RTX 4080的能耗比達到了RTX 3080 Ti的1.7倍以上,可以說是表現非常出色了。

作為測試傳統,我們同樣也跑了一下3DMark Speedway的循環考機,並使用NVIDIA FramView工具監測功耗,可以看到,在該測試中,RTX 4080 FE的功耗為308W,GPU最高溫度也只有60℃,節點溫度也就70℃,GPU最高頻率跑到了2820MHz。新的TSMC 4N NVIDIA 定製工藝帶來的能效比提升確實是相當可觀的。

總結:旗艦中的甜品,Ada Lovelace「80」新戰力定義4K光追極致體驗

NVIDIA Ada Lovelace GPU架構為RTX 40系列帶來了革命性的進步,除了從TSMC 4N NVIDIA定製工藝獲得的超大芯片規模與高頻率增益之外,第三代RT Cores和第四代Tensor Cores也大顯神威,特別是全新加入的光流加速器,讓DLSS 3技術的光學多幀生成得以實現,從而大幅增加了遊戲幀率並降低了延遲。

RTX 4080作為RTX 40系列的次旗艦,從實測來看在DLSS的加持下也能讓主流遊戲以4K極致光追設定高幀率流暢運行,在支持DLSS 3的遊戲中幀率提升更是驚人,算得上是發燒級玩家的甜品級旗艦。

此外,從前面的生產力測試也可以看到,具備16GB大顯存的RTX 4080在3D渲染輸出與視頻剪輯方面相對RTX 3080 Ti也有巨幅的性能增幅,特別是視頻編碼性能甚至做到了翻倍,對生產力應用來講也可以稱得上是非常實用的高效工具。

在性能大幅提升的同時,RTX 4080的能耗比表現同樣也是比較不錯的。大部分遊戲中的實際功耗都在300W以下,在提供高性能的同時,也能更好的緩解玩家的功耗焦慮。

因此,對於追求發燒級遊戲體驗的玩家和追求高效率的設計師用戶來講,RTX 4080絕對算得上是當前的「甜品旗艦」選擇。而GeForce RTX 4080 Founders Edition作為來自NVIDIA原廠的信仰級遊戲神器,不但能提供4K光追遊戲極致體驗和出色的生產力性能,還擁有極高的收藏價值,非常值得N飯第一時間入手!