11 月 17 日晚,NVIDIA Geforce RTX4080 顯卡正式開售,之前IT之家已經給大家測試了公版 RTX4080 和幾張非公卡的表現,現在又一款索泰 RTX 4080 16GB 天啟 OC 顯卡也來到了我們手上,這張顯卡擁有 5 個風扇,其實際表現非常令人期待。
IT之家本次為索泰 RTX 4080 16GB 天啟 OC 搭建的測試平台具體配置如下圖所示,之前測試為了確保盡量採用統一平台,我們採用的主板是七彩虹的 Z790,但本次測試中我們發現,七彩虹的主板和索泰顯卡存在兼容性問題,無法順利通過自檢,所以只好臨時更換主板,此 BUG 已反饋給索泰和七彩虹官方,大家最近裝機時盡量避免用七彩虹主板配索泰顯卡:
外觀 ID 設計
索泰 RTX 4080 天啟 OC 顯卡正面採用三風扇設計,風扇四周由整片銀白色的銀鱗裝甲包裹,並輔以少量黑色塗裝,增加辨識度和顯卡質感的同時,也有效提升顯卡正面結構強度。
3 個 11cm 仿生盾鱗 2.0 設計的風扇面積很大,單片扇葉相比前代面積也要更大,表面設計了鱗庄仿生條紋並優化了扇葉曲率,以提升風扇的風量、風壓和風流,且支持 FREEZE 風扇啟停技術。
顯卡背面採用黑色合金背板,一定程度上為顯卡內部 PCB 提供防撞、防靜電保障。背板部分上的兩枚風扇分別為吹風、抽風設計,幫助顯卡整體風流更順暢,散熱更出色。同時,風扇配合背板上的天啟之翼圖案,共同組成了會發光的完整天啟之翼 2.0,讓外觀更具特色。
顯卡的一側可以看到在居中位置有一個索泰 Logo 的發光燈牌,旁邊是 GEFORCE RTX 的字樣。上方則是裸露出來的大面積加厚散熱鰭片模組。索泰 RTX 4080 天啟 OC 顯卡全新升級後的 VC 散熱系統由大面積散熱版、高密度鍍鎳鰭片以及對流穿透散熱等設計組成。
索泰 RTX 4080 天啟 OC 顯卡採用半包裹設計,風扇部分均採用雙滾珠軸承設計,減少風扇運轉摩擦,進一步降低風扇運轉噪音,延長風扇壽命。
顯卡頂部設有雙 BIOS 切換按鍵,為玩家提供加速和寂靜兩種風扇控制模式,可在遊戲過程中使用顯卡上的按鈕切換風扇散熱策略。12+4P 供電接口在金屬端子上整體鍍金,有效減少氧化,並降低電源線和接口的接觸阻抗。
索泰 RTX 4080 天啟 OC 顯卡的正面、背面以及頂部位置設有三處 RGB 燈光顯示區域,均支持 1600 萬色的數十萬種燈效循環模式。正面燈光由透光鑽切幻彩呼吸燈支組成,只亮中間一個大風扇的設計非常少見。
亮機後,頂部的索泰 Logo 燈牌會呈現出鏡面半透明呼吸燈的效果,進一步增加機箱內的燈光氛圍感。而背部的兩把風扇自然也會同時亮起,並展現流光效果,配合顯卡背板上的圖案,組成真正的完全體天啟之翼。
簡單技術解析
索泰 RTX 4080 16GB 天啟 OC 基於全新一代 NVIDIA Ada Lovelace 架構 AD103 核心打造,採用了 TSMC 4N 工藝,9728 個 CUDA 核心、304 個 Tensor 核心、112 個 ROP 單元。相對於公版 RTX4080,這張卡還採用了 24+3 相超豪華供電,新型 12+4P 接口,超越公版配置同時電氣性能更好。
索泰 RTX 4080 16GB 天啟 OC 的顯存提升到了 16GB GDDR6X 類型,顯存位寬 256-bit,大顯存最大的好處就是不再擔心遊戲中的爆顯存問題,對生產力創作更加優化,而且顯卡核心頻率 2205MHz,加速頻率 2580MHz,顯存頻率高達 22.4Gbps,提升非常恐怖。
第三代 RTX Cores 得益於 Ada 全新旗艦架構,光追性能最高可提升至 2 倍,NVIDIA DLSS 3 也進行了全面進化,相比 DLSS 2 增加了幀生成技術,能夠預測幀和幀之間的運動變化,實現 AI 插幀,在保持圖像質量的同時實現更高的幀率。這些技術自然是利好於遊戲玩家的,RTX4080 在次世代遊戲中的表現令人期待。
RTX4080 擁有高達 83TFLOPS 的着色器能力,吞吐量超過上一代產品 2 倍。第四代 Tensor Cores 可將吞吐量提升 4 倍,達到 1.4Tensor-petaFLOPS,AI 性能提升至 2 倍。雙 NVIDIA 編碼器還支持了 AV1 編碼,效率比 H.264 高 40%,廣大遊戲主播,視頻通話和視頻創意工作者都能享受到它所帶來的畫質提升和效率提升。
而能效比方面,通過 TSMC4N 定製工藝,可實現高達 2 倍的功耗比提升,索泰 RTX 4080 16GB 天啟 OC 的預設功耗為 320W,考慮到性能的巨大提升,能效比的優勢將會更加突出。
理論性能測試
下面我們開始進行實測環節。首先是 FurMark 烤機測試,雙烤 10 分鐘甜甜圈 + AIDA64,核心溫度穩定在了 61.0℃,比相同測試平台的公版 GTX4080 還要低 3℃,功耗保持在滿血 320W,風扇轉速僅為 31%,是我們測過的幾張 RTX4080 中運行最安靜的,果然 5 個風扇還是有些優勢的。
在 3D Mark 壓力測試中,索泰 RTX 4080 16GB 天啟 OC 顯卡的最終得分為 99.4%,性能釋放穩定,輕鬆超過 97% 的合格率。
3D Mark 單項測試部分,首先在反映 DX12 遊戲性能的 Time Spy 測試中,索泰 RTX 4080 16GB 天啟 OC 顯卡分數達到了 26894 分,作為對比,相同測試平台的公版 RTX4080 分數為 26552 分,GeForce RTX 3080 10G 版的分數為 17306 分,RTX 3090 的分數為 18981 分,RTX 3090Ti 為 21862 分。索泰 RTX 4080 16GB 天啟 OC 顯卡全面領先 RTX30 系,也超越了公版 RTX4080。
在反映 DX11 遊戲性能的 Fire Strike 測試中,索泰 RTX 4080 16GB 天啟 OC 顯卡分數達到了 63192 分,作為對比,相同測試平台的公版 RTX4080 分數為 53379 分,索泰領先了將近 10000 分。另外,GeForce RTX 3080 10G 版的分數為 40932 分,GeForce RTX 3090 的分數為 46045 分,GeForce RTX 3090Ti 為 52630 分。
在 3DMark Portal Royal 光追測試中,索泰 RTX 4080 16GB 天啟 OC 顯卡獲得了 17405 分,比 GeForce RTX 3080 提升了大約 50%,提升幅度比光柵性能來得更大。
索泰 RTX 4080 16GB 天啟 OC 顯卡在理論跑分中的成績給了我們不小的驚喜,給大家製作了一份 GPU 物理分數的對比表,在所有項目中索泰 RTX 4080 16GB 天啟 OC 相比於前代幾張旗艦顯卡都有着明顯的提升。
NVIDIA DLSS 3 解析
雖然理論性能已經超越了所有的 RTX 30 系顯卡,但真正重磅的提升還要屬 DLSS 3 技術。DLSS 3 是一款由全新第四代 Tensor Core 和 GeForce RTX 40 系列 GPU 的全新光流加速器驅動,以 AI 技術為核心的性能倍增技術,是 NVIDIA 深度學習超級採樣技術的最新版本,並擁有開創性的光學幀生成技術,將開啟 NVIDIA RTX 神經網絡渲染遊戲和應用的新時代。
基於 NVIDIA Ada Lovelace 架構的光流加速器可分析兩幀連續的遊戲圖像,並計算幀到幀中物體和元素的運動矢量數據,而無需傳統遊戲引擎進行建模。幀生成模型同時獲取遊戲引擎中的運動矢量和光流數據,這極大地減少了 AI 在渲染諸如粒子、反射、陰影和光照等元素時的視覺異常。
簡單地說,過去的 DLSS 2 是通過渲染出一個低分辨率圖像,然後 AI 放大至高分辨率,實現畫質與幀數的提升。而全新的 DLSS 3 在兼容 DLSS 2 的基礎上,還新增了幀生成功能,可以在兩個真實幀之間插入 AI 推算出來的全新幀,實現幀數的倍增。再結合 DLSS 2 的超分辨率功能,AI 能重建至多八分之七的顯示像素,與沒有 DLSS 相比,遊戲性能最高可提升 4 倍!
那麼我們同樣通過實測看看新卡的表現吧。最新版的 3DMark 已經適配了 DLSS 3 的 BenchMark,我們把索泰 RTX 4080 16GB 天啟 OC 顯卡的測試結果和 DLSS 2 進行控制變量的對比,可以直觀地看出差異。
經過IT之家的實測,在 DLSS 2 模式下,索泰 RTX 4080 16GB 天啟 OC 顯卡的平均幀數為 99.41 幀,這個成績粗略估算下相比於不開 DLSS 2 提升了 2.5 倍。
而開啟了最新的 DLSS 3 之後,索泰 RTX 4080 16GB 天啟 OC 顯卡的平均幀數進一步提升到了 127.75 幀,粗略估算下相比於不開 DLSS 2 提升了 3.3 倍。
當然,新技術最大的問題在於能否快速適配新遊戲,顯然 NVIDIA 在這方面做得很不錯,不僅首批 DLSS 3 的遊戲陣容非常豪華,而且只要適配了 DLSS 3,就能向下兼容 DLSS 2,這將大幅減小開發者的適配難度,玩家也能最大化的獲益。本次我們選取了《賽博朋克 2077》《超級人類》《光明記憶:無限》和《生死輪迴》等多款已經適配了 DLSS 3 的遊戲來對索泰 RTX 4080 16GB 天啟 OC 顯卡進行測試。
首先是近期很火的 3A 遊戲《瘟疫傳說:安魂曲》,幀數提升的效果更加明顯。默認狀態下還是達不到 60 幀的,但在 DLSS 技術加持下,開到性能檔即可實現 2.5 倍左右的幀數提升。如果打開 DLSS 3 + 超級性能,那麼幀數甚至可以實現 3 倍多的暴增。
在《絕地求生》開發商藍洞的新作《超級人類》中,同樣提供了 DLSS 3 的選項。在開啟 DLSS 3 性能檔之後,幀數有 60% 的提升,而在 DLSS 3 超級性能下的幀數更是可以提升到一倍。
非常考驗 GPU 性能的《賽博朋克:2077》,在 4K 超級光追的最高畫質下進行自帶 BenchMark 測試,從結果來看它對 GPU 性能的壓力確實不小,DLSS 全關時的幀數只有 75,而打開 DLSS 3 並選擇性能檔後,幀數提升到 108 幀,增幅高達 44%,直接晉陞電競級的 3A 光追體驗。
接下來我們來測試一款非常吃 GPU 性能的網絡端游《幻塔》,曾幾何時《幻塔》還只是一款手游,但沒想到 PC 端居然直接把畫質拉到最大,NVIDIA 的顯卡新特性幾乎都用上了,它提供了完整的 RTX+DLSS 2+DLSS 3 的支持,開啟 RTX 後,地面的反射明顯更加真實,賽博都市的感覺栩栩如生。
當然,實際打開光追效果後,確實非常考驗顯卡性能,4K 最高畫質下只有不到 50 幀,玩起來肯定不會很流暢,但是當我們開啟 DLSS 3 的性能檔之後,幀數漲了接近 1.5 倍,來到 116 幀,一下子就變成電競級的體驗了,要知道這可是 4K 光追畫質。
遊戲延遲測試
當然,DLSS 3 技術的本質是 AI 生成全新幀,那麼它必定會帶來延遲增加這個副作用,對於操作精度要求很高的遊戲來說,ms 級的延遲差異,也會影響玩家的體驗和手感。所以在打開 DLSS 3 的幀生成功能之後,NVIDIA Reflex 也會被強制打開,盡量縮短生成幀帶來的渲染延遲。
在同樣是 FPS 競技網遊的《守望先鋒:歸來》中,也提供了 NVIDIA Reflex 低延遲選項,它使 CPU 能夠在完成前一幀之前就開始向 GPU 提交渲染工作,從而大大減少甚至消除渲染隊列,響應時間也就更快。經過實測,在開啟了增強 Reflex 選項後,延遲降低了 62%。
4K 遊戲測試
除了支持 DLSS 3 的大作外,IT之家也為大家測試了幾款主流遊戲。畢竟目前來說,支持 DLSS 2 的「老」3A 遊戲數量非常龐大。
在《古墓麗影: 暗影》中,實測在 4K 分辨率最高畫質下即便不開啟 DLSS,索泰 RTX 4080 16GB 天啟 OC 也能在運行基準測試時跑到 137 幀,已經能夠滿足 4K / 144Hz 的顯示器暢玩了。
這款遊戲也支持 DLSS 2 技術,在開啟 DLSS 2 後,幀數最高可以提升 80% 左右。所有的項目也都比公版略高一些,已經可以挑戰未來的 8K 遊戲了。
最後我們測試一款光追 3A 大作《控制:終極版》,4K 最高畫質最高光追下不開 DLSS,情況和幻塔一樣,也是不到 50 幀,但是在開啟了 DLSS 後幀數翻倍,這個體驗就比較出色了。經過一番測試,索泰 RTX 4080 16GB 天啟 OC 駕馭 4K 遊戲已經沒有任何問題了。
創意生產測試
索泰 RTX 4080 16GB 天啟 OC 的算力提升巨大,顯存方面也提升不小,藉助這些硬件和技術層面的升級,RTX4080 顯卡一定能在創意生產和深度學習方面帶來更高效率和更大潛力。通過安裝 NVIDIA Studio 驅動,來支持超過 75 款創意軟件調用 NVIDIA CUDA 核心的 AI 算力。
在建模渲染類軟件中,GeForce RTX4080 可以利用 CUDA 為工作提供硬件加速,目前幾乎所有的建模軟件都會對 NVIDIA 的 GPU 有優化,所以能做到效率、穩定和兼容性的共存。比如在常用的渲染工具 V-Ray 中,可以藉助 RTX 加速的光線追蹤,實現高性能最終幀渲染。藉助搭載 AI 的降噪功能,GPU 可進一步加速交互式渲染。
在 V-Ray Benchmark 中,索泰 RTX 4080 16GB 天啟 OC 獲得了 3073 分,可以應對大部分的建模渲染需求。
得益於 Ada 全新旗艦架構,光追性能獲得大幅提升,索泰 RTX 4080 16GB 天啟 OC 在 V-Ray GPU RTX 中的分數提升至 4066 分,即使是實時光追的高渲染壓力也能從容應對。
還有就是雙 NVIDIA 編碼器支持了 AV1 編碼。AV1 是下一代的視頻編碼技術,能夠在佔用相同空間情況下,提供更加快速的視頻編碼和更高質量的流媒體傳輸性能。這個編碼格式在目前的主流多媒體應用中已經非常普遍了,比如國內的剪輯軟件剪映專業版就已經支持了 AV1 的視頻編碼器加速,還有 OBS 直播軟件,目前也支持了 NVENC 的 AV1 編碼的錄製。
AV1 成為趨勢既是科技進步的結果,也戳中了行業對於生產力需求的痛點,那就是大幅壓縮視頻文件的體積大小,同時保證畫質幾乎不受影響。
我們對此也進行了一項簡單的測試,通過剪輯專業版軟件採用 H264 和 AV1 這兩種不同的編碼導出同一段視頻素材。最終 H264 編碼的文件大小為 159MB,而 AV1 編碼的文件大小只有 127MB,體積縮小了 21%,但是畫質基本看不出區別。
最後是 PugetBench For Davinci 的渲染測試。基於 NVIDIA CUDA 技術的 GPU 加速特效可實現更快速度的實時視頻編輯和幀渲染,使用 NVIDIA 編碼的輸出速度提升最高可達 5 倍。索泰 RTX 4080 16GB 天啟 OC 在該測試中得到了 2547 分的成績,8K 視頻剪輯再不用開代理了。
總結
索泰 RTX 4080 16GB 天啟 OC 這次給我留下的深刻印象,不僅是它強悍的硬件性能,更是因為 RTX4080 擁有着強大的 AI 算力和技術,無論是 NVIDIA DLSS 3、DLSS 插幀技術還是 NVIDIA Reflax 低延遲技術,它們帶給玩家的遊戲體驗提升都是實打實的,立竿見影的,看得見摸得着的。
索泰 RTX 4080 16GB 天啟 OC 的外觀設計也很有意思,背部的兩個風扇可以更好地幫助顯卡抽風和吹風,讓散熱更有效率。同時,風扇在亮起 RGB 後配合背板上的天啟之翼圖案,也頗為新穎獨特。總之,如果你對顯卡性能有遊戲體驗有着較高的追求,特別是 4K 高幀遊戲體驗的話,索泰 RTX 4080 16GB 天啟 OC 一定能滿足你