一、前言:更貼近主流玩家的rtx 5070
nvidia rtx 50系列顯卡從高到低依次發佈,現在來到我們快科技評測室的是nvidia geforce rtx 5070 founders edition公版卡,定位於中高端,更加貼近主流玩家,但這一次,它在4k遊戲下也有一戰之力。
rtx 5070同樣採用nvidia定製的台積電4n製程工藝,全新的blackwell gpu架構,不同於rtx 5070 ti的gb203核心,rtx 5070使用的核心代號為gb205。
定位於中高端的gb205核心晶體管數為311億,比rtx 5070 ti的456億大幅減少了約三分之一,這一點從售價上也能看出來。
rtx 5070 gpu包含5組gpcs,6144個cuda核心(流處理器),192個第5代tensor core張量核心、48個第4代rt core光追核心、192個紋理單元、80個rop單元和48mb二級緩存。
顯存方面同樣是28gbps的三星gddr7顯存,192bit位寬,12gb容量,顯存帶寬672gb/s,額定功耗250w。
rtx 5070官方建議零售價為4599 元起,對比上代rtx 4070便宜了200元。
rtx 5070的詳細規格參數如下:
二、外觀圖賞:公版顯卡頂級做工 標準雙槽規格
nvidia geforce rtx 5070公版顯卡同樣是使用了rtx 50系列的骨頭形環保包裝,表面沒有設計任何印刷字樣,正面的型號信息也是凹印的,確實非常環保。
打開後就可以直接看到顯卡本體,也是公版顯卡極具特色的沙漏型設計。
rtx 5070公版顯卡看上去和rtx 5080公版顯卡幾乎一模一樣,只是小了一圈,而且從散熱器透光情況,沒有採用rtx 5080那種pcb居中前後風扇穿透式散熱。
rtx 5070正面的雙風扇設計。
同上一代rtx 4070相比,公版的rtx 5070減少了大量的外部散熱鰭片設計,讓外殼整體更加光滑。
顯卡頂部和底部的散熱窗口也小了很多,暗示這一代rtx 5070的功耗和發熱會有更優秀的表現。
公版rtx 5070顯卡是非常標準的雙槽卡規格,擋板處設計有散熱鏤空,提供了三個displayport 2.1b接口和一個hdmi 2.1b接口。
顯卡頂部傾斜設計的12v-2*6 16pin顯卡供電接口特寫。
顯卡風扇特寫,可以看到前部風散下方的散熱鰭片是水平走向,動過形成的風道將熱量像前後方嚮導出,尾部風扇下方的散熱鰭片則是垂直走向的,更方便熱管散熱。
取下的散熱器本體,可以看到gpu部分是銅底接觸,複雜的風道設計不但讓前後散熱鰭片走向不一致,也帶來了極為複雜的熱管設計。
nvidia rtx 5070公版顯卡的pcb採用了不規則造型,尾部燕尾型設計給沙漏型散熱器的尾部軸流風扇讓出了風道。
主要原件都安裝在pcb的正面,背面只有一些供電元件。
rtx 5070 gpu芯片特寫,芯片編號為gb205-300。
來自三星的gddr7顯存顆粒特寫,gpu作為一共布置了六顆顯存顆粒,共同構成12gb的顯存容量。
顯卡供電部分特寫。
三、理論性能測試:趕超rtx 4070 ti 進步幅度明顯
1、speed way
在3dmark測試綜合性能的speed way測試中,rtx 5070顯卡的總成績為5839,其中顯卡測試成績為58.39fps。
2、steel nomad
在3dmark中測試可靠性、穩定性和持續性能的steel nomad測試中,rtx 5070顯卡的總成績為5094,其中顯卡測試成績為50.95ps。
3、port royal
在3dmark中測試實時光追性能的prot royal測試中,rtx 5070顯卡的總成績為13933,其中顯卡測試成績為64.51fps。
4、time spy
在3dmark的time spy(dx12+2k渲染分辨率)測試中,rtx 5070顯卡的總成績為22294,其中顯卡分數為22123。
在3dmark的time spy extreme(dx12+4k渲染分辨率)測試中,rtx 5070顯卡的總成績為11005,其中顯卡分數為10645。
5、fire strike
在3dmark的fire strike(dx11+1080p渲染分辨率)測試中,rtx 5070顯卡的總成績為43532,其中顯卡分數為55306。
在3dmark的fire strike extreme(dx11+2k渲染分辨率)測試中,rtx 5070顯卡的總成績為27739,其中顯卡分數為28293。
在3dmark的fire strike ultra(dx11+4k渲染分辨率)測試中,rtx 5070顯卡的總成績為14539,其中顯卡分數為14082。
rtx 5070在3dmark測試中的成績對比上代的rtx 4070有明顯提高,平均成績提高了約30%,甚至可以略微超過rtx 4070 ti和amd rx 7900 gre,其中領先rtx 4070 ti約5%上下,對rx 7900 gre的優勢還要更大一些。
四、dlss 4性能測試:rtx 5070也能輕鬆享受4k最高畫質
dlss 4測試中我們使用了四款支持dlss 4的遊戲進行實測,都是在最高畫質設置之下,開啟光追和多幀生成技術,選擇最高級別的dlss 4x,實際記錄遊戲幀數。
考慮到rtx 5070的定位,我們對4k、2k和1080p三個分辨率都進行了測試。
1、《賽博朋克:2077》
在《賽博朋克:2077》中,我們使用「光線追蹤:超速」預設,並在dlss中選擇transformer模型,dlss超分辨率使用默認的自動,運行遊戲內置的性能測試工具。
使用transformer model時,《賽博朋克:2077》啟動dlss 4x後,在4k分辨率下平均幀數為115.03,2k分辨率下平均幀數為170.73,1080p分辨率下平均幀數為220.92。
2、《霍格沃茲之遺》
在《霍格沃茲之遺》中, dlss超分辨率設置為平衡,使用dlss 4x多幀生成和超高畫質,記錄不同分辨率下的遊戲幀數。
《霍格沃茲之遺》測試中,4k分辨率下遊戲幀數為263,2k分辨率下遊戲幀數為308,1080p分辨率下遊戲幀數為392。
3、《心靈殺手2》
在《心靈殺手2》中,使用dlss 4x多幀生成和最高畫質,記錄不同分辨率下的遊戲幀數。
《心靈殺手2》測試中,4k分辨率下遊戲幀數為48,2k分辨率下遊戲幀數為86,1080p分辨率下遊戲幀數為117。
4、《星球大戰:亡命之徒》
在《星球大戰:亡命之徒》中,使用dlss 4x多幀生成設置和超高畫質預設,圖像採樣質量設置為質量,記錄不同分辨率下的遊戲幀數。
《星球大戰:亡命之徒》測試中,在4k分辨率下遊戲幀數為140,3k分辨率下遊戲幀數為228,1080p分辨率下遊戲幀數為279。
dlss 4遊戲測試成績匯總如下:
dlss 4作為rtx 50系列顯卡最重要的新功能,在這四個dlss 4遊戲中,最少也有接近三倍的幀率提升,而且在4k分辨率下部分遊戲的幀率提升比例更高一些。
從實際幀數上來看,雖然在dlss關閉和dlss 2x時幀數表現比上一代rtx 4070 ti還略有落後,但開啟dlss 4之後幀數都能大幅反超,特別是在4k分辨率下,幀數領先優勢更大,而1080p分辨率則完全沒有必要了。
五、4k遊戲測試:幀數提高25% 壓力大幅減輕
在接下來的兩個4k、2k遊戲測試環節,我們只測試nvidia顯卡,全部型號開啟同樣的dlss設置,考察彼此之間的差異。
1、《黑神話·悟空》
在《黑神話·悟空》中,4k分辨率+影視級畫質下測試,使用dlss超分辨率,採樣精度50,啟用幀生成功能,測試成績為平均幀率59幀/秒,最低51幀/秒,95%幀率高於53幀/秒。
2、《極限競速:地平線5》
在《極限競速:地平線5》中,使用4k分辨率極端畫質測試,最終測試成績為145fps。
3、《戰爭機器5》
在《戰爭機器5》中,使用4k分辨率超高畫質測試,最終測試成績為80.2fps。
4、《地平線:零之曙光》
在《地平線:零之曙光》中,使用4k分辨率和終極質量畫質測試,最終測試成績為133fps。
5、《古墓麗影:暗影》
在《古墓麗影:暗影》中,使用4k分辨率和最高畫質測試,dlss超級採樣設置為質量,平均幀率為147。
6、《怪物獵人:荒野》
在《怪物獵人:荒野》中,使用4k分辨率和極高畫質測試,打開幀生成功能,最終測試成績為82.1fps。
4k遊戲成績匯總如下:
在4k遊戲中,rtx 5070比上代的rtx 4070成績提高約25%,基本和上代的rtx 4070 ti持平,但不同遊戲表現區別較大。
六、2k遊戲測試:不在話下 1080p分辨率該淘汰了
這一輪同樣都是nvidia顯卡,都開啟同樣的dlss設置。
1、《黑神話·悟空》
在《黑神話·悟空》中,影視級畫質下測試,使用dlss超分辨率,採樣精度50,啟用幀生成功能和光線追蹤,2k分辨率下成績為105,1080p分辨率下成績為142。
2、《極限競速:地平線5》
在《極限競速:地平線5》中,使用極端畫質測試,2k分辨率下成績為229,1080p分辨率下成績為284。
3、《戰爭機器5》
在《戰爭機器5》中,使用超高畫質測試,2k分辨率下成績為145.8,1080p分辨率下成績為202.5。
4、《地平線:零之曙光》
在《地平線:零之曙光》中,使用終極質量畫質測試,2k分辨率下成績為201,1080p分辨率下成績為230。
5、《古墓麗影:暗影》
在《古墓麗影:暗影》中,使用最高畫質測試,dlss超級採樣設置為質量,2k分辨率下成績為244,1080p分辨率下成績為279。
6、《怪物獵人:荒野》
在《怪物獵人:荒野》中,使用極高畫質測試,打開幀生成功能,2k分辨率下最終測試成績為115.53fps,,1080p分辨率下成績為115.53。
2k遊戲測試成績匯總如下:
同樣的rtx 5070在2k遊戲測試中,比上代rtx 4070成績提高約22%,和rtx 4070 ti性能基本持平,但也是在個別項目中成績差距較為明顯。
七:遊戲光柵性能測試:rtx 5070領先rx 7900 gre約17%
我們也同樣測試了關閉dls幀生成s、超分辨率和光線追蹤之後的遊戲性能表現,選取了《黑神話·悟空》、《古墓麗影:暗影》和《怪物獵人:荒野》三款遊戲進行測試,這次加入amd對應顯卡作對比。
1、《黑神話·悟空》
在《黑神話·悟空》中,我們使用影視級畫質,tsr超採樣,精度50,關閉幀生成,關閉光追,在不同分辨率下運行測試程序,4k分辨率下平均幀率為51,2k分辨率下平均幀率為70,1080p分辨率下平均幀率為81。
2、《古墓麗影:暗影》
在《古墓麗影:暗影》中,我們使用最高畫質,關閉超採樣,在不同分辨率下運行測試程序,4k分辨率下平均幀率為109,2k分辨率下平均幀率為213,1080p分辨率下平均幀率為273。
3、《怪物獵人:荒野》
在《怪物獵人:荒野》中,我們使用最高畫質,關閉超採樣,關閉光線追蹤,關閉幀生成,在不同分辨率下運行測試程序,4k分辨率下平均幀率為46.87,2k分辨率下平均幀率為77.73,1080p分辨率下平均幀率為100.35。
測試成績匯總如下:
在關閉幀生成和光追相關技術之後,rtx 5070顯卡的純粹光柵性能表現也輕鬆超越amd rx 7900 gre顯卡,平均幀數領先約17.6%。
八:生產力和ai性能測試:視頻性能優勢巨大 ai算力還需大模型適配
1、procyon:視頻編輯性能
我們使用procyon測試工具中的視頻編輯性能測試項目對rtx 5070顯卡進行測試,開啟procyon中的硬件加速選項後,就可以讓adobe premiere pro軟件充分利用rtx 5070 gpu的硬件編解碼性能。
最終測試成績為58762。
2、blender benchmark
blender是一個免費的3d建模渲染工具,它提供了一個測試程序可以用來對顯卡的性能渲染性能進行測試,在blender benchmark中提供的三個渲染場景中,rtx 5070顯卡的得分別為:2928.324448、1651.232397和1549.981349。
3、v-ray benchmark
v-ray是一款計算機圖像渲染軟件,它能夠提供精細的光照、全局照明、鏡頭失真模擬等核心功能,並且支持cpu和gpu渲染,可以製作出照片級別的渲染效果。此外,它還作為引擎被maya等3d建模渲染工具所使用,擁有相當廣的使用場景。
在針對顯卡的v-ray gpu rtx測試項目中,rtx 5070顯卡得分為6533。
4、procyon:文本推理性能
procyon中的ai text generation benchmark項目是一個簡化本地 llm ai 性能測試,提供了phi 3.5、misreal 7b、llama 3.1和llama 2四個不同參數大小的行業標準 ai 模型輕鬆快速地進行測試。
rtx 5070顯卡在測試中四個模型的得分分別是3301、3417、3503和2334。
生產力測試成績匯總如下:
生產力方面,rtx 5070的性能同樣穩步提升, rtx 5070所搭載的第九代nvidia編碼器和第六代nvidia編解碼器能效提升明顯,視頻編輯性能進步非常大。
九:烤機和功耗:能效再提升 比rtx 4070 ti功耗降低同時性能更強
我們使用furmark對rtx 5070顯卡進行15分鐘的烤機,室溫約22度,gpu功耗穩定在250w,核心頻率2340mhz,溫度75.7度,風扇轉速2500rpm。
我們使用3dmark進行壓力測試,連續運行20輪的speed way測試場景,運行期間rtx 5070顯卡核心頻率最高加速至2797mhz,最終測試成績穩定性為98.9%。
在《黑神話·悟空》和《賽博朋克2077》中,在4k最高畫質測試進行時,用nvidia frameview工具記錄下顯卡gpu功率的實時變化。
在《黑神話·悟空》4k測試中rtx 5070顯卡的平均功耗為205.65w,在《賽博朋克2077》4k測試中rtx 5070顯卡的平均功耗為202.5w。
十:總結:4k遊戲不再是高端玩家專屬 1080p已被淘汰
1、dlss 4
作為一款中高端顯卡,rtx 5070的定位要更貼近主流玩家而非發燒友,性能方面和上代的rtx 4070 ti基本持平也基本符合我們的預期。
但是在dlss 4技術的加持之下,4k遊戲的表現遠超其中高端的定位。
rtx 5070 顯卡在3dmark理論性能測試中,比上代的rtx 4070性能提高25%-30%,但在遊戲測試中,開啟dlss 4之後,比rtx 4070的dlss 3的幀率最少也有80%以上的提升,最極端的情況下甚至能有200%的提升。
從對比中也可以看出,遊戲對性能的要求越高,dlss 4技術帶來的幀率提升就越大,越是顯卡殺手,效果越好。
2、功耗
在功耗方面,rtx 5070顯卡的tdp為250w,比上代rtx 4070的200w高了一些。
但是,實測在4k遊戲中,rtx 5070的實際功耗也就略超過200w,和rtx 4070在4k遊戲中180w以上的功率相差不大,但性能表現要好得多。
3、4k遊戲
在遊戲測試中,即使是不支持dlss 4的遊戲,僅使用dlss 3和超分辨率技術,rtx 5070在4k分辨率下的性能也是完全夠用的,2k遊戲更是流暢。
即使是去年的《黑神話·悟空》,在2k分辨率下也輕鬆跑到100幀以上,而且未來支持dlss 4的遊戲肯定會越來越多。
至於1080p分辨率,已經該被淘汰了。
4、生產力
nvidia rtx 50系全系列標配的第九代nvenc編碼器和第六代nvdec解碼器效能非常高,雖然rtx 5070顯卡只搭載了各一個,但premiere pro視頻編輯性能測試中對上一代的rtx 4070 ti都有極大的優勢。
最後總結一下,雖然nvidia rtx 5070的額定功耗相比上一代的rtx 4070有所提高,但從實際測試來看,rtx 5070顯卡在4k遊戲中的實際功耗也就是剛剛超過200w,比rtx 4070的180w-185w的實際功耗提高不到10%,但實際性能提升約有30%,能效比更好。
同時,在dlss 4技術的加持之下,rtx 5070遊戲幀數的提高幅度更為驚人,讓4k高畫質遊戲不再只有發燒玩家才能享受,頂級顯卡的體驗現在已經來到了中高端,rtx 5070也可以流暢運行。在4k顯示器開始普及的今天,是該和1080p遊戲告別了。
除了遊戲之外,rtx 5070的ai算力和視頻編解碼能力也有提升,算力方面受限於大模型的支持程度還難以量化評估,但視頻編輯性能的提升是非常明顯的,對於有這方面需求的用戶來說,rtx 5070也是合適的選擇。