一、前言:性價比爆棚的GeForce RTX 40 SUPER系列顯卡
新一代的Ada Lovelace架構帶來了令人咋舌的能效比,RTX 40系列顯卡在性能相同的情況下,功耗只有上代一半甚至更低,只是價格并不是那么親民。
2024年1月9日,NVIDIA發(fā)布了GeForce RTX 40 SUPER系列顯卡,包括RTX 4070 SUPER、RTX 4070 Ti SUPER和RTX 4080 SUPER三款型號。
其中RTX 4070 SUPER以4899元的售價提供了接近于RTX 4070 Ti的性能;
而RTX 4070 Ti SUPER售價與RTX 4070 Ti同為6499元,但性能與9499元的RTX 4080相差無幾;
至于RTX 4080 SUPER,它在規(guī)格大幅度提升的情況下,將售價降到了8099元,比起RTX 4080足足便宜了1400元。
新一代RTX 40系列SUPER GPU的到來,瞬間讓NVIDIA顯卡性價比爆棚!

完整的AD104核心
RTX 4070 SUPER使用了與RTX 4070(Ti)相同的AD104核心。
完整的AD104核心共有7680個CUDA核心(分為5組GPC/30組TPC/60組SM)、240個第四代Tensor Core張量核心、60個第三代RT Core光追核心、240個紋理單元、80個ROP單元、3MB一級緩存、48MB二級緩存。

AD104-350核心(RTX 4070 SUPER)
RTX 4070 SUPER做了部分精簡,依然是5組GPC,只是將其中2組中的6個TPC減到了5個,也就是5組GPC、28個TPC、7168個流處理器、228個Tensor Core、56個RT Core、80個ROP單元、36MB二級緩存。
除了二級緩存之外,其他規(guī)格削減不到7%,而顯存規(guī)格維持不變,可以想象,它的性能會非常接近RTX 4070 Ti。
RTX 4070 SUPER的詳細規(guī)格參數(shù)如下:

二、圖賞:與RTX 4070長一樣 6+3相供電電路

包裝盒和RTX 4070公版差不多,區(qū)別在于原來是白字,現(xiàn)在改成了黑色字體。

開箱。


上面是RTX 4070 SUPER,下面是RTX 4070,長相也幾乎一模一樣,差別在于4070的金屬條是銀灰色,4070 SUPER是深黑色,而且還能反光。

背面。

依然是16Pin供電接口,不過功耗很低,完全不用擔心燒化接口的情況。

3個DP1.4和1個HDMI 2.1接口。

沒有用均熱板,和RTX 4070一樣,都是銅底+熱管的散熱設計。

依舊是RTX 4070的PCB版,非常mini,改造成ITX版型也不難。
6+3相供電電路設計,雖然簡單,但也足夠應付220W的TGP。

這是RTX 4070的PCB板,對比一下,二者區(qū)別在于RTX 4070多一個空焊位,也就是少一相供電。

PCB板背面。

RTX 4070 SUPER采用的是AD104-350核心,芯片面積295mm2,擁有358億晶體管。
GPU旁邊是6顆美光GDDR6X顯存,單顆2GB,總容量12GB,等效頻率21GHz,帶寬504GB/s。
三、理論性能測試:3DMark運行頻率可達2805MHz
測試平臺如下:

1、3DMark Fire Strike

在2K分辨率3DMark Fire Strike Extreme測試中,RTX 4070 SUPER圖形分數(shù)達到了24185分,核心溫度最高68℃,熱點溫度最高85℃,核心運行最高頻率為2805MHz,最高風扇轉速1397PM,整卡最高功耗222W。

在4K分辨率3DMark Fire Strike Ultra測試中,RTX 4070 SUPER圖形分數(shù)達到了12112分,核心溫度最高69℃,核心運行最高頻率為2805MHz,最高風扇轉速1397RPM,最高功耗222W。

2、3DMark Time Spy

在2K分辨率3DMark Time Spy測試中,RTX 4070 SUPER圖形分數(shù)達到了20649分,核心溫度最高753℃,核心運行最高頻率為2790Hz,最高風扇轉速2028RPM,最高功耗223W。

在4K分辨率3DMark Time Spy Extreme測試中,RTX 4070 SUPER圖形分數(shù)達到了9948分,核心溫度最高74℃,核心運行最高頻率為2790Hz,最高風扇轉速13990RPM,最高功耗224W。

四、1080P游戲性能測試:與RTX 3090 Ti旗鼓相當
1、刺客信條:英靈殿


2、地平線:零之曙光


3、孤島驚魂5


4、孤島驚魂6


5、古墓麗影:暗影


6、霍格沃茨之遺

7、極限競速:地平線5


8、賽博朋克2077


9、巫師3

10、無主之地3


11、星空


12、戰(zhàn)爭機器5


測試結果匯總如下:

在1080P分辨率下,RTX 4070 SUPER的性能與RTX 3090 Ti不相上下,差距僅有1%。比起RTX 4070強了13%,和RTX 4070 Ti相比就差了3%。
六、2K性能測試:強于RTX 3080 Ti
1、刺客信條:英靈殿


2、地平線:零之曙光


3、孤島驚魂5


4、孤島驚魂6


5、古墓麗影:暗影


6、霍格沃茨之遺

7、極限競速:地平線5


8、賽博朋克2077


9、巫師3

10、無主之地3


11、星空

12、戰(zhàn)爭機器5


測試數(shù)據(jù)匯總如下:

2K分辨率下,RTX 4070 SUPER依然比RTX 3080 Ti強2%,與RTX 4070相比,也有14%的優(yōu)勢,但是比RTX 4070 Ti則有5%的差距。
此外我們還測試了4K分辨率下的成績,匯總如下:

由于192Bit顯存位寬的關系,RTX 4070 SUPER在4K分辨率下的性能會明年不如RTX 3080 Ti,但大多數(shù)游戲依舊能保持60FPS以上的幀率。
我們測試的12款3A大作,有3款幀率低于60FPS,但這幾款游戲都支持DLSS 3,開啟之后幀率會有翻倍提升。
六、Stable Diffusion體驗:TensorRT加持 生圖速度提升350%
2023年9月,NVIDIA推出了用于Stable Diffusion Web UI 的TensorRT 加速插件,能讓具備Tensor單元的GeForce顯卡在Stable Diffusion Web UI中獲得翻倍的性能。
本次我們將對比SDXL加速方法與PyTorch xFormers(常規(guī)加速方法)的性能差異。

我們生成10張?zhí)沾髴?zhàn)圖像,分辨率1024*1024,使用PyTorch xFormers加速時,耗時9分17秒。

使用SDXL加速之后,耗時僅為2分02秒,性能提升350%。

從終端中也可以看到,RTX 4070 SUPER使用默認加速器時,生圖速度只有1.1it/s,而在TensorRT加持下,生圖速度猛然提升到了4.50it/s。
七、DLSS 3游戲測試之一:3款DLSS 3游戲
此次我們一共測試了6款游戲,包括3款支持DLSS 3的游戲:《3DMark》、《毀滅全人類》、《燕云十六聲》。
另外還有3款同時支持DLSS與光追的游戲:《光明記憶》:《生死輪回》、《賽博朋克2077》。
所有DLSS 3以及光追測試都是在2K分辨率下進行。
1、DLSS3 測試--燕云十六聲
《燕云十六聲》是一款開放世界中國風武俠動作游戲,畫質精良,號稱國產(chǎn)3A破陣制作。目前這款游戲還處于內(nèi)測階段。

這款游戲于日前推送了對于DLSS 3支持的更新,下面我們來看看RTX 4070 SUPER SUPER的表現(xiàn),測試分辨率為2560*1440,畫質選項為“超高”。
默認超高畫質下,游戲幀率為91FPS。
開啟DLSS 2(性能模式)之后,幀率達到了146FPS,提升了60%。
打開DLSS 3(插幀)之后,幀率來到了198FPS,相比默認畫質幀率提升了117%。

2、3DMark

DLSS 2模式下幀率為140FPS,比默認的65FPS提升了133%。

DLSS 3的成績?yōu)?50FPS,相比默認提升了150%。

3、毀滅全人類2:重新探測
最高畫質下,RTX 4070 Ti的幀率為131FPS。
開啟DLSS 3之后,幀率來到了242FPS,近乎翻倍。

八、DLSS 3游戲測試之二:3款支持DLSS 3的光追游戲
1、光明記憶:無限
開啟RTX時,游戲的幀率為109FPS。
開啟DLSS 3之后,幀率提升到了235FPS,提升了116%。

2、生死輪回
開啟光追之后,游戲的幀率僅有65FPS。
打開DLSS 3之后,幀率提升到了195FPS,提升幅度為195%。

3、賽博朋克2077
開啟光追時,幀率為40FPS。
這是DLSS 3的畫面,與原生畫面的差距難以分辨,但是幀率提升到了155FPS。


九、功耗測試:2K游戲平均功耗僅為3080 Ti的62%

將Furmark的參數(shù)設定為1920*1200分辨率、0AA。
運行13分鐘之后,RTX 4070 SUPER的溫度穩(wěn)定在74度附近,功耗穩(wěn)定在220W,烤機時GPU頻率為1620MHz,CPU風扇轉速只有2153RPM。
2)、真實游戲功耗測試
1、GTA V
這是1080P分辨率。RTX 4070 SUPER功耗126W,溫度53度。

2K分辨率下,RTX 4070 SUPER功耗164W。
2、絕地求生

1080P分辨率下,RTX 4070 SUPER功耗203W,溫度689度,運行頻率2760MHz。

2K分辨率下,RTX 4070 SUPER0功耗212W。
3、古墓麗影:暗影

1080P分辨率下,RTX 4070 SUPER的功耗為207W。

2K分辨率下,RTX 4070 SUPER功耗是212W,運行頻率2745MHz,溫度64度。
測試數(shù)據(jù)匯總如下:

在1080P分辨率下,RTX 4070 SUPER在3A游戲中的平均功耗不到200W,2K分辨率也只有207W;就算是到了4K分辨率,平均功耗也只有214W,僅相當于RTX 3080 Ti的62%。
十、總結:堪稱業(yè)界良心
本次測試小結如下:
1、AI性能
即使沒有TensorRT 加速插件,RTX 40系列GPU也是Stable Diffusion畫圖首選,而今在TensorRT加持下,RTX 4070 SUPER的生圖速度在原有基礎上提升了350%,這樣的表現(xiàn)相信是不會再有任何競爭對手了。
2、1080P游戲性能

我們所測的12款游戲,除了《星空》之外 ,剩余11款游戲RTX 4070 SUPER的幀率全部都超過了160FPS,就連顯卡殺手《賽博朋克2077》也有169FPS。
就性能而言,1080P分辨率下,RTX 4070 SUPER幾乎能與RTX 3090 Ti并駕齊驅,相比RTX 3080 Ti強了6%,比RTX 4070則強了13%,和4070 Ti的差距只有3%。
3、2K游戲性能

2K分辨率下,同樣是除了《星空》之外,RTX 4070 SUPER在其他11款游戲中都能保持120FPS以上的幀率。
在2K分辨率下,RTX 4070 SUPER依舊能比RTX 3080 Ti強2%,不過和RTX 4070 Ti的差距也拉大到了5%,比起RTX 4070則強了15%左右。
另外,我們也測試了4K,RTX 4070 SUPER在此分辨率下幀率會有較大損失,不過在絕大部分游戲中依舊能夠跑出60FPS以上的幀率。
少數(shù)幾款顯卡殺手游戲雖然幀率只有50PFS左右,但好在這些游戲都支持DLSS 3,開啟之后幀率甚至能突破100FPS。
4、功耗

我們測試了6款3A大作的真實游戲功耗,在1080P分辨率下,RTX 4070 SUPER的平均功耗是192W,而RTX 3080 Ti是312W。
2K分辨率下,RTX 4070 SUPER在6款游戲中的平均功耗是207W,RTX 3080 Ti則是332W。
4K分辨率下,RTX 4070 SUPER在6款游戲中的平均功耗為214W,RTX 3080 Ti則已經(jīng)跑到了350W的TGP上限。
5、DLSS 3和光追
目前能玩的DLSS 3游戲多達數(shù)十款,我們測試了6款。
在開啟DLSS 2之后,游戲幀率平均提升幅度為107%。打開DLSS 3,游戲幀率平均提升幅度達到了159%。
如今的NVIDIA GPU早已不是單純的游戲顯卡,特別是在AI應用方面,有了SDXL,能將Stable Diffusion生圖速度提升4倍左右,讓原本已經(jīng)大幅度領先對手的N卡徹底無敵。
至于價格,4899元就能買到一塊1080P性能堪比RTX 3090 Ti、2K性能強于RTX 3080 Ti的顯卡,同時游戲功耗僅有200W左右,堪稱業(yè)界良心。
RTX 4070 SUPER只是開始,接下來的RTX 4070 Ti SUPER和RTX 4080 SUPER將會帶來更多的驚喜。
NVIDIAGeForceRTX40SIUPER系列現(xiàn)已上市,請到京東DIYSUPER超能年貨節(jié)上選購GeForceRTX4070SUPER/4080SUPER公版和合作伙伴顯卡。
審核編輯:劉清
-
NVIDIA
+關注
關注
14文章
5696瀏覽量
110142 -
流處理器
+關注
關注
1文章
45瀏覽量
9643 -
CUDA
+關注
關注
0文章
128瀏覽量
14555 -
GPU芯片
+關注
關注
1文章
307瀏覽量
6562
原文標題:2024年的第一張良心顯卡!RTX 4070 SUPER首發(fā)評測
文章出處:【微信號:hdworld16,微信公眾號:硬件世界】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
Cadence 與 Google 合作,利用 ChipStack AI Super Agent 在 Google Cloud 上擴展 AI 驅動的芯片設計
CMOS Super8 ROMLESS MCU:8位微控制器的新選擇
深入解析ADuM4070隔離式開關穩(wěn)壓器評估板
ADuM4070:隔離式開關穩(wěn)壓器的卓越之選
SCH5127 Super I/O 控制器:功能特性與設計應用解析
深入解析LTC4070:高效的Li - Ion/Polymer電池充電解決方案
NVIDIA RTX PRO 5000 Blackwell GPU的深度評測
NVIDIA RTX PRO 4000 Blackwell GPU性能測試
AI眼鏡卷出新高度:夸克AI眼鏡首發(fā)Super Raw暗光增強算法+合像距調(diào)節(jié)
PP-OCRv5 MCP服務器在海光主板的部署與實戰(zhàn)
NVIDIA RTX PRO 4500 Blackwell GPU測試分析
FX震撼發(fā)布全球首創(chuàng)FX Super One
NVIDIA RTX AI加速FLUX.1 Kontext現(xiàn)已開放下載
ADUM4070集成反饋功能的隔離式開關調(diào)節(jié)器技術手冊
RTX 4070 SUPER首發(fā)評測
評論