映眾RTX 4080 SUPER顯卡評測:游戲辦公皆出色,8099元價格美麗
北京時間1月31日晚10點,NVIDIA正式解禁了RTX 40 SUPER系列臺式機顯卡的第3款型號——RTX 4080
SUPER,其產(chǎn)品定位介于RTX 4080和RTX 4090之間。
先說一個好消息,早先的RTX 4080起售價為9499元,而全新的RTX 4080 SUPER起售價為8099元,NVIDIA這次把價格足足直降了1400元,降價幅度可謂相當(dāng)之大,對于高端用戶們來說無疑是頗具誘惑力的。
本月早些時候上市的RTX 4070 SUPER和RTX 4070 Ti SUPER均贏得了不錯的口碑?,F(xiàn)在對于全新RTX 4080 SUPER,它的表現(xiàn)又會如何?此次評測筆者將利用映眾RTX 4080 SUPER X3這款新顯卡,為大家揭曉答案。
Ada Lovelace架構(gòu)與全新的RTX 4080 SUPER
RTX 4080 SUPER基于英偉達Ada Lovelace架構(gòu)設(shè)計。為了讓大家更好地了解到這款新顯卡,筆者首先會對Ada Lovelace架構(gòu)以及所支持的一些重要技術(shù)進行介紹。
(一) RTX 40 SUPER系列臺式機顯卡第3彈——RTX 4080 SUPER
全新的RTX 4080 SUPER基于AD103-400顯示核心設(shè)計,擁有10240個CUDA核心,搭配16GB容量、256bit位寬的GDDR6X顯存。
算上RTX 4090和RTX 4090D,RTX 4080 SUPER是第3款CUDA核心數(shù)量過萬的RTX 40系列臺式機顯卡。
而之前的RTX 4080基于AD103-300顯示核心設(shè)計,擁有9728個CUDA核心,搭配16GB容量、256bit位寬的GDDR6X顯存。
對比CUDA核心數(shù)量,全新的RTX 4080 SUPER相比RTX 4080有著約5%的規(guī)格提升。
更高端的RTX 4090基于AD102-300顯示核心設(shè)計,擁有16384個CUDA核心,搭配24GB容量、384bit位寬的GDDR6X顯存。
從硬件規(guī)格來看,RTX 4080 SUPER相比RTX 4080小幅提升。而跟更高端的RTX 4090相比,硬件規(guī)格差距依舊是很大的。
(映眾RTX 4080 SUPER X3顯卡的GPU-Z信息)
本文選用的映眾RTX 4080 SUPER X3顯卡在頻率設(shè)置上與RTX 4080 SUPER創(chuàng)始人版保持一致,其GPU頻率為2295MHz,Boost頻率為2550MHz,顯存頻率為1438MHz(等效23000MHz)。
(二) Ada Lovelace架構(gòu)核心
(Ada Lovelace架構(gòu)核心)
(Ada Lovelace架構(gòu)核心GPC單元)
Ada Lovelace架構(gòu)核心配備了全新的第三代RT Core(光線追蹤核心)、第四代Tensor Core(張量核心)以及SM(流式多處理器)。根據(jù)NVIDIA官方的介紹,Ada Lovelace架構(gòu)核心所采用的第3代RT Core不僅將光線與三角形求交性能提高了一倍,還將RT-TFLOP峰值性能提高了一倍之多。第3代RT Core還配備了全新的Opacity Micromap (OMM)引擎和Displaced Micro-Mesh (DMM)引擎,進一步提升了光追計算的性能以及減少計算開銷,帶來了更好的光線追蹤效果表現(xiàn)。Ada Lovelace架構(gòu)核心配備的第四代Tensor Core引入了來自專業(yè)級H100數(shù)據(jù)中心GPU的FP8 Transformer引擎帶來了更加強悍的AI算力。
(第三代RT Core結(jié)構(gòu)示意圖,相比前代,增加了2個功能)
Ada Lovelace架構(gòu)核心在SM單元上引入了Shader Execution Reordering(SER著色器執(zhí)行重排序)技術(shù)來更好的對于著色器的工作進行調(diào)度排序,在使用上可以根據(jù)不同的負載需求來執(zhí)行渲染,可對負載較為統(tǒng)一的畫面進行渲染,降低工作開銷。根據(jù)英偉達官方的介紹,這一個SER功能將作為API開放給開發(fā)者使用。英偉達官方宣稱,SER功能的加入至高可帶來兩倍RT Core性能上的改善,對于光追游戲來說更可帶來體驗的升級。根據(jù)NVIDIA官方的數(shù)據(jù),全新的SM(流式單元處理器)可帶來至高兩倍的性能以及能效升級,這一項升級不可謂不小。
(Ada Lovelace架構(gòu)核心SM結(jié)構(gòu)圖)
Ada Lovelace架構(gòu)核心除了第三代RT Core(光線追蹤核心)、第四代Tensor Core(張量核心)以及SM(流式多處理器)的升級以外,帶來了全新的第八代NVENC硬件編碼器,這一全新的第八代NVENC硬件編碼器整合了對AV1視頻編碼格式的支持,可以在傳統(tǒng)的H.264等格式之外,加入了對AV1這一主流新標準的支持,可以進行對于AV1格式的編碼與解碼,有效提升了生產(chǎn)力方面的表現(xiàn),對于創(chuàng)作型用戶、游戲主播等群體來說更是如虎添翼。來自NVIDIA官方的數(shù)據(jù)顯示,第八代NVENC硬件編碼器在AV1的效率上比H.264編碼器的效率提高了40%,這一提升非常明顯。
而除了核心上的升級以外,Ada Lovelace架構(gòu)核心還大幅度提升了其L2緩存。其中RTX 4080 SUPER顯卡所采用的AD103-400顯示核心擁有64MB的L2緩存,L2緩存容量相比上一代RTX 3090 Ti顯卡(6MB L2緩存)可謂提升巨大。大容量的L2緩存帶來了數(shù)據(jù)命中率的有效提升,在現(xiàn)階段顯存帶寬提升有效的情況下,通過升級更大容量的L2緩存,可以進一步提升數(shù)據(jù)命中表現(xiàn),帶來性能方面的升級,根據(jù)NVIDIA官方的說法,大容量L2緩存的加入為GPU的一系列操作到帶來了更高的收益,尤其是在光線追蹤等場景下,表現(xiàn)更為明顯。
(三) DLSS 3與NVIDIA Reflex
Ada Lovelace架構(gòu)的一系列升級還帶來了全新的DLSS 3技術(shù)的獨占以及NVIDIA Reflex方面的體驗提升。
DLSS 3包含有DLSS 2(DLSS超分辨率技術(shù)),以及全新加入的DLSS幀生成技術(shù),這一項DLSS幀生成技術(shù)依托于Ada Lovelace架構(gòu)的獨立光流處理器以及Tensor Core的AI算力。在一項技術(shù)在運行過程中,其通過光流處理器所得到的一系列數(shù)據(jù)后,以光流加速技術(shù)(Optical Flow Acceleration,簡稱為OFA)來生成畫面信息,而AI算力則負責(zé)來對畫面進行進一步的優(yōu)化,從而在游戲中加入了更多的幀畫面,進行幀數(shù)的提升。
DLSS 3可直接生成游戲第1幀3/4的像素以及整個游戲第2幀,相當(dāng)于使用1/8的算力,就完成了整個計算過程,而通過這一個流程的循環(huán),可在提升幀數(shù)的同時節(jié)省資源開銷,進一步帶來更好游戲體驗。
而在DLSS 3的幀生成技術(shù)上,由于可能帶來延遲的增加,因此DLSS 3在使用上也將通過整合NVIDIA Reflex這一技術(shù)來降低渲染以及操作的延遲。而根據(jù)NVIDIA官方的說法,DLSS 3通過整合NVIDIA Reflex以及一系列的技術(shù),可以使得游戲體驗擁有媲美甚至是超越原生級的渲染、操作體驗。
目前DLSS 3版本已更新至DLSS 3.5。DLSS 3.5特別新增光線重建(Ray Reconstruction,簡稱RR),主要是解決目前光追游戲中人工設(shè)計的降噪器所帶來的畫面質(zhì)量問題。
在DLSS 3.5出現(xiàn)之前,降噪器的調(diào)整主要是交給游戲開發(fā)者來做的,也就是前文所說的人工設(shè)計的降噪器。降噪器會用前幾幀的圖像,以及混合鄰近的像素去達成填充畫面的目的。不過即便圖像是完整的,但是仍有一些缺陷,比如說多幀結(jié)合產(chǎn)生的鬼影,還有畫面細節(jié)上的缺失。為了得到較好的結(jié)果,一般多個降噪器會同時運行,這也對幀率造成了影響。而DLSS 3.5中的光線重建是人工設(shè)計降噪器的替代品。NVIDIA為其投入了DLSS 3的5倍訓(xùn)練數(shù)據(jù)量,因此它能識別出不同的光線追蹤效果,從而準確處理圖像中的每個像素。
映眾RTX 4080 SUPER X3顯卡欣賞
映眾RTX 4080 SUPER X3顯卡以黑、灰色為主色調(diào),雙槽厚度設(shè)計令其能夠兼容更多的機箱。該顯卡沒有設(shè)計RGB燈效,也沒有什么花哨的設(shè)計,低調(diào)不張揚。
由于采用的是3風(fēng)扇散熱設(shè)計,這款顯卡的尺寸比較長,實測約33.7cm。
顯卡背面設(shè)計了金屬背板,上面有一些鏤空設(shè)計,以便兼顧散熱效果。
顯卡輸出接口為三個DP 1.4以及一個HDMI 2.1。
散熱器頂部上面印有“INNO3D GEFORCE RTX”的字樣。
顯卡輔助供電接口為12VHPWR接口。
下面將散熱器拆卸下來,露出顯卡PCB,繼續(xù)欣賞一下它的用料。
這款顯卡雖然長度為33.7cm,但是它的PCB并不長。通過對比明顯能夠看出散熱器和背板比PCB長出很多。
映眾RTX 4080 SUPER X3顯卡的供電設(shè)計基于RTX 4080 SUPER創(chuàng)始人版方案。GPU左右共設(shè)計了17相供電,搭配電容鐵素體電感、固態(tài)電容等高品質(zhì)元器件,用料值得信賴。
全新的AD103-400顯示核心,芯片面積為378.6平方毫米,尺寸不算大。
顯存是來自美光的GDDR6X,單顆2GB容量。這款顯卡PCB正面共設(shè)計有8顆顯存,組建了16GB顯存容量。
這款顯卡采用的是HERCULEZ X3散熱器,搭配有兩枚直徑約9.5cm散熱風(fēng)扇。風(fēng)扇支持可拆洗 ,便于用戶們?nèi)粘1pB(yǎng)清灰。此外,這款散熱器支持智能風(fēng)扇停轉(zhuǎn)功能,在待機狀態(tài)下或者輕負載狀態(tài)下,它的這3枚風(fēng)扇會全部停轉(zhuǎn),以便實現(xiàn)安靜的運行效果。
這款散熱器的金屬主體部分很大,純銅鍍鎳底座,7根純銅鍍鎳熱管,其中2根8mm粗,5根6mm粗,加上大面積散熱鰭片矩陣,不僅能夠為GPU進行散熱,而且還能夠為顯存、電感以及MOS管進行散熱。
測試平臺介紹
筆者組建了一套性能出色酷睿i9-14900K測試平臺,用來測試顯卡性能。為了對比映眾RTX 4080 SUPER X3顯卡的性能,筆者此次測試還加入了RTX 4080的成績。
此次測試所選用的這款RTX 4080同樣是一款非公版顯卡,其GPU頻率為2205MHz,Boost頻率為2505MHz,顯存頻率為1400MHz(等效22400MHz)。
英特爾酷睿14代處理器搭配RTX 40系列顯卡是支持Resizable BAR技術(shù)的。為了充分發(fā)揮比映眾RTX 4080 SUPER X3顯卡的性能表現(xiàn),以下測試環(huán)節(jié)均是在Resizable BAR開啟狀態(tài)下進行的。
游戲性能測試
(一) 3DMark基準測試
首先映眾RTX 4080 SUPER X3在3DMark基準測試當(dāng)中的表現(xiàn)。性能到底有多強,大家一看便知。
在3DMark Time Spy測試項目中,映眾RTX 4080 SUPER X3的性能約為RTX 4080的100.6%。
在3DMark Port Royal光線追蹤測試項目中,映眾RTX 4080 SUPER X3的性能約為RTX 4080的101.9%。
顯而易見,全新的RTX 4080 SUPER相比RTX 4080,3DMark成績只有一點點的提升。
(二) DLSS 3游戲?qū)崪y
目前已有《賽博朋克2077》、《瘟疫傳說:安魂曲》、《光明記憶:無線》、《生死輪回》等熱門游戲大作支持DLSS 3技術(shù)。此次DLSS 3游戲?qū)崪y,筆者將利用3款游戲進行測試。
DLSS 3游戲測試版——《賽博朋克2077》
DLSS 3游戲——《瘟疫傳說:安魂曲》
DLSS 3游戲——《極限競速:地平線5》
通過上述3款DLSS 3游戲來看,DLSS 3技術(shù)為RTX 40系列顯卡帶來的游戲幀數(shù)提升是巨大的。借助DLSS 3技術(shù),RTX
4080 SUPER已能夠在4K分辨率下暢玩大量新時代光追游戲,其中很多戲甚至能夠?qū)崿F(xiàn)4K 144幀的出色表現(xiàn)。
(三) 其它游戲?qū)崪y
接下來,筆者再測試一些非DLSS 3游戲。
游戲?qū)崪y——《中土世界:暗影之戰(zhàn)》
游戲?qū)崪y——《無主之地3》
游戲?qū)崪y——《幽靈行動:荒野》
游戲?qū)崪y——《古墓麗影:暗影》
游戲?qū)崪y——《地鐵:離去》增強版
非DLSS 3游戲中,RTX 4080 SUPER的性能表現(xiàn)依然很好,暢玩大量4K游戲不在話下。
對比RTX 4080的話,RTX 4080 SUPER游戲性能依然提升很小。對于游戲玩家們來說,RTX 4080 SUPER和RTX 4080可以看作是一個檔次的顯卡。
生產(chǎn)力性能測試
(一) AV1硬件加速編解碼測試
為什么AV1編解碼技術(shù)越來越受歡迎?理由很簡單,采用AV1編解碼的視頻能夠以更低的碼率,實現(xiàn)其它主流編解碼視頻相同的畫質(zhì)。說白了,在視頻畫質(zhì)相同的情況下,采用AV1編解碼的視頻文件體積會更小,以至于能夠為視頻創(chuàng)作者們節(jié)省大量的硬盤空間。
目前剪映、萬興喵影、達芬奇等視頻軟件已可支持AV1硬件加速編/解碼功能。接下來筆者利用剪映這款軟件,將一部H264編碼的MP4視頻,導(dǎo)出為一部AV1編碼的MP4視頻。
顯而易見,在RTX 40系列顯卡AV1視頻編碼加速的助力之下,轉(zhuǎn)換時間比單用處理器轉(zhuǎn)換大幅縮短,加速效果相當(dāng)顯著。
(二) DLSS 3.5渲染測試——D5渲染器
目前國產(chǎn)渲染器——D5渲染器已更新DLSS 3.5預(yù)覽支持,可以讓用戶在復(fù)雜渲染模型的預(yù)覽場景中獲得更為流暢的使用反饋,為用戶提供更高幀率的顯示。筆者此次利用映眾RTX 4080 SUPER X3進行了D5渲染器場景列車中環(huán)境非常復(fù)雜的《木構(gòu)建筑》預(yù)覽體驗,并記錄開啟以及關(guān)閉DLSS 3.5進行預(yù)覽的幀數(shù)變化。
從幀數(shù)表現(xiàn)可見,這個渲染預(yù)覽場景對于性能要求非常高,在未開啟DLSS 3.5的情況下,預(yù)覽幀數(shù)僅有16幀,不過在開啟DLSS 3.5進行預(yù)覽之后,幀數(shù)會提升到43幀,此時流暢度已很不錯,DLSS 3.5的作用是非常明顯的。
(三) AI圖片生成測試
RTX 40系列顯卡的Tensor核心擁有強大的深度學(xué)習(xí)能力,可以高效完成AI繪圖創(chuàng)作。這次測試我們使用Satble Diffusion應(yīng)用運行AI程序,繪制50張1000×1000分辨率的圖片,并計算每分鐘生成的張數(shù)。
結(jié)果顯示,映眾RTX 4080 SUPER X3平均每分鐘可生成5.4655張圖片,AI繪圖創(chuàng)作效率要略高于RTX 4080。
散熱器測試
(注:筆者所處的室溫維持在26℃)
利用FurMark,筆者將對映眾RTX 4080 SUPER X3進行壓力測試。
通過10多分鐘的烤機,默認頻率下滿載時GPU溫度穩(wěn)定在約64.5℃,GPU頻率穩(wěn)定在約2715MHz左右,顯卡滿載功耗約310W左右。散熱設(shè)計可靠,同時靜音效果也不錯,令人放心。
產(chǎn)品總結(jié)
畢竟是NVIDIA的高端顯卡,RTX 4080 SUPER擁有出色的游戲和生產(chǎn)力性能,暢玩4K游戲無壓力,并且在日趨流行的AI創(chuàng)作應(yīng)用方面也處于業(yè)界領(lǐng)先水平。如此強大的顯卡,目前8099元起即可擁有。
關(guān)于RTX 4080 SUPER相比RTX 4080提升很小這個情況,很明顯NVIDIA此次推出RTX 4080 SUPER并不是以提升性能為主要目的,而是希望將高端顯卡的價格降下來。從RTX 4080的9499元起到現(xiàn)在RTX 4080 SUPER的8099元起,價格足足直降了1400元,NVIDIA這次的降價誠意還是可以的。
作為本文的測試顯卡,映眾RTX 4080 SUPER X3擁有較為出色的散熱設(shè)計,并且其雙槽厚度能夠令其兼容更多的機箱,心儀的用戶可以到京東商城映眾旗艦店購買,該顯卡首發(fā)價就是8099元。
關(guān)注我們


