耕升RTX 4080 16GB 炫光 SOC評測:強悍性能更有酷炫燈效
在今年九月份的NVIDIA發(fā)布會上,NVIDIA發(fā)布了全新一代的核心架構,并且也推出了新一代的RTX 40系列顯卡。在此前我們已經(jīng)測試過了RTX 4090顯卡的一系列表現(xiàn),像是耕升GeForce RTX 4090 炫光OC就表現(xiàn)出了非常強悍的性能。在近期,不少的朋友也在好奇RTX 4080顯卡的表現(xiàn)如何?而我們也收到了耕升 GeForce RTX 4080 16GB 炫光 SOC顯卡,那么就讓我們一起通過這一張顯卡,來了解一下RTX 4080顯卡的一系列表現(xiàn)吧。
全新的Ada Lovelace架構與RTX 4080
我們此次收到的耕升 GeForce RTX 4080 16GB 炫光 SOC顯卡采用的是NVIDIA推出的新一代Ada Lovelace架構核心,因為Ada Lovelace架構核心帶來了不少的升級,因此我們也將對其進行一些相關的介紹。
01/Ada Lovelace架構
▲Ada Lovelace架構核心
▲Ada Lovelace架構以及對比Ampere架構參數(shù)
▲Ada Lovelace架構核心 GPC單元
Ada Lovelace架構核心配備了全新的第三代RT Core(光線追蹤核心)、第四代Tensor Core(張量核心)以及SM(流式多處理器)。根據(jù)NVIDIA官方的介紹,Ada Lovelace架構核心所采用的第 3 代 RT Core 不僅將光線與三角形求交性能提高了一倍,還將 RT-TFLOP 峰值性能提高了一倍之多。第 3 代 RT Core 還配備了全新的 Opacity Micromap (OMM) 引擎和 Displaced Micro-Mesh (DMM) 引擎,進一步提升了光追計算的性能以及減少計算開銷,帶來了更好的光線追蹤效果表現(xiàn)。Ada Lovelace架構核心配備的第四代Tensor Core更是引入了來自專業(yè)級H100數(shù)據(jù)中心GPU的 FP8 Transformer 引擎,從而帶來了更加強悍的AI算力。
▲第三代RT Core結構示意圖,相比前代,增加了2個功能
Ada Lovelace架構核心在SM單元上引入了Shader Execution Reordering(SER 著色器執(zhí)行重排序 )技術來更好的對于著色器的工作進行調度排序,在使用上可以根據(jù)不同的負載需求來執(zhí)行渲染,可對負載較為統(tǒng)一的畫面進行渲染,降低工作開銷。
根據(jù)英偉達官方的介紹,這一個SER功能將作為API開放給開發(fā)者使用。英偉達官方宣稱,SER功能的加入最 高可帶來兩倍RT Core性能上的改善,對于光追游戲來說更可帶來體驗的升級。根據(jù)NVIDIA官方的數(shù)據(jù),全新的SM(流式單元處理器)可帶來最 高兩倍的性能以及能效升級,升級幅度是非常明顯的。
▲Ada Lovelace架構核心 SM結構圖
Ada Lovelace架構核心除了第三代RT Core(光線追蹤核心)、第四代Tensor Core(張量核心)以及SM(流多處理器)的升級以外,帶來了全新的第八代NVENC雙硬件編碼器,這一全新的第八代NVENC雙硬件編碼器整合了對AV1視頻編碼格式的支持,可以在傳統(tǒng)的H.264等格式之外,加入了對AV1這一主流新標準的支持,可以進行對于AV1格式的編碼與解碼,有效提升了生產(chǎn)力方面的表現(xiàn),對于創(chuàng)作型用戶、游戲主播等群體來說更是如虎添翼。來自NVIDIA官方的數(shù)據(jù)顯示,第八代NVENC雙硬件編碼器在AV1的效率上比H.264編碼器的效率提高了40%,這一提升非常明顯。
除了核心上的升級以外,Ada Lovelace架構核心還大幅度提升了其L2緩存,完成版的Ada Lovelace架構核心(AD 102)擁有96MB的L2緩存,大容量的L2緩存帶來了數(shù)據(jù)命中率的有效提升。在現(xiàn)階段顯存帶寬提升有效的情況下,通過升級更大容量的L2緩存,可以提升數(shù)據(jù)命中表現(xiàn),帶來性能方面的升級,根據(jù)NVIDIA官方的說法,大容量L2緩存的加入為GPU的一系列操作帶來了更高的收益,尤其是在光線追蹤等場景下,表現(xiàn)更為明顯。
02/DLSS 3與NVIDIA Reflex:
Ada Lovelace架構的一系列升級還帶來了全新的DLSS 3技術的獨占以及NVIDIA Reflex方面的體驗提升。而作為采用Ada Lovelace架構核心的耕升 GeForce RTX 4080 16GB 炫光 SOC顯卡,自然是對DLSS 3給到了一系列的支持。
DLSS 3包含有DLSS 2(DLSS超分辨率技術),以及全新加入的DLSS幀生成技術,這一項DLSS幀生成技術依托于Ada Lovelace架構的獨立光流處理器以及Tensor Core的AI算力。在一項技術在運行過程中,其通過光流處理器所得到的一系列數(shù)據(jù)后,以光流加速技術(Optical Flow Acceleration,簡稱為OFA)來生成畫面信息,而AI算力則負責來對畫面進行進一步的優(yōu)化,從而在游戲中加入了更多的幀畫面,進行幀數(shù)的提升。
DLSS 3可直接生成游戲第1幀3/4的像素以及整個游戲第2幀,相當于使用1/8的算力,就完成了整個計算過程,而通過這一個流程的循環(huán),可在提升幀數(shù)的同時節(jié)省資源開銷,進一步帶來更好游戲體驗。
而在DLSS 3的幀生成技術上,由于可能帶來延遲的增加,因此DLSS 3在使用上也將通過整合NVIDIA Reflex這一技術來降低渲染以及操作的延遲。而根據(jù)NVIDIA官方的說法,DLSS 3通過整合NVIDIA Reflex以及一系列的技術,可以使得游戲體驗擁有媲美甚至是超越原生級的渲染、操作體驗。
03/RTX 4080 16GB
RTX 4080 16GB顯卡采用的是AD 103-300顯示核心,采用了TSMC 4N工藝進行制造,其芯片面積為378.6 平方毫米,晶體管密度為459億。從這一個規(guī)格可以發(fā)現(xiàn),其相比較于RTX 4090的608.5平方毫米芯片面積以及763億晶體管密度是有一定的差距的,不過相比較于RTX 3090Ti 的283億晶體管數(shù)量來說,也是高出不少了。
進一步探究規(guī)格我們可以發(fā)現(xiàn),完整的AD 103核心相比較于完整的AD102核心,屏蔽掉了不少的GPC單元,而RTX 4080 16GB是在完整AD 103核心的基礎上再次屏蔽一部分GPC而來的產(chǎn)品。筆者推測NVIDIA或許對于AD 103的完整核心會有進一步的規(guī)劃,在后續(xù)推出諸Ti或者Super之類的產(chǎn)品。
▲完整AD 102核心架構圖
▲完整AD 103核心架構圖
▲RTX 4080 16GB核心架構圖
除了核心上并非采用完整的AD 103顯示核心以外,RTX 4080 16GB的顯存位寬也被砍至256 bit,不過NVIDIA也對其進行一定的補償,比如說配備了16GB的GDDR6X顯存以及高于RTX 4090的顯存頻率,來降低顯存位寬下降所帶來的影響。RTX 4080 16GB最終的帶寬為716.8 GB/s,是少于RTX 3080 TI的912.0 GB/s甚至是RTX 3080 的760.0 GB/s帶寬。
但我們也需要看到,RTX 4080 16GB配備的16GB GDDR6X顯存對于現(xiàn)階段大部分的游戲甚至是專業(yè)需求來說已經(jīng)能很好的滿足,并且這一款顯卡采用的AD 103-300核心在頻率、晶體管數(shù)量、理論算力等方面對于上一代RTX 3080系列顯卡提升是非常明顯的,更別說是在L2緩存方面運用到了64MB的大緩存,進一步提升了性能方面的表現(xiàn)。因此筆者認為RTX 4080 16GB雖然在顯存帶寬方面有所欠缺,但是整體的表現(xiàn)依然會相比較于前一代產(chǎn)品更為亮眼。
耕升 GeForce RTX 4080 16GB 炫光 SOC顯卡相比較于公版的RTX 4080 16GB,更是在原本已經(jīng)達到2508MHz的Boost頻率上進一步提到了2625MHz,因此能帶來更好的表現(xiàn)。由于筆者在之前提到在理論性能方面,RTX 4080 16GB相比較于RTX 3080擁有一系列的優(yōu)勢。因此我們也拉來了上一代的“卡皇”RTX 3090ti進行對比,大家可以通過表格來了解顯卡之間的差距。
耕升 GeForce RTX 4080 16GB 炫光 SOC外觀&拆解
耕升 GeForce RTX 4080 16GB 炫光 SOC帶來的就是一個頗具科幻感曲線的黑色鋼琴烤漆外觀。其外觀在看似平靜的黑色靜謐下,進行了一系列曲線波動,帶來了一種非常具有力量的神秘感。
耕升 GeForce RTX 4080 16GB 炫光 SOC采用的是第二代「炫之黑曜石」散熱器,在沒點亮的時候是頗具力量感的曲線,而在點亮后,則可看到在顯卡的外殼上會有一系列科幻感十足的燈效。
耕升 GeForce RTX 4080 16GB 炫光 SOC第二代「炫之黑曜石」散熱器上的燈效可以通過5V ARGB進行調整,并且也支持到市面上一系列主流主板的神光同步。
耕升 GeForce RTX 4080 16GB 炫光 SOC在顯卡的頂部配備有品牌logo的燈帶。
耕升 GeForce RTX 4080 16GB 炫光 SOC的頂部還配備有一個全新的12VHPWR供電接口,為顯卡提供電源輸入。而對于沒有原生自帶這一個接口的電源用戶來說,耕升 GeForce RTX 4080 16GB 炫光 SOC還配備了3*8pin轉12VHPWR的轉接線,方便用戶進行使用。值得注意的是,這一張顯卡的建議配置電源是750W及以上,用戶在使用上需要注意一下。
耕升 GeForce RTX 4080 16GB 炫光 SOC配備有金屬背板,在背板上印制有“GeForce RTX”的字樣和 NVIDIA 核心AIC之一“耕升”的英文名稱。在金屬背板的尾部,耕升對這一個部位進行了鏤空處理,通過穿透式的金屬背板來進一步提升散熱表現(xiàn),保障性能的輸出。
耕升 GeForce RTX 4080 16GB 炫光 SOC是一張三槽的顯卡,在輸出接口方面配備有3個DP 1.4接口以及一個HDMI 2.1接口。
耕升 GeForce RTX 4080 16GB 炫光 SOC所配備的第二代「炫之黑曜石」散熱器不僅對于顏值進行了提升,更是帶來進一步優(yōu)化的「炫風之刃」扇葉,對散熱進行了有效的提升。
耕升 GeForce RTX 4080 16GB 炫光 SOC配備有2個102mm和1個92m組合而成的強效三風扇,特殊優(yōu)化的扇葉可進一步提升風流量,進一步提升散熱效果。
拆開顯卡,我們可以看到耕升 GeForce RTX 4080 16GB 炫光 SOC配備了超大面積的散熱鰭片,并且采用了鍍鎳設計加強抗氧化能力的8根復合熱管。風扇+鰭片+熱管的一系列散熱配置,對于這一張耕升 GeForce RTX 4080 16GB 炫光 SOC的性能釋放可以提供到相當不錯的保障。
耕升 GeForce RTX 4080 16GB 炫光 SOC采用了12 層PCB。
在PCB的中部,我們可以看到耕升 GeForce RTX 4080 16GB 炫光 SOC采用的AD 103-300核心。相比較于公版,耕升 GeForce RTX 4080 16GB 炫光 SOC的核心Boost頻率提升到了2625MHz。在核心的周圍是16GB的GDDR6X顯存,顯存圍繞在核心附近。
耕升 GeForce RTX 4080 16GB 炫光 SOC采用了16 相核心供電+3 相顯存供電,能對顯卡帶來不錯的供電表現(xiàn)。
耕升 GeForce RTX 4080 16GB 炫光 SOC還附贈有支持ARGB燈效同步的顯卡支架。對于旗艦級的顯卡來說,采用顯卡支架可以有效避免顯卡過重而帶來的一系列風險,看得出耕升在方面的細節(jié)還是做的蠻不錯的。
各項測試
我們組建了一套高性能的測試平臺,性能十分強悍,在實際測試上的一系列數(shù)據(jù)都是在此套平臺上得出的。
我們此次評測的主角是耕升 GeForce RTX 4080 16GB 炫光 SOC,這一款顯卡通過GPU-Z查看到的基礎頻率為2205MHz,Boost頻率為2625MHz,相比較于FE版本的2505MHz有所提升,默認的TGP為320 W。
因為DLSS 3是RTX40系列顯卡帶來的全新技術,在維持高畫質的情況下也可以實現(xiàn)更為流暢的游戲表現(xiàn),這也讓玩家可以更好的享受4K光追游戲帶來的畫質體驗。為了更好的感受GeForce RTX 4080 16GB顯卡在游戲方面的升級,我們在測試耕升 GeForce RTX 4080 16GB 炫光 SOC時特意選擇了愛攻&保時捷(Porsche Design)聯(lián)合設計的PD32M顯示器。
這款顯示器為31.5英寸,采用MIni LED背光技術,擁有1152個獨立分區(qū),擁有1600尼特峰值亮度,8000萬:1動態(tài)對比度,并通過HDR1400認證,在畫質上有著更為出色的表現(xiàn)。此外,PD32M擁有4K分辨率以及144Hz的刷新率,支持97%DCI-P3色域以及99% Adobe RGB覆蓋,并且擁有HDMI 2.1接口,是一款旗艦級電競顯示器。
而為了進一步的展現(xiàn) 耕升 GeForce RTX 4080 16GB 炫光 SOC的性能,我們也在一些項目上找來了上一代卡皇RTX 3090 Ti進行對比,方便大家更加直觀的進行了解。
在3DMark基準測試當中,耕升 GeForce RTX 4080 16GB 炫光 SOC跑分已經(jīng)全面超越了前代卡皇RTX 3090 Ti,而且領先幅度甚至高達20%以上。
在DLSS基準測試中,耕升 GeForce RTX 4080 16GB 炫光 SOC在DLSS 2模式下的4K性能提升了159%,DLSS3模式下更是提升了235%。
耕升 GeForce RTX 4080 16GB 炫光 SOC強勁的理論性能我們已經(jīng)有目共睹,接下來是游戲幀數(shù)方面的測試。這里我們先分別在2K與4K分辨率下測試四款經(jīng)典的游戲。
01、傳統(tǒng)游戲測試
在《絕地求生:大逃殺》當中,耕升 GeForce RTX 4080 16GB 炫光 SOC的表現(xiàn)如預期般超過了RTX 3090 Ti,領先幅度在15%左右。
在其它大多數(shù)的大型游戲場景中,耕升 GeForce RTX 4080 16GB 炫光 SOC的表現(xiàn)也都穩(wěn)穩(wěn)超過了RTX 3090 Ti,領先幅度分別在15-20%。RTX 4080開啟DLSS 2模式對比原生分辨率的性能提升則有30-120%不等。
僅僅除了在2K分辨率DLSS模式下測試《永劫無間》時,可能是由于幀率太高造成了CPU瓶頸,導致顯卡占用不滿,對比原生2K的實際幀率表現(xiàn)并沒有提升,導致還不及RTX 3090 Ti的情況。
02、DLSS 3與Reflex專項 游戲測試
接下來,筆者再測試幾款含有NVIDIA新一代DLSS 3技術的游戲,游戲的畫質都會調至最 高,看看這些游戲分別在原生畫面、DLSS 2超分辨率、DLSS 3幀生成之下,性能與延遲的差別。
首先我們看看Reflex低延遲功能究竟有多大的作用,在《守望先鋒 歸來》當中,開啟Reflex功能的延遲低了一半以上,而且對幀率幾乎沒有影響。這一功能可以很好地減輕DLSS 3補幀功能增加的延遲,所以開啟DLSS 3也會同步開啟Reflex。對于延遲追求更高的玩家來說,使用Reflex+Boost還可以有進一步增強,不過效果就沒有那么明顯了,而且還會造成小幅的幀率損失。
在基于Unity的《Enemies》DLSS 3測試Demo里面,耕升 GeForce RTX 4080 16GB 炫光 SOC原生4K下只能跑到21幀,這種極低幀的模式下幀生成時間是很長的,所以延遲來到了191ms,打開DLSS 3后,幀率達到3倍以上,延遲也降到了54ms。
同樣的情況也出現(xiàn)在《賽博朋克:2077》當中,原生4K分辨率下30幀的平均幀帶來了117ms的畫面延遲,畫面卡頓、操作遲滯。而在開啟DLSS 3后幀率提升到了93幀,延遲49ms,甚至還比DLSS 2不開Reflex狀態(tài)要更低。
類似的,在《幻塔》測試版中,由于這款游戲沒有單獨開啟Reflex的選項,所以DLSS 3模式的延遲也要比DLSS 2下面更低。
在《瘟疫傳說:安魂曲》里面,DLSS 3同樣帶來了較原生分辨率不止翻倍的提升,延遲的增加也不明顯。
《暗影火炬城》里面,RTX 4080在DLSS 3模式的平均幀和DLSS 2模式差不多,應該是碰到幀率上限了,但前者在1%低幀的表現(xiàn)上有了比較明顯的提升。
在《毀滅全人類》里面,開啟DLSS 3的耕升 GeForce RTX 4080 16GB 炫光 SOC也有著比原生畫質翻倍的性能,以及更低的延遲。
畫質方面,使用OBS分別對DLSS和原生畫質進行高碼率錄制。從下圖對比可以看到,開啟DLSS模式的畫質(下圖左半部分),甚至比原生分辨率(下圖右半部分)的紋理細節(jié)更加清晰。
03、生產(chǎn)力測試
除了游戲以外,現(xiàn)階段的顯卡也可以為各類產(chǎn)生力帶來一系列的支持,在渲染、建模等多方面都能發(fā)揮其實力。
在渲染能力方面,我們先圍繞 Blender Benchmark 進行,在 Moster、Junkshop、Classroom 按個場景中,耕升 GeForce RTX 4080 16GB 炫光 SOC相對 GeForce RTX 3090 Ti 性能提升非常明顯。
同樣 V-Ray 5 Benchmark 中,會同時考驗到 GPU CUDA 性能和光線追蹤性能表現(xiàn),能夠看到耕升 GeForce RTX 4080 16GB 炫光 SOC相對 GeForce RTX 3090 Ti的RTX渲染效率效率提升了35%以上。
在SPECviewperf 2020集成的8款工業(yè)軟件測試中,耕升 GeForce RTX 4080 16GB 炫光 SOC相比RTX 3090 Ti達成了全方位的領先。。
Octane Render RTX 經(jīng)常被用作于場景建模,特別是開啟光線追蹤之后,對實時預覽性能以及渲染輸出都有著極高的要求,與 GPU 以及 GPU 的 RTX 性能直接掛鉤。在這一項目中,耕升 GeForce RTX 4080 16GB 炫光 SOC 相對 GeForce RTX 3090 Ti 性能提升 30% 以上。
視頻內容創(chuàng)作方面,在使用達芬奇渲染同一段4K H.265視頻的任務中,耕升 GeForce RTX 4080 16GB 炫光 SOC也比RTX 3090 Ti快了20%以上。
同時,GeForce RTX 40系列顯卡還首次加入了 AV1 雙編碼器。AV1 編碼是由英特爾、微軟、亞馬遜、谷歌、網(wǎng)飛等網(wǎng)絡巨頭組成的開放多媒體聯(lián)盟 AOMedia 所推出的免費編碼格式,在國內已經(jīng)獲得了嗶哩嗶哩、愛奇藝支持。它的特點是能在相同文件體積下?lián)碛懈咔宓漠嬞|,或者相同清晰度的畫質下?lián)碛懈〉捏w積。
上圖是AV1(左)和AVC(右)的畫質對比。
GeForce RTX 40系列顯卡是目前市面上較少可以支持硬件AV1渲染加速的GPU,實測渲染導出同一段AV1視頻,其效率對比純CPU軟件編碼效率高了4倍左右。
與此同時,對游戲主播而言,GeForce RTX系列顯卡支持的Broadcast工具還可以一鍵實現(xiàn)人像跟蹤、視頻去噪、噪音和回聲消除、消除/虛化背景等實用功能。
04、散熱及功耗測試
筆者也對于這一張耕升 GeForce RTX 4080 16GB 炫光 SOC進行了散熱上方面的測試,在室溫26℃的情況下,進行測試。
筆者對這一張顯卡進行了15分鐘的FurMark烤機測試,在15分鐘的烤機后,這一張顯卡的溫度可以穩(wěn)定在65℃左右,并且沒有很大的噪聲,此時的烤機功耗在320W左右。
總結
耕升 GeForce RTX 4080 16GB 炫光 SOC在理論性能、游戲、生產(chǎn)力等方面的表現(xiàn)都非常亮眼,其各方面的能力甚至形成了對上一代“卡皇”RTX 3090 Ti的全方位壓制。耕升 GeForce RTX 4080 16GB 炫光 SOC更是配備有諸如DLSS 3、AV1雙編解碼器等一系列新特性,對于未來一系列技術以及游戲擁有更進一步的支持。
耕升 GeForce RTX 4080 16GB 炫光 SOC除了性能方面的優(yōu)異表現(xiàn)之外,其曲面造型的未來科幻風格前衛(wèi)外觀、電路板“賽博朋克”風格燈效等也是讓人印象深刻,這一款顯卡還具備有高于公版的頻率,性能表現(xiàn)更進一步。對于想要購買新一代RTX 40系列顯卡的朋友來,是一個不錯的選擇。
關注我們
