9系游戲神器 影馳GTX970黑將顯卡評測
NVIDIA Kepler GPU架構(gòu)于2012年初問世,它前所未有的能效比催生出全球最快的游戲PC、工作站以及超級計算機(jī)和云游戲服務(wù)器。甚至智能手機(jī)、平板電腦乃至汽車的信息娛樂系統(tǒng)都得益于TegraK1系統(tǒng)(SoC)獲得了空前的視覺計算功能。
而NVIDIA的第一代“Maxwell”架構(gòu)在上一代的基礎(chǔ)上又獲得了全新的提升。事實上“GM107”在研發(fā)期間的定位是專為筆記本和小型(SFF)PC等功率受限的使用場合而設(shè)計。但事實上它的性能已經(jīng)達(dá)到了桌面低端甚至中端的水準(zhǔn),NVIDIA在最后時刻將其打造成GTX650Ti的接班人,強(qiáng)行推入主流市場。
在1080p分辨率下,GeForceGTX750Ti的性能通常可與四年前的旗艦GPU——GeForceGTX480比肩,然而熱設(shè)計功耗僅為區(qū)區(qū)60W,是后者的四分之一!那Maxwell高端產(chǎn)品又當(dāng)如何?是什么革新讓它有如此驚人的表現(xiàn)呢?
Maxwell在流式多處理器(SM)方面采用了一種全新設(shè)計,可大幅提高每瓦特性能和每單位面積的性能。雖然Kepler SMX設(shè)計在這一代產(chǎn)品中已經(jīng)相當(dāng)高效,但是隨著它的發(fā)展,NVIDIA的GPU架構(gòu)師再次在能效比利用方面突破了難關(guān)。
MaxwellSM設(shè)計實現(xiàn)證明了這一點,控制邏輯分區(qū)、負(fù)荷均衡、時鐘門控粒度、編譯器調(diào)度、每時鐘周期發(fā)出指令條數(shù)等方面的改進(jìn)以及其它諸多增強(qiáng)之處讓Maxwell SM(亦稱“SMM”)能夠在效率上遠(yuǎn)超Kepler SMX。全新的Maxwell SM架構(gòu)能夠在GM107中把SM的數(shù)量增至五個(GK107中僅有兩個),而芯片面積僅增加25%。下表提供了高級對比,對比雙方分別為Maxwell以及上一代GK107 Kepler GPU:
具體來說,首先Maxwell采用了容量大增的二級高速緩存設(shè)計,Maxwell核心架構(gòu)中二級高速緩存容量為2048KB,而GK107中的容量僅為256KB。由于片上高速緩存容量更大,因此需要向顯卡DRAM發(fā)送的請求更少,從而降低了整體顯卡功耗、提升了性能。
除了上述變化以外,NVIDIA的工程師還雄心勃勃地在晶體管水平上調(diào)整了Maxwell GPU中每個單元的實現(xiàn)方式,以便最大限度提高節(jié)能性。所有這些努力的最終結(jié)果是,采用相同的28納米制造工藝,Maxwell能夠提供相當(dāng)于Kepler兩倍的每瓦特性能!
雖然說起來簡單,但事實上這些就意味著Maxwell內(nèi)部所有單元和橫梁結(jié)構(gòu)均得到了重新設(shè)計,數(shù)據(jù)流得到了優(yōu)化,功率管理實現(xiàn)了大幅改變。
雖然從圖形特性的視角來看,第一代Maxwell GPU可提供與Kepler GPU相同的API功能,但從深層來上,Maxwell還在單個GPC(圖形處理簇)內(nèi)實現(xiàn)了多個SM單元,每個SM包含一個多形體引擎(Polymorph Engine)和紋理單元,而每個GPC包含一個光柵引擎(Raster Engine)。ROP依然與二級高速緩存片(L2 Cache Slice)以及顯存控制器聯(lián)系在一起。
GM 204 GPU包含4個GPC、16個Maxwell流式多處理器(SMM)以及4個64位顯存控制器(共256位)。這就是這一芯片的完整實現(xiàn)形式,規(guī)格大約是GeForce GTX 750Ti中的GM107的3倍。
上一代Kepler的方法是劃分為非2冪(non-power-of-two)數(shù)量的CUDA核心,其中一些是共享核心,這種方法需要的SM調(diào)度器數(shù)量較少,但復(fù)雜程度較高,在各種各樣的游戲引擎環(huán)境中表現(xiàn)并不理想。
上一代Kepler的方法是劃分為非2冪(non-power-of-two)數(shù)量的CUDA核心,其中一些是共享核心,這種方法需要的SM調(diào)度器數(shù)量較少,但復(fù)雜程度較高,在各種各樣的游戲引擎環(huán)境中表現(xiàn)并不理想。
而現(xiàn)在每個SM分為四個獨(dú)立的處理塊,每個處理塊具備自己的指令緩沖區(qū)、調(diào)度器以及32個CUDA核心。新的劃分方法簡化了設(shè)計與調(diào)度邏輯、節(jié)省了晶體管與功耗、降低了計算延遲。
總體而言,在這一全新設(shè)計上,每個“SM”的尺寸得到大幅縮減,而性能卻能夠達(dá)到一個KeplerSM的90%。更小的晶體管消耗讓NVIDIA能夠在每顆GPU中實現(xiàn)更多數(shù)量的SM。通過對比Kepler和Maxwell SM總數(shù)的相關(guān)指標(biāo)可發(fā)現(xiàn),后者的峰值紋理性能比前者高25%,CUDA核心數(shù)量多1.7倍,著色器性能大約高2.3倍。
對GM204來說,要在顯存位寬與上一代Kepler架構(gòu)核心相同的情況下實現(xiàn)性能大幅提升的目標(biāo),增強(qiáng)顯存系統(tǒng)也同樣重要。內(nèi)部顯存系統(tǒng)帶寬實現(xiàn)了提升,效率也得到了改善。此外,2MB大容量二級高速緩存配置(比之前的任何GPU設(shè)計都大)十分有效地降低了顯存帶寬需求,確保了DRAM帶寬不成為瓶頸。
其他關(guān)于Maxwell架構(gòu)的基本信息,例如通過Giga Thread引擎的主PCI Express接口數(shù)據(jù)流、Polymorph與Raster單元的基本操作等等過于晦澀的知識這里就不再贅述了。
關(guān)注我們



