Maxwell超節(jié)能!GTX750Ti/750首發(fā)評測
在這里我們不難看出,Maxwell內(nèi)部所有單元和橫梁結(jié)構(gòu)均得到了重新設(shè)計,數(shù)據(jù)流得到了優(yōu)化,功率管理實現(xiàn)了大幅改變。
雖然從圖形特性的視角來看,第一代Maxwell GPU可提供與Kepler GPU相同的API功能,但從深層來上,Maxwell還在單個GPC(圖形處理簇)內(nèi)實現(xiàn)了多個SM單元,每個SM包含一個多形體引擎(Polymorph Engine)和紋理單元,而每個GPC包含一個光柵引擎(Raster Engine)。ROP依然與二級高速緩存片(L2 Cache Slice)以及顯存控制器聯(lián)系在一起。
GM107全芯片框圖
GM 107 GPU包含一個GPC、五個Maxwell流式多處理器(SMM)以及兩個64位顯存控制器(共128位)。這就是這一芯片的完整實現(xiàn)形式,與GeForce GTX 750Ti中的芯片配置相同。
GK107全芯片框圖
NVIDIA在Maxwell 更改了 SM 的組織方式。 每個 SM 分為四個獨立的處理塊,每個處理塊具備自己的指令緩沖區(qū)、調(diào)度器以及 32 個 CUDA 核心。 Kepler 的方法是劃分為非2冪 (non-power-of-two) 數(shù)量的 CUDA 核心,其中一些是共享核心,這種方法現(xiàn)已棄用。新的劃分方法簡化了設(shè)計與調(diào)度邏輯、節(jié)省了面積與功耗、降低了計算延遲。
SMX: 192個單精度CUDA核、64個雙精度單元、32個特殊功能單元(SFU)和32 個加載/存儲單元(LD/ST)。
每個SMX單元具有192單精度CUDA核,每個核完全由浮點和整數(shù)算術(shù)邏輯單元組成。Kepler完全保留Fermi引入的IEEE 754-2008 標(biāo)準(zhǔn)的單精度和雙精度算術(shù),包括積和熔加(FMA)運算。
成對的處理塊共享四個紋理過濾單元和一個紋理高速緩存。計算一級高速緩存的功能現(xiàn)在也與紋理高速緩存功能相結(jié)合,而共享顯存是一個獨立的單元(類似首款CUDAGPU——G80中所使用的方法),被全部四個塊共享。
SMM 處理核架構(gòu)
Maxwell SM框圖
而現(xiàn)在每個SM分為四個獨立的處理塊,每個處理塊具備自己的指令緩沖區(qū)、調(diào)度器以及32個CUDA核心。新的劃分方法簡化了設(shè)計與調(diào)度邏輯、節(jié)省了晶體管與功耗、降低了計算延遲。
總體而言,在這一全新設(shè)計上,每個“SM”的尺寸得到大幅縮減,而性能卻能夠達(dá)到一個KeplerSM的90%。更小的晶體管消耗讓NVIDIA能夠在每顆GPU中實現(xiàn)更多數(shù)量的SM。通過對比GK107和GM107 SM總數(shù)的相關(guān)指標(biāo)可發(fā)現(xiàn),GM107有五個SM,而前者只有兩個。GM107的峰值紋理性能比前者高25%,CUDA核心數(shù)量多1.7倍,著色器性能大約高2.3倍。
● SMM架構(gòu)顯存系統(tǒng)的改進(jìn)
對GM107來說,要在顯存位寬與GK107相同的情況下實現(xiàn)性能大幅提升的目標(biāo),增強顯存系統(tǒng)也同樣重要。內(nèi)部顯存系統(tǒng)帶寬實現(xiàn)了提升,另外這一設(shè)計的效率也得到了改善。此外,2MB大容量二級高速緩存配置(比之前的任何GPU設(shè)計都大)十分有效地降低了顯存帶寬需求,確保了DRAM帶寬不成為瓶頸。
其他關(guān)于Maxwell架構(gòu)的基本信息,例如通過Giga Thread引擎的主PCI Express接口數(shù)據(jù)流、Polymorph與Raster單元的基本操作等等過于晦澀的知識這里就不再贅述了。
關(guān)注我們



