金屬逆襲!FX-787A-CDB雙酷魂黑卡評(píng)測(cè)
因?yàn)镠D7870發(fā)布時(shí)間還不長(zhǎng),所以可能很多朋友對(duì)這款顯卡還不是非常了解。這里我們簡(jiǎn)單介紹一下這款顯卡的GPU核心。
眾所周知,相比HD5000/6000系列,南方群島除了工藝從40nm更新到28nm以外,最重大的改變就是采用了全新的GCN架構(gòu)了。關(guān)于GCN架構(gòu)想必大家在HD7970首發(fā)評(píng)測(cè)中已經(jīng)有所了解,所以本文只做簡(jiǎn)單介紹。
AMD歷代GPU的瓶頸除了曲面細(xì)分以外,其實(shí)最重要的是5D/4D VLIW架構(gòu)的效率問(wèn)題。這一痼疾在南方群島身上終于得以根除,它的流處理器結(jié)構(gòu)已經(jīng)面目全非了。
通過(guò)Pitcairn的整體架構(gòu)圖我們看到,傳統(tǒng)的SIMD流處理器陣列消失了,取而代之的是GCN陣列,Pitcairn總計(jì)擁有1280個(gè)流處理器,現(xiàn)在來(lái)看看GCN陣列的微觀結(jié)構(gòu)。
GCN陣列微觀結(jié)構(gòu)
GCN陣列里有4組SIMD單元,每組SIMD單元里面包括16個(gè)流處理器、或者說(shuō)是標(biāo)量運(yùn)算器。GCN架構(gòu)已經(jīng)完全拋棄了此前5D/4D流處理器VLIW超長(zhǎng)指令架構(gòu)的限制,不存在5D/4D指令打包-派發(fā)-解包的問(wèn)題,所有流處理器以16個(gè)為一組SIMD陣列完成指令調(diào)度。簡(jiǎn)單來(lái)說(shuō),以往是指令集并行,而現(xiàn)在是線程級(jí)并行。
GF100的SM(流處理器簇)微觀結(jié)構(gòu)
可以這么理解,一個(gè)GCN陣列與GF100當(dāng)中的一組SM相當(dāng),GF100的一組SM當(dāng)中有4組共計(jì)32個(gè)流處理器,而Tahiti的一組GCN當(dāng)中有4組共計(jì)64個(gè)流處理器。
更多的線程調(diào)度
從線程級(jí)別來(lái)看,GCN與SM是不可分割的最小單元,GCN一次可以執(zhí)行64個(gè)線程,而SM是48個(gè)(其實(shí)就是流處理器的數(shù)量)。
從多線程執(zhí)行上來(lái)看,GCN可以同時(shí)執(zhí)行4個(gè)硬件線程,而SM是雙線程調(diào)度器的設(shè)計(jì)(參見(jiàn)架構(gòu)圖)。如此來(lái)看,GCN架構(gòu)的多線程性能會(huì)更好一些。
關(guān)注我們



