開(kāi)創(chuàng)DX11宏圖霸業(yè)!鐳HD5870權(quán)威評(píng)測(cè)
第五章/第四節(jié) RV870流處理器規(guī)格特性解析
繼續(xù)將RV870的SIMD陣列放大,就可以看到其流處理器的微觀架構(gòu)了。RV870總共擁有320個(gè)Thread Processor(線程處理器),這是它不可分割的最小單元,相當(dāng)于以前的Shader Unit,每個(gè)線程處理器內(nèi)部又包含了5個(gè)功能各異的處理核心,因此RV870總共擁有1600個(gè)流處理器:
RV870的Thread Processor結(jié)構(gòu)圖
在線程處理器內(nèi)部,這5個(gè)流處理器是在Branch Unit(分歧執(zhí)行單元)的控制下處理數(shù)據(jù)流和條件運(yùn)算,在General Purpose Registers(通用寄存器)中存取或輸出數(shù)據(jù),但并不存放指令。與傳統(tǒng)GPU ALU架構(gòu)不同的是,這5個(gè)流處理器可以在動(dòng)態(tài)流控制的支配下自由的處理任何組合形式的指令,諸如1+1+1+1+1、2+2+1、4+1等組合形式。
宏觀上RV870依然是SIMD(單指令多數(shù)據(jù)流)矢量架構(gòu),但在微觀上可以稱之為超標(biāo)量架構(gòu)(Superscalar),完美支持Co-issue(矢量指令和標(biāo)量指令并行執(zhí)行),單時(shí)鐘周期可以進(jìn)行5次MAD(Multiply-Add,乘加)運(yùn)算。另外還可以看到,5個(gè)1D ALU其中有個(gè)“胖”一點(diǎn)的,它除了MAD之外還能夠進(jìn)行一些特殊(SIN、COS、LOG、EXP等函數(shù))運(yùn)算,在特殊條件下提高運(yùn)算效率!
在流處理器部分,RV870加入了DX11新增的位操作類指令,并優(yōu)化了Sum of Absolute Differences(SAD,誤差絕對(duì)值求和)算法,指令執(zhí)行速度提升12倍,此項(xiàng)指令可以在OpenCL底層執(zhí)行。SAD算法應(yīng)用最多的就是H.264/AVC編碼的移動(dòng)向量估算部分(約占整個(gè)AVC編碼總時(shí)間的80%),如此一來(lái)使用RV870做視頻編碼類通用計(jì)算時(shí),性能會(huì)大幅提升!
RV870的單精度浮點(diǎn)運(yùn)算能力為2720GFLOPS,雙精度浮點(diǎn)運(yùn)算能力為單精度的1/5,也高達(dá)544GFLOPS。對(duì)手GTX285的單精度浮點(diǎn)運(yùn)算能力為1063GFLOPS,但雙精度下降為1/8,僅133GFLOPS,很難滿足高精度的科學(xué)計(jì)算領(lǐng)域的需要。
關(guān)注我們
