加速30倍!APU的GPU硬件加速性能對比
首款國人開發(fā)的支持GPU的OpenCL通用計算測試程序OpenCL General Purpose Computing Benchmark (簡稱GPCBenchMarkOCL)是由國內(nèi)幾名高性能計算從業(yè)人員和愛好者合作編寫的,目的是為了評估在不同的OpenCL平臺上一些基本算法和應(yīng)用的性能。與目前流行的一些OpenCL、DirectCompute通用計算測試程序的不同在于,目前這些測試程序測試項目過于單一,基本上就是某一兩種算法的性能測試,甚至干脆就是理論峰值計算性能的測試。而實際上,OpenCL計算設(shè)備包括GPU的計算性能是受非常多因素影響的,除了計算單元的頻率和數(shù)量之外,還有計算單元架構(gòu)、Global memory(顯存)帶寬、Local memory(GPU內(nèi)的片上存儲器,NVIDIA稱為Shared memory,AMD稱為Local Data Share)帶寬和Bank conflict、存儲器合并訪問情況、存儲器同步成本、緩存等各種因素。因此某些紙面計算性能非常高的GPU執(zhí)行某些計算時性能卻不一定好;又或者,某 GPU在執(zhí)行某種計算時雖然性能落后于另一架構(gòu)的GPU,但是在執(zhí)行另一種計算時性能反而超前。GPCBenchMarkOCL集合了高性能計算領(lǐng)域多種常見的基礎(chǔ)算法和應(yīng)用,能比較全面地評估GPU及其它OpenCL計算設(shè)備在通用計算應(yīng)用中的性能。
● 密碼學(xué)測試:
哈希加密:GPU比CPU快12倍
● 常用數(shù)學(xué)算法測:
矩陣乘法:GPU比CPU快27倍
矩陣轉(zhuǎn)置:GPU比CPU快15倍
并行規(guī)約:GPU比CPU快2倍
8x8離散余弦變換:GPU比CPU快7倍
● 單精度浮點(diǎn)運(yùn)算測試:
加法:GPU比CPU快4倍
乘法:2.5倍
乘加:11倍
特殊函數(shù):17倍
通過測試,我們發(fā)現(xiàn),CPU又完敗于6550D。4核心的A3850都落得如此下場,那市場上主流中低端雙核CPU就完完全全悲劇了。
關(guān)注我們
