雙芯霸主來襲!AMD旗艦HD6990權威測試
除了線程處理器架構從使用了多年的5D架構改成了4D架構之外,HD6900為了提升通用計算性能,還采用了異步分配。
AMD以往產(chǎn)品命令隊列流程圖
在AMD過去的產(chǎn)品中,雖然已經(jīng)可以實現(xiàn)同一時間內(nèi)運行多個內(nèi)核,并且將任務分配到核心當中,但執(zhí)行的時候必須由仲裁器和定序器來決定任務執(zhí)行的先后順序,比如高優(yōu)先級的指令可以直接插隊立即執(zhí)行,而低優(yōu)先級的指令可以被暫時存放在高速緩存之中,等待空閑時機再進行處理。
但在HD6900系列中,AMD對這個架構進行了改進,采用了異步分配的方式。也就是說可以將多個命令流在同一時間提交給核心,讓它們立即執(zhí)行。每一個內(nèi)核都擁有獨立的還行緩沖區(qū)和FIFO,所有的命令隊列是獨立的,異步的,具有不同的優(yōu)先級。這允許多個應用程序亂序提交工作規(guī)程,并獲得返回結果。另外,AMD還為每個提交的內(nèi)核配置有獨立的虛擬內(nèi)存,包括完整的頁表,因此,所有這些命令隊列可以進入用戶空間,并且都是通過完整的內(nèi)存子系統(tǒng)和高速緩存獲得保護。
除了異步分配之外,AMD還建造了2個新的DMA,它們可以雙向地讓PCIe帶寬充分飽和??梢源蠓鹊奶岣逩PU的來回吞吐量和系統(tǒng)內(nèi)存讀取速度,和上一代產(chǎn)品相比,帶寬有效地翻倍。核心還采用多種方式進行改進,如直接讀取本地數(shù)據(jù)緩存而完全繞過ALU,改進了提取操作的性能。另外整合著色器讀取和優(yōu)化整合產(chǎn)出的寫入將提高著色器的I/O。
最后,HD6900還提升了雙精度運算的執(zhí)行效率,此前的產(chǎn)品中,雙精度性能位單精度性能的1/5,而HD6900的雙精度性能為單精度性能的1/4,已經(jīng)超過了600GFlops。可以看出,AMD在HD6900 系列產(chǎn)品的通用計算性能方面也花了很大的功夫來進行改進。
● 渲染器后端升級
HD6900的后端渲染方面主要有三大改進,分別是“整合寫入操作”、16位整數(shù)(unorm/snorm)操作速度提升2倍、32位浮點(單/雙精度)操作速度提升2-4倍。顯卡抗鋸齒性能將得到進一步的提升。
關注我們
