av免费福利片在线播放,99热精品久久只有精品,18video性欧美19sex,ysl蜜桃色www,国产精品一区二区久久国产

泡泡網(wǎng)顯卡頻道 PCPOP首頁(yè)      /      顯卡     /      評(píng)測(cè)    /    正文

開(kāi)創(chuàng)DX11宏圖霸業(yè)!鐳HD5870權(quán)威評(píng)測(cè)

當(dāng)筆者和同事還在沉迷于DX7和DX8游戲不能自拔的時(shí)候

當(dāng)讀者們還在為DX9和DX10的畫(huà)面/性能爭(zhēng)論不休的時(shí)候

當(dāng)NVIDIA鼓吹DX10.1無(wú)用論卻又低調(diào)的加入支持的時(shí)候

新一代DX11頂著諸多增益魔法踩著華麗的光環(huán)從天而降

雙倍規(guī)格六屏輸出21.5億晶體管的HD5870顯卡橫空出世

經(jīng)濟(jì)危機(jī)的陰云已然散去,"顯卡危機(jī)"也將成為過(guò)去式

第一章 讓游戲運(yùn)行效率更高!DirectX 11全面解析
    第一節(jié) 革命性的DirectX 10回顧
    第二節(jié) 過(guò)渡性的DirectX 10.1回顧
    第三節(jié) 全新的DirectX 11誕生,為高效率游戲而生
    第四節(jié) 關(guān)鍵技術(shù)解讀1:ShaderModel 5.0
    第五節(jié) 關(guān)鍵技術(shù)解讀2:多線程處理
    第六節(jié) 關(guān)鍵技術(shù)解讀3:兩種新的紋理壓縮格式

第二章 DirectCompute 11:不止是通用計(jì)算
    第一節(jié) DirectCompute與Stream/CUDA/OpenCL的關(guān)系
    第二節(jié) DirectCompute 10/10.1/11版本間的區(qū)別
    第三節(jié) DirectCompute 11新特效:順序無(wú)關(guān)透明化
    第四節(jié) DirectCompute 11新特效:渲染后端處理之景深
    第五節(jié) DirectCompute 11新特效:渲染后端處理之高清晰環(huán)境光遮蔽

第三章 DX11之ATI獨(dú)門絕技Tessellation全解析
    第一節(jié) 似曾相識(shí)的Tessellation技術(shù)
    第二節(jié) 2002年R200:Tessellation的鼻祖N-Patch及TruForm
    第三節(jié) 2005年Xenos:Tessellation登陸XBOX360主機(jī)
    第四節(jié) 2007年R600:Tessellation臥薪嘗膽
    第五節(jié) 2009年RV870:Tessellation被正式納入DX11,修成正果
    第六節(jié) DX11版Tessllation的改進(jìn)
    第七節(jié) Tessllation在DX11游戲中的應(yīng)用實(shí)例

第四章 DX11游戲?qū)崪y(cè)+視頻
    第一節(jié) DX11游戲并不遙遠(yuǎn):第4季度發(fā)布4款
    第一節(jié) DX11大作《異形大戰(zhàn)鐵血戰(zhàn)士》
    第三節(jié) DX11大作《科林麥克雷:塵埃2》
    第四節(jié) DX11 RTS網(wǎng)游《BattleForge》
    第五節(jié) DX11游戲引擎《Frostbite Engine 2》
    第六節(jié) DX11游戲引擎《Cry Engine 3》

第五章 首顆DX11 GPU:RV870核心架構(gòu)解析
    第一節(jié) RV870核心架構(gòu)圖和規(guī)格全表
    第二節(jié) RV870竟然是單芯片“雙核心”GPU
    第三節(jié) RV870核心控制引擎
    第四節(jié) RV870流處理器規(guī)格特性解析
    第五節(jié) RV870紋理單元和緩存
    第六節(jié) RV870光柵單元和抗鋸齒
    第七節(jié) 更高頻更節(jié)能的第三代GDDR5

第六章 ATI Eyefinity三屏/六屏顯示技術(shù)解析
    第一節(jié) 單純提升分辨率已達(dá)上限
    第二節(jié) Matrox三屏環(huán)幕技術(shù)回顧
    第三節(jié) ATI的驚人設(shè)計(jì) RV870最多支持六屏輸出
    第四節(jié) 靈活多變的三屏六屏輸出方案一覽
    第五節(jié) 三屏/六屏輸出玩游戲震撼效果展示
    第七節(jié) 編輯實(shí)戰(zhàn)測(cè)試HD5870三屏玩游戲
    第八節(jié) HD5870三屏/六屏實(shí)際應(yīng)用視頻展示

第七章 HD5870顯卡實(shí)物解析
    第一節(jié) AMD官方HD5870高清晰美圖大賞
    第二節(jié) HD5870顯卡實(shí)物:外觀賞析
    第三節(jié) HD5870顯卡實(shí)物:最輕的高端卡
    第四節(jié) HD5870顯卡拆解:40nm核心與GDDR5顯存
    第五節(jié) HD5870顯卡供電:數(shù)字式4+1+2相

第八章 顯卡性能測(cè)試
    第一節(jié) 測(cè)試平臺(tái)與方法說(shuō)明
    第二節(jié) DX9C理論性能測(cè)試:3DMark06
    第三節(jié) DX10理論性能測(cè)試:3DMark Vantage
    第四節(jié) DX10渲染性能測(cè)試:填充率和貼圖
    第五節(jié) DX10游戲:《孤島危機(jī):彈頭》
    第六節(jié) DX10游戲:《沖突世界:蘇聯(lián)進(jìn)攻》
    第七節(jié) DX10游戲:《生化危機(jī)5》
    第八節(jié) DX10.1游戲:《湯姆克蘭西之鷹擊長(zhǎng)空》
    第九節(jié) DX10.1游戲:《潛行者:晴空》
    第十節(jié) DX10.1游戲:《孤島驚魂2》
    第十一節(jié) DX9C游戲:《街頭霸王4》
    第十二節(jié) DX9C游戲:《優(yōu)品飛車13:變速》
    第十三節(jié) DX9C物理游戲:《鏡之邊緣》
    第十四節(jié) OpenGL游戲:《敵占區(qū):雷神戰(zhàn)爭(zhēng)》

第九章 成績(jī)匯總與性能總結(jié)
    第一節(jié) 高端顯卡功耗測(cè)試
    第二節(jié) 測(cè)試成績(jī)匯總:HD5870 PK GTX285
    第三節(jié) 測(cè)試成績(jī)匯總:HD5870 PK HD4870X2
    第四節(jié) 測(cè)試成績(jī)匯總:HD5870 PK GTX295
    第五節(jié) 雙卡對(duì)決:HD5870 CF PK GTX295 SLI

第十章 全文總結(jié)
    第一節(jié) 編輯測(cè)試手記:相當(dāng)完美的高端卡
    第二節(jié) 全文總結(jié)展望:敢為人先勇于創(chuàng)新的ATI

第一章 讓游戲運(yùn)行效率更高!DirectX 11全面解析

    HD5800最大的特性就是首次對(duì)DirectX 11 API提供完美支持,這套新一代圖形引擎將在2009年10月份與Windows 7同時(shí)發(fā)布,屆時(shí)也會(huì)提供單獨(dú)的DirectX升級(jí)包供Vista安裝。因此本文很有必要對(duì)DX11的新特性進(jìn)行全面分析,并與上一代的DX10/10.1做一些對(duì)比。

第一章/第一節(jié) 革命性的DirectX 10回顧

    在過(guò)去的十幾年時(shí)間里,DirectX已經(jīng)穩(wěn)步成為微軟Windows平臺(tái)上進(jìn)行游戲開(kāi)發(fā)首選API。每一代DirectX都帶來(lái)對(duì)新的圖形硬件特性的支持,每次版本變更都能幫助游戲開(kāi)發(fā)者們邁出驚人的一步。就拿近幾年來(lái)說(shuō),DX9、DX9C、DX10及相關(guān)顯卡的發(fā)布都帶來(lái)了令人驚訝的游戲畫(huà)面,給與玩家非常好的游戲體驗(yàn)。

隱藏特效開(kāi)啟!超華麗Crysis畫(huà)面大賞

    尤其是DX10發(fā)布后,以Crysis為代表的FPS游戲畫(huà)面達(dá)到了巔峰,顯卡實(shí)時(shí)渲染出來(lái)的人物及風(fēng)景效果足以媲美照片、CG動(dòng)畫(huà)甚至是電影,讓人嘆為觀止!

決不忽悠!DX10游戲性能免費(fèi)提升2.5倍   決不忽悠!DX10游戲性能免費(fèi)提升2.5倍
首款DX10游戲《失落星球》DX9對(duì)比DX10,犧牲一半速度,畫(huà)面改進(jìn)有限

    但DX10也不是完美無(wú)暇的,其缺陷也很明顯,那就是運(yùn)行效率比較低。當(dāng)游戲開(kāi)啟DX10模式后,性能下降幅度非??鋸垼灾劣诘谝淮鶧X10顯卡GeForce 8800和Radeon HD2900都無(wú)法在特效全開(kāi)的情況下流暢運(yùn)行當(dāng)時(shí)的任何一款DX10游戲!

隱藏特效開(kāi)啟!超華麗Crysis畫(huà)面大賞

    以兩年前發(fā)布的DX10代表作Crysis來(lái)說(shuō),其畫(huà)面堪稱完美,但時(shí)至今日依然沒(méi)有任何一款單核心顯卡能在VeryHigh模式下流暢它!即便是優(yōu)異的雙核心顯卡運(yùn)行起來(lái)也很吃力,是因?yàn)镚PU的發(fā)展速度太慢嗎?不是的,兩年時(shí)間顯卡的性能已經(jīng)提高了3-4倍,GPU的發(fā)展腳步并沒(méi)有放緩,問(wèn)題歸根到底還是DX10運(yùn)行效率較差所致。

    下面就先來(lái)回顧一下DX10的主要特性:

    統(tǒng)一渲染架構(gòu)讓GPU運(yùn)算單元的利用率更高,但新加入的幾何著色器卻加重了流處理器的負(fù)擔(dān),超級(jí)復(fù)雜的畫(huà)面場(chǎng)景也給流處理器造成了更大的壓力。因此在這幾年內(nèi),縱使GPU的流處理器數(shù)量大增2-3倍、頻率也穩(wěn)步提升,但依然不夠用。

第一章/第二節(jié) 過(guò)渡性的DirectX 10.1回顧

    DX10帶來(lái)了眾多絢麗無(wú)比的新特效,“濫用”各種特效導(dǎo)致GPU不堪重負(fù)。而GPU自身的發(fā)展受到諸多因素的制約,如果制造工藝跟不上的話運(yùn)算能力很難取得突破。因此,必須通過(guò)不斷改進(jìn)架構(gòu)運(yùn)算效率來(lái)進(jìn)一步提升3D圖形性能。在DX10之后,微軟也開(kāi)始將重心集中在如何提升算法和效率上面,而不是一味的加入新特效或提高模型復(fù)雜度。

    此后微軟發(fā)布了DX10.1 API,對(duì)DX10進(jìn)行了小修小補(bǔ),DX10.1主要更新內(nèi)容有:

    DX10.1的更新內(nèi)容雖然不少,但相比DX10沒(méi)有什么革命性的改進(jìn),大部分內(nèi)容都是提高GPU的資源利用率、將一些可選標(biāo)準(zhǔn)列為必須,其實(shí)不少項(xiàng)目DX10顯卡通過(guò)修改驅(qū)動(dòng)就能實(shí)現(xiàn)。因此DX10.1沒(méi)能得到游戲開(kāi)發(fā)商足夠多的重視,并沒(méi)有像當(dāng)年的DX9C那樣迅速成為主流。


屈指可數(shù)的DX10.1游戲

    ATI從HD3000系列開(kāi)始,也就是第二代DX10顯卡中,就全面提供了對(duì)DX10.1 API的支持。而對(duì)手NVIDIA則對(duì)于DX10.1比較抵觸,第二代GF9系列和第三代GTX200系列都不支持DX10.1,并且宣稱“DX10.1并非必須,DX10也能部分實(shí)現(xiàn)”之類的言論?!洞炭托艞l》這款原本支持DX10.1的游戲也迫于壓力在新版本中取消了支持。

    但是,NVIDIA前幾天剛剛發(fā)布的GT220顯卡卻非常低調(diào)的對(duì)DX10.1提供了支持。在DX11時(shí)代即將來(lái)臨之際,NVIDIA沒(méi)有將抵制DX10.1的策略進(jìn)行到底,而選擇了妥協(xié),真是令人費(fèi)解。


DX10.1雖然畫(huà)面方面改進(jìn)有限,但運(yùn)行速度確實(shí)加快了

    至少,NVIDIA用實(shí)際行動(dòng)證明了,DX10.1雖然改進(jìn)有限,但也并不是沒(méi)用。實(shí)際上,DX10.1只不過(guò)是微軟的一個(gè)試水石,其目的非常明確,那就是盡可能的提高DX10的渲染效能,達(dá)到節(jié)約GPU資源的目的,而DX11正是基于這種設(shè)計(jì)理念而來(lái)的。

第一章/第三節(jié) 全新的DirectX 11誕生,為高效率游戲而生

    從游戲畫(huà)面逼真度來(lái)看,短期內(nèi)恐怕沒(méi)有哪款游戲能夠達(dá)到Crysis的高度,但是這款依靠暴力模型、著色技術(shù)和諸多特效堆積而成的游戲,對(duì)顯卡的要求之高令人嘆為觀止,至今都沒(méi)有哪顆GPU敢打包票說(shuō)能在最高特效下面流暢運(yùn)行。也就是說(shuō)Cryengine 3是絲毫沒(méi)有考慮現(xiàn)有GPU的性能而開(kāi)發(fā)的一款超級(jí)引擎。


虛幻3是最高效最成功的引擎,Cryengine只是畫(huà)面最強(qiáng)的引擎

    以高效率著稱的虛幻引擎締造者Tim Sweeney稱,想要把現(xiàn)有游戲模型復(fù)雜度提高數(shù)十倍是很容易的事情(比如CG模型和影視渲染),但同樣的你也需要數(shù)十倍與現(xiàn)有主機(jī)機(jī)能的顯卡才能流暢運(yùn)行,比如三路甚至四路優(yōu)異系統(tǒng),而這種系統(tǒng)的市場(chǎng)占有率連1%都不到,獨(dú)孤求敗的Crysis還賣不過(guò)快餐式的使命召喚系列、Cryengine至今無(wú)法染指游戲機(jī)領(lǐng)域就是這個(gè)道理。

    所以,架空硬件的引擎是不可取的,唯有充分利用有限的GPU資源,通過(guò)各種輔助技術(shù)最大化畫(huà)面表現(xiàn)力,才是圖形技術(shù)公司和游戲開(kāi)發(fā)商首當(dāng)其沖要解決的內(nèi)容。

    因此,在DX10發(fā)布四年、成為主流之后,業(yè)界將期望都寄托在了DX11身上,雖然DX11并沒(méi)有帶來(lái)全新的特效,但卻通過(guò)各種手段提升了GPU的渲染效率,當(dāng)GPU有了富裕的運(yùn)算資源之后,游戲開(kāi)發(fā)商就可以大膽的去使用更多的特效和技術(shù),如此一來(lái)DX11游戲很容易就能從畫(huà)面到速度全面超越DX10游戲!

    DX11最關(guān)鍵的特性有以下五點(diǎn):

1. Tessellation:鑲嵌式細(xì)分曲面技術(shù)(第三章做專門解析)
2. Multi-Threading:多線程處理
3. DirectCompute 11:計(jì)算著色器(第二章做專門解析)
4. ShaderModel 5.0:著色器模型5.0版
5. Texture Compression:紋理壓縮

    下面筆者就對(duì)這些特性進(jìn)行詳細(xì)分析,來(lái)看看DX11是通過(guò)什么手段來(lái)提升渲染效率的。

第一章/第四節(jié) Shader Model 5.0

    Shader(譯為渲染或著色)是一段能夠針對(duì)3D對(duì)象進(jìn)行操作、并被GPU所執(zhí)行的程序,ShaderModel的含義就是“優(yōu)化渲染引擎模式”,我們可以把它理解成是GPU的渲染指令集。歷代DirectX每逢重大版本升級(jí)時(shí)最主要的更新內(nèi)容就包括在了ShaderModel之中:

    ShaderModel 1.0 → DirectX 8.0
    ShaderModel 2.0 → DirectX 9.0b
    ShaderModel 3.0 → DirectX 9.0c
    ShaderModel 4.0 → DirectX 10
    ShaderModel 5.0 → DirectX 11

    高版本的ShaderModel是一個(gè)包括了所有低版本特性的超集,對(duì)一些指令集加以擴(kuò)充改進(jìn)的同時(shí),還加入了一些新的技術(shù),現(xiàn)在我們就來(lái)看看DX11 SM5.0都有哪些新特性:

    由于統(tǒng)一渲染架構(gòu)的特性,Shader Moder 5.0是完全針對(duì)流處理器而設(shè)定的,所有類型的著色器,如:像素、頂點(diǎn)、幾何、計(jì)算、Hull和Domaim(位于Tessellator前后)都將從新指令集中獲益。

    其中,覆蓋采樣及Gather4紋理拾取兩項(xiàng)指令是從在DX10.1基礎(chǔ)上發(fā)展而來(lái)的,SM5.0要比SM4.1更加智能和靈活,它可以針對(duì)特定顏色分別采樣、還能自動(dòng)識(shí)別可做陰影映射的值,精度和效率都進(jìn)一步提高。

    由于DX10.1與DX10在指令方面的相似性,現(xiàn)有的DX10.1游戲可以很容易的通過(guò)更新程序代碼升級(jí)支持DX11,從而獲得更好的運(yùn)行效率,比如《風(fēng)起云涌》、《潛行者》、《科林麥克雷》將會(huì)率先引入DX11。

第一章/第五節(jié) Multi-threading多線程處理

    如果一個(gè)軟件能夠?qū)Χ嗪诵亩嗑€程處理器進(jìn)行優(yōu)化的話,那么在使用雙核或四核處理器時(shí),其運(yùn)行效率將會(huì)提升2-4倍,遺憾的是如今的游戲都無(wú)法支持多核處理。

    通過(guò)大量的游戲性能測(cè)試來(lái)看,GPU占絕對(duì)主導(dǎo),而CPU只是考驗(yàn)單核效能,通過(guò)對(duì)CPU極限超頻可以讓游戲性能提高不少,但使用四核或者帶HT技術(shù)的“八核”處理器幾乎不會(huì)有任何性能提升。在多核成為大勢(shì)所趨的情況下大量CPU資源被白白浪費(fèi),瓶頸可能依然卡在CPU上面。

    DX11當(dāng)中新增的多線程處理技術(shù),則是專門針對(duì)多核應(yīng)用而生的,它通過(guò)引入“延遲執(zhí)行”的指令將一個(gè)渲染進(jìn)程拆分為多個(gè)線程,并根據(jù)處理器核心/線程數(shù)設(shè)定延遲執(zhí)行內(nèi)容的數(shù)目。多線程的涵義是非常廣的,每一幀畫(huà)面可以被分為幾個(gè)圖層,每個(gè)圖層又可以分為N個(gè)區(qū)塊,所有的這些都可以被并行調(diào)度到延遲執(zhí)行的線程之中。

    這是一項(xiàng)很聰明的技術(shù),標(biāo)記為“立即執(zhí)行”的線程與傳統(tǒng)的渲染沒(méi)有區(qū)別,而標(biāo)記為“延遲執(zhí)行”的線程則可以在后臺(tái)將圖形生成所必須的資源做預(yù)先的存取,比如紋理拾取、像素生成、常數(shù)緩沖等操作都可以多線程并行處理,通過(guò)多核CPU富裕的資源來(lái)減少程序等待時(shí)間,從而使得渲染不再受到CPU的瓶頸制約。

    多線程技術(shù)是非常靈活的,它既可以在游戲中通過(guò)程序代碼來(lái)控制,也可以通過(guò)DirectX自動(dòng)分配,還能夠通過(guò)驅(qū)動(dòng)程序進(jìn)行優(yōu)化。即便是驅(qū)動(dòng)沒(méi)有針對(duì)多核進(jìn)行優(yōu)化,DX11運(yùn)行庫(kù)也會(huì)通過(guò)模擬的方式提供新的功能,也就是說(shuō)所有DX11游戲都將或多或少的從多核多線程CPU中獲益。

    多線程技術(shù)的引入對(duì)于雙卡甚至多卡互聯(lián)系統(tǒng)更為重要,以往多顆GPU在DirectX中只能模擬成一個(gè)虛擬GPU,所有的GPU必須共享指令緩沖區(qū)并接受CPU調(diào)度,渲染線程的拆分與合并指令延遲都很大,GPU越多則效率越低!而在DX11當(dāng)中,如果用四核CPU搭配四路交火系統(tǒng)的話,每顆CPU都可以單獨(dú)控制一顆GPU的渲染線程,在均分CPU負(fù)擔(dān)的同時(shí),提高了GPU資源利用率,從而大幅提升游戲性能。

    其實(shí)多線程技術(shù)也能應(yīng)用在DX9/DX10甚至是OpenGL上面,但由于API及函數(shù)指令的限制,開(kāi)啟多線程會(huì)產(chǎn)生很多重復(fù)的指令,導(dǎo)致性能提升有限甚至不升反降,因此微軟并不建議在舊API模式開(kāi)啟多線程模式,除非程序員做過(guò)嚴(yán)格的測(cè)試與優(yōu)化。

第一章/第六節(jié) 兩種新的紋理壓縮格式

    豐富的紋理細(xì)節(jié)對(duì)于最終圖像的質(zhì)量尤為重要,目前的游戲也都在朝著超大規(guī)模、超精細(xì)的紋理細(xì)節(jié)方向發(fā)展。但是,大規(guī)模的紋理非常占用顯存以及帶寬。而紋理壓縮就是為了解決這個(gè)問(wèn)題,將大規(guī)模的紋理以一種優(yōu)化的算法進(jìn)行壓縮。試想,如果圖象的紋理都不進(jìn)行壓縮的話,那么2GB的顯存容量恐怕都不夠用。

為王位而生 GeForce8800全面解析測(cè)試
細(xì)致的紋理效果

    但是,目前紋理壓縮技術(shù)并不支持HDR(高動(dòng)態(tài)范圍)圖像,這也是開(kāi)啟HDR很占用顯存的一個(gè)很大的原因。為了解決這個(gè)問(wèn)題,DirectX 11加入了兩種新的壓縮算法——BC6H和BC7。其中,BC6H是專門針對(duì)HDR圖像設(shè)計(jì)的壓縮算法,壓縮比為6:1;而B(niǎo)C7是專門給高品質(zhì)RGB[A]紋理設(shè)計(jì)的壓縮算法,壓縮比為3:1。

    上圖展示的是圖像通過(guò)BC6H壓縮模式進(jìn)行壓縮的前后效果對(duì)比圖。其中左邊的圖像為原始圖像,中間的是在壓縮過(guò)程中損失的一些細(xì)節(jié),而右邊的就是壓縮后的圖像。可以看出,從畫(huà)質(zhì)上來(lái)看幾乎沒(méi)有損失(肉眼看不出),但是卻可以大幅度降低顯存的占用。

    這幅圖展示的是BC7針對(duì)LDR紋理的壓縮與傳統(tǒng)的BC3紋理壓縮對(duì)比??梢钥闯鰝鹘y(tǒng)的BC3紋理壓縮損失了大量的紋理細(xì)節(jié),壓縮之后的效果也很不好。而采用BC7算法壓縮后的紋理,丟失的細(xì)節(jié)很少,效果也非常好,這就是改進(jìn)紋理壓縮的魅力。

第二章 DirectCompute:不止是通用計(jì)算

    此前在測(cè)試階段,微軟將DirectX 11中包含的GPU通用計(jì)算稱為Compute Shader或DirectX Compute,而在近期的正式版本中又改名為Direct Compute,一字(X)之差何必呢?顯然,微軟為了將GPU通用計(jì)算和主要是3D應(yīng)用的DirectX區(qū)別開(kāi),進(jìn)一步凸出Direct Compute的重要性并與OpenCL分庭抗力,由此足以見(jiàn)得微軟對(duì)GPU通用計(jì)算的重視程度。

    DirectCompute主要針對(duì)GPU計(jì)算,但由此可以衍生出一些在圖形渲染方面的特殊應(yīng)用,因此筆者將其單列一章,對(duì)一些重要技術(shù)進(jìn)行詳細(xì)介紹。

第二章/第一節(jié) DirectCompute與Stream/CUDA/OpenCL的關(guān)系

    提起GPU通用計(jì)算,自然會(huì)讓人想到NVIDIA的CUDA、ATI的Stream以及開(kāi)放式的OpenCL標(biāo)準(zhǔn),再加上微軟推出的DirectCompute,四種技術(shù)標(biāo)準(zhǔn)令人眼花繚亂,他們之間的競(jìng)爭(zhēng)與從屬關(guān)系也比較模糊。

    首先我們來(lái)明確一下概念:

  • OpenCL類似于OpenGL,是由整個(gè)業(yè)界共同制定的開(kāi)放式標(biāo)準(zhǔn),能夠?qū)τ布讓又苯舆M(jìn)行操作,相對(duì)來(lái)說(shuō)比較靈活,也很強(qiáng)大,但開(kāi)發(fā)難度較高;
  • DirectCompute類似于DirectX,是由微軟主導(dǎo)的通用計(jì)算API,與Windows集成并偏向于消費(fèi)領(lǐng)域,在易用性和兼容性方面做得更出色一些;
  • CUDA和Stream更像是圖形架構(gòu)或并行計(jì)算架構(gòu),NVIDIA和ATI對(duì)自己的GPU架構(gòu)自然最了解,因此會(huì)提供相應(yīng)的驅(qū)動(dòng)、開(kāi)發(fā)包甚至是現(xiàn)成的應(yīng)用程序,通過(guò)半開(kāi)放的形式授權(quán)給程序員使用。


ATI Stream示意圖

    其中ATI最先提出GPGPU的概念,Folding@Home和AVIVO是當(dāng)年的代表作,但在被AMD收購(gòu)后GPGPU理念擱淺;此后NVIDIA后來(lái)者居上,首次將CUDA平臺(tái)推向市場(chǎng),在這方面投入了很大的精力,四處尋求合作伙伴的支持,并希望CUDA能夠成為通用計(jì)算的標(biāo)準(zhǔn)開(kāi)發(fā)平臺(tái)。


NVIDIA CUDA示意圖

    在NVIDIA大力推廣CUDA之初,由于OpenCL和DirectCompute標(biāo)準(zhǔn)尚未定型,NVIDIA不得不自己開(kāi)發(fā)一套SDK來(lái)為程序員服務(wù),這套基于C語(yǔ)言的開(kāi)發(fā)平臺(tái)為半開(kāi)放式標(biāo)準(zhǔn),只能用于NVIDIA自家GPU,因此并未得到業(yè)界的認(rèn)可,AMD認(rèn)為CUDA是封閉式標(biāo)準(zhǔn),不會(huì)有多少前途,AMD自家的Stream雖然是完全開(kāi)放的,但由于資源有限,對(duì)程序員幫助不大,因此未能得到大量使用。


OpenCL一經(jīng)提出就受到業(yè)界的大力支持

    于是在去年由蘋(píng)果牽頭,以蘋(píng)果OpenCL草案為基礎(chǔ),聯(lián)合業(yè)界各大企業(yè)共同完成了標(biāo)準(zhǔn)制定工作。隨后Khronos Group成立相關(guān)工作組,工作組的26個(gè)成員來(lái)自各行各業(yè),且都是各自領(lǐng)域的領(lǐng)導(dǎo)者,具體包括3DLABS、Activision Blizzard、AMD、蘋(píng)果、ARM、Barco、博通、Codeplay、EA、愛(ài)立信、飛思卡爾、HI、IBM、Intel、Imagination、Kestrel Institute、摩托羅拉、Movidia、諾基亞、NVIDIA、QNX、RapidMind、三星、Seaweed、TAKUMI、德州儀器、瑞典于默奧大學(xué)。

    OpenCL標(biāo)準(zhǔn)一經(jīng)成立,IT三巨頭Intel、NVIDIA和AMD都爭(zhēng)先恐后的加入支持。AMD由于自家Stream推廣不利、支持OpenCL并不意外;Intel即將發(fā)布的Larrbee GPU一大賣點(diǎn)就是強(qiáng)大的計(jì)算能力,支持OpenCL有百利而無(wú)一害;NVIDIA雖然在大力推廣CUDA開(kāi)發(fā)平臺(tái),但無(wú)奈勢(shì)單力薄,小有所成但前途未卜,OpenCL雖然與CUDA C語(yǔ)言有交集但并不沖突,是相輔相成的互補(bǔ)關(guān)系,NVIDIA自然也大力支持。

    OpenCL組織中唯獨(dú)微軟不在其列,微軟有自己的如意算盤(pán)。經(jīng)過(guò)多年的發(fā)展,DirectX憑借快速更新?lián)Q代策略、相對(duì)輕松的開(kāi)發(fā)與移植方式,在與OpenGL的交戰(zhàn)中已全面占據(jù)上風(fēng),OpenGL的傳統(tǒng)強(qiáng)項(xiàng)——專業(yè)繪圖領(lǐng)域也在被DirectX不斷的蠶食。因此微軟打算用相同的策略來(lái)對(duì)抗尚未站住根基的OpenCL,于是DirectCompute誕生了。

    就如同GPU能同時(shí)支持DirectX與OpenGL那樣,NVIDIA和AMD對(duì)DirectCompute和OpenCL都提供了無(wú)差別支持,真正的GPU通用計(jì)算之戰(zhàn),不在CUDA與Stream之間,而是OpenCL與DirectCompute之爭(zhēng),DX11時(shí)代才剛剛開(kāi)始……

第二章/第二節(jié) DirectCompute 10/11版本間的區(qū)別

    雖說(shuō)DirectCompute標(biāo)準(zhǔn)才剛剛問(wèn)世,但目前已經(jīng)有了三個(gè)版本,它與微軟的DirectX版本是一一對(duì)應(yīng)的(10.0、10.1、11.0),畢竟DirectCompute目前還只是DirectX的一個(gè)子集,羽翼未豐之前難以自立門戶。


簡(jiǎn)單的拖曳操作,就能使用Win7內(nèi)置的GPU視頻轉(zhuǎn)碼程序

    10月份即將發(fā)布的Windows 7操作系統(tǒng)將會(huì)內(nèi)置DX11及DirectCompute,對(duì)GPU通用計(jì)算提供原生支持。Win7對(duì)GPU的要求放得很寬,只要支持DX10即可,當(dāng)然DX10.1更好DX11最完美。

    DirectCompute是與DX11一同發(fā)布的,因此相比“過(guò)去式”的10.0版,DirectCompute 11作出的改進(jìn)比較多:

    可以看出,同DX11類似,DirectCompute 11的改進(jìn)主要集中在降低系統(tǒng)資源開(kāi)銷與提高效能方面,也就是說(shuō)新的DX11顯卡會(huì)有更強(qiáng)的通用計(jì)算效能。而舊的DX10顯卡雖然會(huì)慢一些,但實(shí)現(xiàn)的功能也不會(huì)差多少,如此一來(lái)就完美的解決的兼容性問(wèn)題,也能很好的凸出新顯卡的優(yōu)勢(shì),用戶和廠商皆大歡喜。

    雖然DirectCompute的主要任務(wù)是用來(lái)處理非圖形運(yùn)算,但很多時(shí)候它還是需要做一些圖形相關(guān)的擦邊球任務(wù)、或者是輔助圖形渲染,比如說(shuō)視頻數(shù)據(jù)處理、物理運(yùn)算、人工智能等,這些操作最終還是需要通過(guò)顯卡輸出至屏幕,因此計(jì)算著色器會(huì)經(jīng)常與像素著色器打交道,當(dāng)像素著色器使用到計(jì)算著色器的新特性之后,就會(huì)衍生出一些意想不到的新特效。

    接下來(lái)就為大家介紹一些屬于DirectCompute 11的新技術(shù),當(dāng)然它們也屬于DX11的范疇。

第二章/第三節(jié) DirectCompute 11新特效:順序無(wú)關(guān)透明化

    煙霧、火焰、流水、玻璃、樹(shù)葉、柵欄、頭發(fā)……游戲中所出現(xiàn)的半透明物體數(shù)不勝數(shù),程序員很難給這些物體設(shè)計(jì)一個(gè)固定的模型,它們不規(guī)則、隨機(jī)的特性決定了單純依靠傳統(tǒng)的像素著色或者紋理貼圖都是行不通的,因此這類物體有了一個(gè)新的稱呼——Order Independent Transparency (OIT,順序無(wú)關(guān)透明化)。


傳統(tǒng)的透明混合效果很差

    此前,程序員必須在每幀渲染之前對(duì)透明模型進(jìn)行深度排序或者執(zhí)行諸如深度剝離的Multi-Pass(多次)算法,以達(dá)成模型間正確的透明度。不管哪種辦法,都不能像非透明模型那樣實(shí)現(xiàn)正確的局部的Post-Processing(后處理)效果,而且會(huì)消耗很多資源。

    DX11則首次在沒(méi)有額外專用電路的情況下,透過(guò)一個(gè)每像素空間數(shù)據(jù)結(jié)構(gòu)對(duì)多個(gè)透明表面的排序?qū)崿F(xiàn)對(duì)順序無(wú)關(guān)透明化的支持,解決方法就是讓GPU參與運(yùn)算,通過(guò)使用DirectCompute 11新增的原子操作,無(wú)需直接軟件管理就能往分級(jí)緩存的不同層級(jí)裝載數(shù)據(jù),依照每個(gè)像素透明層數(shù)來(lái)分配獨(dú)占的內(nèi)存。如此一來(lái)程序設(shè)計(jì)的復(fù)雜度顯著降低,并且數(shù)據(jù)結(jié)構(gòu)可以采用難以預(yù)測(cè)的非結(jié)構(gòu)化的內(nèi)存存取,DirectCompute 11新增的附加緩沖也會(huì)派上用場(chǎng)。

    由于DX10不支持原子操作,因此無(wú)法支持順序無(wú)關(guān)透明化這項(xiàng)新特效,只能依靠傳統(tǒng)的方式來(lái)實(shí)現(xiàn)差強(qiáng)人意的效果。而DX11不但畫(huà)面更好,而且實(shí)現(xiàn)效率非常高,大量使用附加緩沖從而節(jié)約了顯存帶寬消耗。

    上面的視頻就是由HD5870實(shí)時(shí)演算出來(lái)的,機(jī)器人本身就是半透明的骨架,為其附加一層厚厚的外殼后,即便進(jìn)行劇烈運(yùn)動(dòng),性能也沒(méi)有多少損失。DirectCompute 11不但讓半透明物體的程序設(shè)計(jì)變得輕松,而且實(shí)時(shí)渲染效能也大幅提升,可以預(yù)見(jiàn)未來(lái)的DX11游戲?qū)?huì)大量使用半透明效果。

    就像大家通過(guò)數(shù)碼相機(jī)拍完照片后需要經(jīng)過(guò)PS處理一樣,3D模型在GPU內(nèi)部渲染完成后也會(huì)經(jīng)過(guò)后端處理才會(huì)顯示在屏幕上,這一過(guò)程叫做“Render Post-Processing”(渲染后端處理),常見(jiàn)的如“邊緣偵測(cè)與抗鋸齒、各向異性過(guò)濾、景深、運(yùn)動(dòng)模糊、色彩映射、濾波、銳化”等一些列特效都是在這一階段加上去的。

    GPU有專門負(fù)責(zé)渲染后端處理的模塊,叫做“Render Back-Ends”(ROPs),也就是通常所說(shuō)的光柵單元,這個(gè)模塊位于流處理器與顯存控制器之間,也就是說(shuō)它渲染完畢后將會(huì)把數(shù)據(jù)直接輸出到顯存與屏幕。

第二章/第四節(jié) DirectCompute 11新特效:渲染后端處理之景深

    在DX10時(shí)代,光柵單元的任務(wù)量是很重的,如果大量使用后端處理特效的話,很容易出現(xiàn)像素著色器等待光柵單元的情況出現(xiàn)。所以很多DX10游戲的GPU負(fù)載還不如DX9C游戲就不足為怪了。而DX11則通過(guò)一個(gè)巧妙的方式降低了光柵單元的負(fù)擔(dān),確保流處理器和光柵單元能夠協(xié)同工作,原理依然是使用計(jì)算著色器。

    各種后端處理特效的最終效果雖然千差萬(wàn)別,但它們大多數(shù)都有一個(gè)共同的特點(diǎn),那就是需要對(duì)比相鄰位置像素或者相鄰幀之間像素的差別,然后進(jìn)行對(duì)比與合成。這一拾取動(dòng)作其實(shí)只用一個(gè)函數(shù)就能完成——Gather4,它使得計(jì)算著色器能夠越權(quán)進(jìn)行數(shù)據(jù)采集動(dòng)作,幫助紋理單元和光柵單元的減輕負(fù)擔(dān),而且計(jì)算著色器的數(shù)據(jù)采集速度是專用單元的4倍!

決不忽悠!DX10游戲性能免費(fèi)提升2.5倍
DX10版景深處理

    具體一點(diǎn)例子,比如DX10級(jí)別的運(yùn)動(dòng)模糊和景深特效,都是通過(guò)幾何著色來(lái)實(shí)現(xiàn)的,通過(guò)幾何著色控制運(yùn)動(dòng)物體的坐標(biāo)變換與像素監(jiān)控,或?qū)⑸疃忍麍D中的紋理信息按照距離拆分到緩沖,然后分為幾個(gè)不同的視角進(jìn)行渲染,最后合成完整的圖像,實(shí)現(xiàn)比DX9C更精確、更流暢的特效。畫(huà)面效果是更出色了,但幾何著色并沒(méi)有幫助光柵單元做任何事情,數(shù)據(jù)處理反而翻了好幾倍,導(dǎo)致性能下降比較嚴(yán)重。

    而通過(guò)使用DirectCompute 11中的新指令,后端處理特效可以最大限度的降低顯存讀寫(xiě)次數(shù)、大幅降低光柵單元的負(fù)擔(dān),當(dāng)然流處理器將會(huì)承擔(dān)更多的任務(wù)(幾何著色、計(jì)算著色、像素著色),但依然能夠保持相對(duì)的平衡,不會(huì)出現(xiàn)DX10當(dāng)中GPU資源負(fù)載不均的情況。

    這個(gè)演示視頻將景深特效表現(xiàn)的淋漓盡致,它模擬攝像機(jī)調(diào)整對(duì)焦的方式,實(shí)時(shí)切換主角并虛化背景,整個(gè)過(guò)程與人眼、照相機(jī)、攝像機(jī)的毫無(wú)二致。這項(xiàng)全新的景深渲染技術(shù)是由AMD與加州大學(xué)伯克利分校創(chuàng)新的,它同樣無(wú)需任何額外專用的電路,只要顯卡支持DirectCompute 11即可,兼顧性能與效果,非常完美!

第二章/第五節(jié) DirectCompute 11新特效:渲染后端處理之高清晰環(huán)境光遮蔽

    “環(huán)境光遮蔽”(Ambient Occlusion,AO)是一種非常復(fù)雜的光照技術(shù),通過(guò)計(jì)算光線在物體上的折射和吸收在受影響位置上渲染出適當(dāng)?shù)年幱?,進(jìn)一步豐富標(biāo)準(zhǔn)光照渲染器的效果?!捌聊豢臻g環(huán)境光遮蔽”(SSAO)就是該技術(shù)的一個(gè)變種,現(xiàn)已用于《潛行者:晴空》、《火爆狂飆》、《鷹擊長(zhǎng)空》、《帝國(guó):全面戰(zhàn)爭(zhēng)》等游戲。


《鷹擊長(zhǎng)空》支持SSAO和DX10.1

    SSAO是DX10.1的一項(xiàng)新特性,通過(guò)使用Gather4技術(shù)實(shí)現(xiàn)更快速、更精確的紋理過(guò)濾,雖然DX10.1版Gather4只能處理單一的顏色分量,但依然對(duì)處理陰影內(nèi)核和SSAO挺不錯(cuò),因?yàn)樯疃染彌_是一個(gè)單顏色分量。DX10顯卡通過(guò)更新驅(qū)動(dòng)也能支持SSAO,NVIDIA就在驅(qū)動(dòng)當(dāng)中提供了SSAO選項(xiàng),但由于性能損失很大默認(rèn)情況下關(guān)閉的。


晴空也支持SSAO,而STALKER新版則支持HDAO,效果更上一層樓

    在DX11時(shí)代AO效果又有了更優(yōu)秀的版本,AMD稱之為High Definition Ambient Occlusion,簡(jiǎn)稱HDAO,翻譯為高清晰環(huán)境光遮蔽。這是一種基于紋理的陰影技術(shù),能提供比普通環(huán)境光遮蔽更好的效果,同時(shí)保證系統(tǒng)性能足夠好。

    下面就來(lái)看看AMD自己對(duì)HDAO技術(shù)的演示Demo:


首先是關(guān)閉HDAO的效果,幀率188FPS


打開(kāi)HDAO,陰影真實(shí)了很多(尤其是坦克履帶),但幀率驟降到20FPS以下

    最后,使用DirectCompute 11技術(shù),在打開(kāi)HDAO的模式下渲染正率提升至44FPS,性能提升兩倍以上,基本可以保證游戲流暢度。

    DX11大作《異形大戰(zhàn)鐵血戰(zhàn)士》將會(huì)大量使用HDAO特效。

第三章 DX11之ATI獨(dú)門絕技Tessellation全解析

    Tessellation技術(shù)是DX11的關(guān)鍵特性之一,這里之所以要把它單獨(dú)提出來(lái)列為一章,是因?yàn)樵摷夹g(shù)與ATI有著很深的淵源,可以說(shuō)Tessellation是ATI一手策劃,經(jīng)過(guò)多年的改進(jìn)與完善而來(lái)的獨(dú)門絕技。

第三章/第一節(jié) 并不陌生的Tessellation技術(shù)

    雖說(shuō)Tessellation是ATI的獨(dú)門絕技,但這也并不意味著N卡無(wú)法支持Tessellation技術(shù),在DX11吸納了Tessellation之后,未來(lái)NVIDIA的DX11顯卡應(yīng)該也會(huì)加以支持。

完美DX10!ATI新王者HD2900XT權(quán)威評(píng)測(cè)
Tessellation技術(shù)讓模型變得更加細(xì)膩

    Tessellation一詞相信很多人都有印象,沒(méi)錯(cuò),它就是ATI第一代DX10核心R600(HD2900XT)中的一個(gè)特殊模塊,從HD2000系列開(kāi)始、到HD3000再到如今的HD4000系列,ATI的每一款DX10顯卡都支持這項(xiàng)技術(shù),雖然還沒(méi)有任何一款游戲能夠支持該技術(shù),但ATI依然孜孜不倦的對(duì)它提供支持,因?yàn)锳TI堅(jiān)信——是金子總會(huì)發(fā)光的!

    終于在DX11時(shí)代,微軟將Tessellation作為一項(xiàng)重要標(biāo)準(zhǔn)納入規(guī)范之中,這項(xiàng)被埋沒(méi)多年的技術(shù)得以重見(jiàn)天日。那么Tessellation究竟是何方神圣,讓ATI技術(shù)人員如此執(zhí)著,微軟到底是“禁不住軟磨硬泡”、“勉為其難”的吸納之,還是為其先進(jìn)的特性所傾倒,欣然接納之?故事還得從七年前的Radeon 8500系列談起……

第三章/第二節(jié) 2002年R200:Tessellation的鼻祖N-Patch及TruForm

    話說(shuō)2001年7月的時(shí)候,微軟即將推出DirectX最新的8.1版本,所以就在Meltdown2001會(huì)議上把ATI、NVIDIA等一干圖形技術(shù)公司叫來(lái)開(kāi)會(huì),一起商定DX8.1的一些技術(shù)細(xì)節(jié)。這次會(huì)議可以說(shuō)是圖形圖像界的“華山論劍”,不光有主辦商及核心廠商可以參加,媒體甚至也可以買票入場(chǎng),票價(jià)是650美元,當(dāng)時(shí)著名的八卦網(wǎng)站TheInquirer就參加了這次會(huì)議(要不是它我們就不知道這段典故了)。據(jù)他們報(bào)道,由于技術(shù)細(xì)節(jié)方面的爭(zhēng)執(zhí)比較大,NV和微軟的關(guān)系搞得有點(diǎn)僵,而且NV拒簽當(dāng)時(shí)正在開(kāi)發(fā)的DX9協(xié)議。

完美DX10!ATI新王者HD2900XT權(quán)威評(píng)測(cè)
2001年7月 西雅圖 ATI無(wú)疑成為了Meltdown2001的主角

    講這段八卦歷史并不是為了討論誰(shuí)和微軟走的更近,而是因?yàn)檫@次會(huì)議上其實(shí)就決定了DX8.1標(biāo)準(zhǔn)及部分DX9標(biāo)準(zhǔn)。微軟這次在DX8.1的規(guī)范中提出了一個(gè)叫做“N-Patch”的技術(shù),相比之前的各種虛擬3D和位移貼圖技術(shù)而言是一種非常精妙的技術(shù)。它能夠像位移貼圖那樣自動(dòng)創(chuàng)造頂點(diǎn),但是卻不需要高度圖來(lái)做參數(shù),使模型自動(dòng)的變得極為光滑。

  
原始模型和經(jīng)過(guò)N-Patch處理之后的效果

    N-Patch技術(shù)的原理是這樣的:GPU在讀取了一個(gè)模型之后,判斷每個(gè)三角形三個(gè)頂點(diǎn)的法線向量,再根據(jù)這三個(gè)向量算出插入的頂點(diǎn)的位置。如此一來(lái)就能將一個(gè)簡(jiǎn)單的、有棱有角模型通過(guò)“差值”的算法實(shí)時(shí)處理成為復(fù)雜的、圓滑的模型,在當(dāng)時(shí)GPU運(yùn)算能力極為有限的情況下,N-Patch技術(shù)可以大幅提升3D模型的細(xì)節(jié)和顯示效果。

完美DX10!ATI新王者HD2900XT權(quán)威評(píng)測(cè)

    NPatch技術(shù)非常適合于將一個(gè)模型變得“圓滑”。因此非常適合于一些有很多曲面的模型。因?yàn)閷?duì)于曲面的表現(xiàn),通常的表現(xiàn)方法只是盡量多的使用內(nèi)割多邊形或者外切多邊形來(lái)模擬曲面的效果。N-Patch技術(shù)的巧妙之處就在于算法簡(jiǎn)單,只要進(jìn)行多次遞歸運(yùn)算,就能將一個(gè)面做成一個(gè)高次曲面,N-Patch這個(gè)詞的本意也就是一個(gè)N次曲面。

    次年(2002),在ATI的R200(Radeon 8500)顯示芯片中,就率先采用了N-Patch技術(shù),在ATI自己的官方介紹中稱之為“TruForm”。

TruForm技術(shù)的BUG:

    TruForm的好處是效率會(huì)比位移貼圖高,以極低的資源消耗實(shí)現(xiàn)較好的顯示效果。不過(guò)呢,這個(gè)技術(shù)比較適合于海豚、賽車等表面為曲面的模型上,而如果這個(gè)技術(shù)應(yīng)用在坦克等不需要做曲面化的模型上的時(shí)候,效果就會(huì)變得相當(dāng)?shù)幕?/P>

完美DX10!ATI新王者HD2900XT權(quán)威評(píng)測(cè)
英雄薩姆中槍械模型發(fā)生變形現(xiàn)象(不該圓滑的表面被圓滑)
 
完美DX10!ATI新王者HD2900XT權(quán)威評(píng)測(cè)
CS中人物模型變成了“胖子”(人體又圓又胖)

    雖然TRUFORM技術(shù)非常具有創(chuàng)意,而且還能給大家?guī)?lái)意象不到的快樂(lè),但是這一技術(shù)的應(yīng)用情況并沒(méi)有像微軟和ATI所期望的那樣。正是因?yàn)楫a(chǎn)生了這一滑稽的BUG,TruForm在整個(gè)DX9a/b/c時(shí)代便銷聲匿跡了。<

第三章/第三節(jié) 2005年Xenos:Tessellation登陸XBOX360主機(jī)

    由于考慮不周導(dǎo)致技術(shù)不成熟的原因,ATI在DX9時(shí)代不再整合TruForm功能。但是,微軟和ATI都沒(méi)有放棄這一極具創(chuàng)意的技術(shù),N-Patch/TruForm的設(shè)計(jì)初衷就是節(jié)約GPU資源,通過(guò)簡(jiǎn)單高效的手段讓低模3D游戲搖身變?yōu)楦咂焚|(zhì)模型。

    到了2005年,在微軟與ATI的合作結(jié)晶——專為XBOX360設(shè)計(jì)的圖形芯片Xenos當(dāng)中,經(jīng)過(guò)改進(jìn)的N-Patch/TruForm技術(shù)重出江湖,這次它有了一個(gè)很響亮的名稱——Tessellation,直譯為“拆嵌”意譯為“細(xì)分曲面”。

    此次微軟和ATI吸取了教訓(xùn),Tessellation不再像TruForm那樣自作聰明的對(duì)所有模型強(qiáng)制進(jìn)行曲面細(xì)分化,而是按照不同游戲中特定模型的需求有針對(duì)性的處理。因此以往的BUG不復(fù)存在了,但需要游戲本身提供支持才能生效。

完美DX10!ATI新王者HD2900XT權(quán)威評(píng)測(cè)

完美DX10!ATI新王者HD2900XT權(quán)威評(píng)測(cè)

完美DX10!ATI新王者HD2900XT權(quán)威評(píng)測(cè)
應(yīng)用了Tessellation技術(shù)的XBOX360游戲畫(huà)面

    通過(guò)為數(shù)不多的支持Tessellation技術(shù)的XBOX360游戲來(lái)看,細(xì)分曲面技術(shù)讓模型細(xì)節(jié)變得極為豐富,事實(shí)上這些游戲?qū)iT挑選了一些動(dòng)物模型讓Tessellation處理——這顯然是它的拿手絕活!

    除了大幅提升模型細(xì)節(jié)和畫(huà)質(zhì)外,Tessellation最吸引程序員的地方就是:他們無(wú)需手動(dòng)設(shè)計(jì)上百萬(wàn)個(gè)三角形的復(fù)雜模型,只需簡(jiǎn)單勾繪一個(gè)輪廓,剩下的就可以交給Tessellation技術(shù)自動(dòng)拆嵌,大大提高開(kāi)發(fā)效率;而且簡(jiǎn)單的模型在GPU處理時(shí)也能大幅節(jié)約顯存開(kāi)銷,同時(shí)大幅提升渲染速度!

    不過(guò),Tessellation技術(shù)依然具有局限性,而且很多游戲開(kāi)發(fā)商都在跨平臺(tái)開(kāi)發(fā)游戲,對(duì)于這項(xiàng)只有XBOX360支持、PS3和PC顯卡都不支持的技術(shù)不感興趣,因此支持Tessellation的XBOX360游戲屈指可數(shù)。

    Xenos這顆基于R580核心的特殊DX9C GPU,除了首次支持Tessellation和當(dāng)時(shí)先進(jìn)的HDR+AA技術(shù)外,還第一次采用了統(tǒng)一渲染架構(gòu),這些技術(shù)都被ATI改進(jìn)并沿用到了DX10時(shí)代。

第三章/第四節(jié) 2007年R600:Tessellation臥薪嘗膽

    現(xiàn)在看來(lái),R600核心是一款非常失敗的產(chǎn)品,功耗高、發(fā)熱大、性能低、AA效能差,但是當(dāng)R600(320SP)的架構(gòu)擴(kuò)充至RV770(800SP)的規(guī)模時(shí),就沒(méi)人敢輕易對(duì)這套體系架構(gòu)評(píng)頭論足了。事實(shí)上R600的失敗在于冒險(xiǎn)采用80nm工藝、512Bit環(huán)形總線、以及Shader AA,而其核心架構(gòu)的運(yùn)算能力并不輸給競(jìng)爭(zhēng)對(duì)手,因而一直被沿用至RV670、RV770還有如今的RV870身上。

    R600除了完全按照DX10和統(tǒng)一渲染架構(gòu)設(shè)計(jì)外,還整合了一個(gè)特殊的模塊:Programmable Tessellator,可編程拆嵌器。由于這個(gè)可有可無(wú)的模塊占用晶體管并不多,因此AMD之后的全系列DX10 GPU中都集成了可編程拆嵌器。

完美DX10!ATI新王者HD2900XT權(quán)威評(píng)測(cè)
R600核心架構(gòu)圖

    這個(gè)可編程拆嵌器可要比XBOX360高明很多,R600核心能夠根據(jù)3D模型中已經(jīng)有的頂點(diǎn),根據(jù)不同的需求,按照不同的規(guī)則,進(jìn)行插值,將一個(gè)多邊形拆分成為多個(gè)多邊形。而這個(gè)過(guò)程都是可以由編程來(lái)控制的,這樣就很好的解決了效率和效果的矛盾。

完美DX10!ATI新王者HD2900XT權(quán)威評(píng)測(cè)
Tessellation技術(shù)讓模型變得更加細(xì)膩

    現(xiàn)在我們就更容易理解Tessellation技術(shù)是怎么回事了,它是一種能夠在圖形芯片內(nèi)部自動(dòng)創(chuàng)造頂點(diǎn),使模型細(xì)化,從而獲得更好畫(huà)面效果的技術(shù)。Tessellation能自動(dòng)創(chuàng)造出數(shù)百倍與原始模型的頂點(diǎn),這些不是虛擬的頂點(diǎn),而是實(shí)實(shí)在在的頂點(diǎn),效果是等同于建模的時(shí)候直接設(shè)計(jì)出來(lái)的。

    R600的Tessellation技術(shù)支持多種決定插值頂點(diǎn)位置的方法來(lái)創(chuàng)造各種曲面:
 
1. N-Patch曲面,就是和TRUFORM技術(shù)一樣,根據(jù)基礎(chǔ)三角形頂點(diǎn)的法線決定曲面。
2. 貝塞爾曲面,根據(jù)貝塞爾曲線的公式計(jì)算頂點(diǎn)的位置。
3. B-Spline, NURBs, NUBs 曲線(這三種曲線均為CAD領(lǐng)域常用曲線,在Maya中均有相應(yīng)工具可以生成)
4. 通過(guò)遞歸算法接近Catmull-Clark極限曲面。

    有了多種無(wú)比強(qiáng)大的曲面生成技術(shù),在加上可編程的設(shè)計(jì),程序員在開(kāi)發(fā)游戲之初就能根據(jù)需要制定相關(guān)模型采用何種細(xì)分法則,從而避免出現(xiàn)變形和失真的問(wèn)題。

完美DX10!ATI新王者HD2900XT權(quán)威評(píng)測(cè)

    而且,Tessellation過(guò)程被安排在了頂點(diǎn)著色之前,這就意味著Tessellation所創(chuàng)造出來(lái)的頂點(diǎn)全都可以參與Vertex Shader的處理和運(yùn)算。這些頂點(diǎn)所帶來(lái)的所有細(xì)節(jié),將具備所有特效。

DX10魅力四射!3部R600 Demo視頻下載
基本的頂點(diǎn)模型,最終生成效果很幼稚

DX10魅力四射!3部R600 Demo視頻下載
經(jīng)過(guò)Tessellation智能拆嵌之后,模型精細(xì)了很多

完美DX10!ATI新王者HD2900XT權(quán)威評(píng)測(cè)
拆嵌后再輔以各種陰影及著色效果,從而以很小的代價(jià)達(dá)到CG級(jí)別畫(huà)面

    在R600發(fā)布時(shí),AMD拿出了一款CG級(jí)別實(shí)時(shí)渲染的Demo,其中被積雪所覆蓋的山體就是由Tessellation生成的。以往的演示Demo都是片面注重對(duì)主角的修飾,而背景往往只使用簡(jiǎn)單的紋理貼圖,而R600的這個(gè)Demo其背景和環(huán)境的精細(xì)程度甚至超越了主角Ruby。


HD3000/HD4000繼續(xù)支持Tessellation

    可惜,時(shí)至今日,只有ATI的官方Demo使用了自家的Tessellation技術(shù),還沒(méi)有任何一款PC游戲支持這項(xiàng)被孤立于DX10之外的非主流技術(shù),看來(lái)僅靠AMD還是孤掌難鳴的。

第三章/第五節(jié) 2009年RV870:Tessellation被正式納入DX11,修成正果

    在AMD的不懈努力下,雖然PC游戲開(kāi)發(fā)商依舊無(wú)動(dòng)于衷,但這個(gè)小小的可編程模塊卻受到了一些好萊塢CG影片設(shè)計(jì)公司的青睞,因?yàn)镃G動(dòng)畫(huà)對(duì)模型細(xì)節(jié)的精細(xì)程度要求十分苛刻,而Tessellation技術(shù)能夠以很小的資源開(kāi)銷讓模型細(xì)節(jié)豐富百倍,這種近乎免費(fèi)的畫(huà)質(zhì)提升無(wú)疑是非常誘人的。


Tessellation能夠同時(shí)加強(qiáng)地形和人物皮膚細(xì)節(jié)

    此后AMD將重心轉(zhuǎn)移至CG領(lǐng)域,并提出了Cinema 2.0的概念,為中小型圖形公司提供技術(shù)支持,靈活應(yīng)用Tessellation技術(shù)來(lái)高效的創(chuàng)作視頻短片及廣告特效。因此在DX10時(shí)代,雖然ATI全線顯卡均支持Tessellation技術(shù),但AMD卻沒(méi)有像DX10.1那樣做大張旗鼓的宣傳。


等到DX11正式接納Tessellation時(shí),AMD已經(jīng)是第六代技術(shù)了,真不容易

    經(jīng)過(guò)多年的發(fā)展,Tessellation已今非昔比,這款歷經(jīng)磨難、飽受屈辱、在逆境中茁壯成長(zhǎng)的技術(shù)現(xiàn)在更加靈活、高效、實(shí)用,微軟認(rèn)為時(shí)機(jī)再次成熟,于是被名正言順的納入DX11的范疇。

    消息一出,立馬就有回應(yīng)?!稇?zhàn)地:叛逆連隊(duì)2》第一個(gè)跳出來(lái)聲援,號(hào)稱全球首款DX11游戲,該游戲使用了新版Frostbite Engine,而ATI R600 Demo使用的正是該引擎:

DX10 Ruby Demo竟采用下代戰(zhàn)地引擎!
讓人印象深刻的雪山背景,這就是AMD與DICE合作開(kāi)發(fā)的Ruby Demo

    據(jù)DICE渲染架構(gòu)師Johan Anderson稱,從DX10到DX11的實(shí)際導(dǎo)入過(guò)程僅僅花費(fèi)了三個(gè)小時(shí),其中在代碼里搜索和替換相關(guān)部分最耗時(shí)間?,F(xiàn)在我們就不難理解戰(zhàn)地引擎升級(jí)支持DX11為何如此神速了,兩年前的戰(zhàn)地引擎就能支持Tessellation技術(shù),現(xiàn)在只不過(guò)是查找復(fù)制粘貼重新找回被閑置的代碼而已,那還不是輕車熟路?

    戰(zhàn)地引擎的使用者不在少數(shù),看來(lái)Tessellation技術(shù)以及DX11很快就將進(jìn)入實(shí)際應(yīng)用階段,臥薪嘗膽的Tessellation終于重見(jiàn)天日!

第三章/第六節(jié) DX11版Tessellation的改進(jìn)

    當(dāng)然,微軟并不是原封未動(dòng)的將R600的Tessellation技術(shù)抄到DX11之中,而是對(duì)其進(jìn)行了優(yōu)化,使之能與渲染流程完美的結(jié)合在一起,可以更高效率的細(xì)分出更多的多邊形和曲面。

    為了配合Tessellator模塊的工作,DX11中引入了兩個(gè)新的著色器:外殼著色器和域著色器,分別位于鑲嵌器的前后。而此前的DX10 A卡并不具備這個(gè)功能。

    雖然處理流程不同,但工作原理是相似的,此前用做DX11 Tesselltion原型測(cè)試的都是ATI DX10顯卡。只要游戲不作出硬性限制,目前的A卡就能實(shí)現(xiàn)細(xì)分曲面的特效,只不過(guò)在速度和效果方面不如DX11好。

第三章/第七節(jié) Tessellation在DX11游戲中的應(yīng)用實(shí)例

    由于此前的ATI DX10顯卡已經(jīng)具備了超前的Tessellation技術(shù),因此在即將問(wèn)世的DX11游戲中,使用最多的新技術(shù)非Tessellation莫屬,通過(guò)導(dǎo)入Tessellation,可以大幅提升模型細(xì)節(jié),由此所產(chǎn)生的視覺(jué)震撼遠(yuǎn)比那些在陰影或光照方面的改進(jìn)顯著。


《異形大戰(zhàn)鐵血戰(zhàn)士》里面的異形


點(diǎn)擊放大查看模型細(xì)節(jié)的改進(jìn)


使用Tessellation替代傳統(tǒng)的凹凸貼圖,層次感更強(qiáng)


《科林麥克雷:塵埃2》中Tessellation技術(shù)幾乎是無(wú)處不在

    DIRT2簡(jiǎn)直是Tessellation技術(shù)的代言人,隨風(fēng)飄揚(yáng)的旗幟、地形細(xì)節(jié)、水面渲染……此外,之前介紹過(guò)的戰(zhàn)地2引擎也堪稱Tessellation技術(shù)的代表作,ATI的Ruby Demo就是用戰(zhàn)地2引擎制作的,導(dǎo)入DX11技術(shù)后的戰(zhàn)地2引擎將會(huì)在明年正式發(fā)布。

第四章 DX11游戲?qū)崪y(cè)+視頻

第四章/第一節(jié) DX11游戲并不遙遠(yuǎn):第4季度發(fā)布4款

    2006年11月,首款DX10顯卡GeForce 8800GTX發(fā)布,當(dāng)時(shí)還沒(méi)有任何有關(guān)DX10游戲的影子,直到7個(gè)月后第一款DX10游戲《失落星球》才正式發(fā)布。

    2007年11月,首款DX10.1顯卡Radeon HD3870發(fā)布,當(dāng)時(shí)DX10.1并未引起玩家和業(yè)界的重視,5個(gè)月后第一款DX10.1游戲《刺客信條》發(fā)布,結(jié)果因?yàn)楸娝苤脑蚝芸炀捅弧昂椭C”了。

    如今,首款DX11顯卡Radeon HD5870橫空出世,也將面臨無(wú)DX11游戲可玩的局面,但這次玩家們不用等太久了。AMD稱在2009年第四季度,將會(huì)有四款DX11游戲正式發(fā)布(注意絕非測(cè)試版),2010年初陸續(xù)會(huì)有大作及DX11引擎面世。

    不出意外的話,已經(jīng)加入DX10.1支持的EA RTS網(wǎng)絡(luò)游戲《BattleForge》將會(huì)拔得頭籌,率先通過(guò)補(bǔ)丁升級(jí)支持DX11,預(yù)計(jì)將會(huì)在9-10月之間。

    已經(jīng)支持DX10.1技術(shù)的《潛行者:晴空》續(xù)作《潛行者:普里皮亞季的召喚》將會(huì)是第一款原生DX11游戲。

    《科林麥克雷:塵埃2》完全使用DX11引擎締造,通過(guò)目前泄漏的圖片和視頻來(lái)看,稱之為最強(qiáng)賽車游戲豪不為過(guò)。


AMD提供給媒體的5款DX11游戲Demo


最微軟最新的2009年8月DirectX更新包中,就包含了對(duì)DX11的支持

    現(xiàn)在,我們已經(jīng)率先拿到了這幾款DX11游戲的測(cè)試Demo,接下來(lái)我們就使用HD5870顯卡對(duì)其進(jìn)行測(cè)試,來(lái)一窺DX11顯卡的實(shí)例和DX11游戲的魅力。

第四章/第二節(jié) DX11游戲大作:《異形大戰(zhàn)鐵血戰(zhàn)士》

    關(guān)于異形和鐵血戰(zhàn)士這兩個(gè)名詞,最早要追述到20世紀(jì)??怂构驹?979年上映的賣座電影《異形》和1987年上映的賣座片《鐵血戰(zhàn)士》,很多影迷都對(duì)兩個(gè)系列電影很熟悉,它們講述的都是人類對(duì)抗太空外來(lái)生物的故事。而首度將兩個(gè)系列中的人類強(qiáng)敵異形和鐵血戰(zhàn)士放在一起,主要出自黑馬漫畫(huà)(Dark Horse Comics)出版的同名漫畫(huà)《Aliens vs Predator》(異形大戰(zhàn)鐵血戰(zhàn)士),這部漫畫(huà)又形成了一系列的游戲,在1990年代的游戲家用主機(jī)平臺(tái)和街機(jī)推出過(guò)很多同名游戲。

    最終連20世紀(jì)??怂构疽灿X(jué)得這個(gè)大亂斗主意不錯(cuò),于是在2004年出品了一部電影就叫做《異形大戰(zhàn)鐵血戰(zhàn)士》。這部電影上映之后,又出現(xiàn)了幾部游戲仍然叫做《異形大戰(zhàn)鐵血戰(zhàn)士》,其中有一部就是Rebellion開(kāi)發(fā)的PSP版《異形大戰(zhàn)鐵血戰(zhàn)士:挽歌》(Aliens vs. Predator: Requiem),這部游戲2007年11月上市,品質(zhì)很差。

    今天提到的這部《異形大戰(zhàn)鐵血戰(zhàn)士》,英文名稱還是“Aliens vs Predator”,也由Rebellion開(kāi)發(fā),世嘉發(fā)行。將會(huì)與2010年初與電影《異形大戰(zhàn)鐵血戰(zhàn)士3》同步發(fā)行,因此備受影迷和游戲玩家們期待。

    與其它粗制濫造騙錢的同名電影改編游戲不同,《異形大戰(zhàn)鐵血戰(zhàn)士》不僅在劇情和游戲可玩性方面下足了功夫,而且在游戲畫(huà)面方面將取得突破,AVP將會(huì)完全采用DX11引擎設(shè)計(jì),大量使用最新的技術(shù)和特效,力圖營(yíng)造出接近電影品質(zhì)的電腦游戲。


在2560分辨率下運(yùn)行AVP Demo

    AMD提供的《異形大戰(zhàn)鐵血戰(zhàn)士》Demo還不完整,只能顯示靜態(tài)場(chǎng)景,但已經(jīng)足以凸出DX11的技術(shù)優(yōu)勢(shì)和AVP的畫(huà)面了。以下就是筆者運(yùn)行游戲時(shí)的截圖:

    AVP支持DirectCompute 11指令輔助渲染,可以看出在開(kāi)啟計(jì)算著色器后,游戲的幀數(shù)要比單純像素著色器渲染更高,DX11高效率的優(yōu)勢(shì)體現(xiàn)出來(lái)了。

    DX11新增的HDAO(高清晰環(huán)境遮罩)技術(shù),效果要優(yōu)于DX10.1當(dāng)中的SSAO(屏幕空間環(huán)境光遮蔽),但性能損失確實(shí)不少,HDAO打開(kāi)后幀數(shù)一下從76降至49。

    動(dòng)態(tài)軟陰影開(kāi)啟前后的畫(huà)面差別還是很大的,性能損失尚能接受。

    開(kāi)啟Tessellation技術(shù)前后,異形的模型復(fù)雜度提升上百倍。

    而性能損失卻很小,因?yàn)門essellator是一個(gè)額外的模塊,不會(huì)消耗額外的資源。通過(guò)實(shí)際截圖來(lái)看,異形的模型改善不是很多,這主要是因?yàn)榻貓D是個(gè)靜態(tài)畫(huà)面,只有當(dāng)異形的身體運(yùn)動(dòng)起來(lái),才能體現(xiàn)出高精度模型的優(yōu)勢(shì)。

第四章/第三節(jié) DX11游戲大作:《科林麥克雷:塵埃2》

    《科林麥克雷:塵埃》本身是一款為紀(jì)念去世的英國(guó)拉力賽車手科林.麥克雷(Colin McRae)而制作的游戲,因此在游戲過(guò)程中不難見(jiàn)到許多麥克雷過(guò)往的身影。距前作將近二年多之久的《科林麥克雷:塵埃2》主機(jī)版已經(jīng)上市。 登陸平臺(tái):Xbox 360、PS3、Wii主機(jī),及PSP、DS掌機(jī)。PC版由于支持DX11的緣故,需延至今年12月。

    俗話說(shuō)慢工出細(xì)活,PC版將會(huì)帶來(lái)很多令人驚訝的特效和技術(shù),當(dāng)游戲機(jī)還停留在DX9C畫(huà)面之時(shí),PC版就可以在DX11模式下使用超高分辨率并開(kāi)啟高倍AA流暢運(yùn)行,整個(gè)游戲都煥然一新了!

    此前DX10引擎的《科林麥克雷:塵埃》絕對(duì)是賽車類游戲的畫(huà)面之王,令《優(yōu)品飛車》系列黯然失色,此次續(xù)作率先引入DX11支持,畫(huà)面表現(xiàn)更上一層樓,而由于運(yùn)行效率的提高,對(duì)顯卡的需求不會(huì)太夸張,但至少需要DX11的支持才能體驗(yàn)。

第四章/第四節(jié) DX11游戲:《BattleForge》

    《BattleForge》是一款史詩(shī)性的大型多人在線即時(shí)戰(zhàn)略游戲(RTS),將網(wǎng)游和即時(shí)戰(zhàn)略無(wú)縫結(jié)合在了一起。游戲不僅保留了即時(shí)戰(zhàn)略游戲的精髓,并允許玩家在網(wǎng)絡(luò)環(huán)境中與朋友進(jìn)行卡牌交易和收藏,玩家可以通過(guò)收集、交易卡片來(lái)組建自己的軍隊(duì),征服戰(zhàn)場(chǎng)?!禕attleForge》憑借多人在線的游戲設(shè)計(jì)及完整的社交溝通系統(tǒng),一舉成為戰(zhàn)略游戲界的先鋒之作。

    從技術(shù)角度講,這款游戲也非常值得關(guān)注,因?yàn)樗氏忍峁┝藢?duì)DX10.1技術(shù)和屏幕空間環(huán)境光遮蔽(SSAO)特效的支持,還針對(duì)多核心處理器進(jìn)行了優(yōu)化。

    因?yàn)橹С諨X10.1的緣故,A卡在該游戲中的表現(xiàn)十分搶眼,HD4870就能接近GTX285的水平。游戲支持的SSAO技術(shù)頗為消耗資源,關(guān)閉這項(xiàng)特效FPS幾乎可以翻倍。據(jù)了解,很快該游戲就會(huì)加入對(duì)DX11的支持,從而支持更為先進(jìn)的HDAO特效,畫(huà)面和速度雙重提升。

第四章/第五節(jié) DX11游戲引擎——《Frostbite Engine 2》

    最早宣稱支持DX11的就是《霜寒2》(Frostbite2)引擎,DICE膽敢口出狂言也是有資本的,因?yàn)锳TI DX10時(shí)代的Ruby Demo就使用了《Frostbite2》的引擎,這個(gè)Demo大量使用了Tessellation技術(shù)。如今Tessellation被DX11收入囊中,為游戲提供支持簡(jiǎn)直是輕車熟路。

DX10 Ruby Demo竟采用下代戰(zhàn)地引擎!
讓人印象深刻的雪山背景,這就是AMD與DICE合作開(kāi)發(fā)的Ruby Demo

    Frostbite2與Tessellation有較深的淵源,但Tessellation只是DX11的一小部分,F(xiàn)rostbite2除此之外將會(huì)使用到很多DirectCompute 11當(dāng)中的新指令來(lái)提高游戲運(yùn)行效率,對(duì)于游戲引擎來(lái)說(shuō)高效率遠(yuǎn)比高畫(huà)質(zhì)來(lái)的重要,畫(huà)面只是展示技術(shù)的手段,效率才是吸引游戲開(kāi)放商的利器,DX11在這兩方面都有很大的優(yōu)勢(shì),因此備受業(yè)界關(guān)注。

    但遺憾的是,Andersson透露《戰(zhàn)地:叛逆連隊(duì)2》只會(huì)采用Frostbite 1.X引擎,叛逆連隊(duì)2支持DX10.0、10.1、PS3、X360,不會(huì)采用之前廣為流傳的DX11 API,因?yàn)镈X11只屬于Frostbite2引擎。

DX10完美圖賞:R600 Ruby和戰(zhàn)地2引擎
不可思議的地形細(xì)節(jié)
 
DX10完美圖賞:R600 Ruby和戰(zhàn)地2引擎
沒(méi)有絲毫遮蔽的宏大場(chǎng)景

    上面的一部分截圖來(lái)自Frostbite Engine 2技術(shù)Demo,不清楚究竟是哪款游戲,又或者是引擎專門開(kāi)發(fā)作為演示的。我們可以從中一窺該引擎的能力,尤其是對(duì)于自然環(huán)境的3D刻畫(huà)性能。

第四章/第六節(jié) DX11游戲引擎——《Cry Engine 3》

    德國(guó)德國(guó)Crytek Studios公司旗下的《Crysis》(孤島危機(jī))及其Cry Engine 2引擎的成功是有目共睹的,至今沒(méi)有任何一款游戲在游戲畫(huà)面方面能與之相提并論,也沒(méi)有哪款游戲?qū)︼@卡的需求能夠超越他,目前最強(qiáng)的單核心顯卡在最高特效下運(yùn)行Crysis都非常吃力,難怪游戲玩家們把Crysis親切的稱之為“顯卡危機(jī)”。

讓DX10俯首稱臣!20款顯卡決戰(zhàn)[虛幻3]

    Cry Engine 2是DX10的集大成者,它幾乎應(yīng)用到了DX10所衍生出來(lái)的所有特效和技術(shù),“濫用”這些特效帶來(lái)了近乎無(wú)敵的畫(huà)面,同時(shí)也制造了空前的“顯卡危機(jī)”。

    Crysis在游戲玩家心目中有著非常崇高的地位,但卻讓游戲開(kāi)發(fā)商望而卻步,因?yàn)樗囊嫣^(guò)BT,特效經(jīng)過(guò)多次“閹割”后主流的平臺(tái)依然跑不順暢。因此沒(méi)人膽敢使用這款游戲引擎,該引擎更是無(wú)法應(yīng)用在游戲主機(jī)平臺(tái)之上。所以,Crytek在開(kāi)發(fā)Cry Engine 3時(shí)將工作中心集中在了優(yōu)化效能上面,使之能屈能伸,在繼續(xù)保持畫(huà)面之王的同時(shí),還能降低需求力圖登陸游戲主機(jī)。

    目前,關(guān)于Cry Engine 3尚無(wú)明確的聲明顯示它會(huì)支持DX11 API,但通過(guò)此前泄漏的一些資料以及Crytek公司的風(fēng)格來(lái)看,第一時(shí)間加入對(duì)DX11的支持幾乎就是板上釘釘?shù)氖聦?shí)。想必大家也沒(méi)忘記Crytek的FarCry(Cry Engine 1)就是首批DX9游戲,此后通過(guò)補(bǔ)丁率先支持DX9C,為大家?guī)?lái)了美輪美奐的HDR及HDR+AA特效。

    Cry Engine 3將會(huì)改進(jìn)支持如下的新特效,其中很多都與DX11的特性類似:

  • 實(shí)時(shí)動(dòng)態(tài)光照(Real-time Dynamic Illumination)
  • 延遲光照(Deferred Lighting )
  • 動(dòng)態(tài)軟陰影( dynamic soft shadows )
  • 容積云與視距霧
  • 法線貼圖與視差遮蔽貼圖
  • POLYBUMP 技術(shù)支持工具對(duì)應(yīng)多核心與 64bit
  • 屏幕空間環(huán)境光遮蔽(SSAO:Screen Space Ambient Occlusion)
  • 綜合植被和地形覆蓋生成系統(tǒng)(Integrated Vegetation and Terrain Cover Generation System)
  • 新的HDR渲染模式 (Eye adaption & High Dynamic Range Lighting)
  • 運(yùn)動(dòng)模糊與景深 (Pristine Motion Blur & Depth of Field)
  • 高品質(zhì)的水面效果
  • 即時(shí)神圣光芒表現(xiàn) (Dynamic Volumetric Light Beams & Light Shaft Effects)

    與其它想借助DX11推銷游戲的策略不同,Crytek是一家力求完美的公司,它不會(huì)搶第一這個(gè)虛名,而是努力做到非常好的。Cry Engine 2在畫(huà)面方面至今依然是無(wú)敵的,資源開(kāi)銷太大不夠彈性這個(gè)缺點(diǎn)相信Crytek也是心里有數(shù),有了DX11的技術(shù)支持,相信Cry Engine 3將會(huì)有更完美的表現(xiàn),讓我們一同期待《Crysis 2》的到來(lái)吧。

第五章 首顆DX11 GPU:RV870核心架構(gòu)解析

  • 首顆支持DirectX 11的GPU;
  • 提供最強(qiáng)DX9/10/10.1性能;
  • 為最新的OpenCL 1.0和DirectCompute 11通用計(jì)算API提供優(yōu)化支持;
  • 在功耗不變的情況下實(shí)現(xiàn)規(guī)格和性能翻倍;
  • 支持3屏甚至6屏超大畫(huà)面輸出。

    以上是ATI對(duì)RV870核心的設(shè)計(jì)目標(biāo),我們來(lái)看看到底是如何做到的。

第五章/第一節(jié) RV870核心架構(gòu)圖

    自從DX10時(shí)代以來(lái),ATI和NVIDIA雙方的GPU架構(gòu)就沒(méi)有多大變化,NVIDIA的G9X和GT200都沿用了G80的MIMD(多指令多數(shù)據(jù)流)標(biāo)量流處理器架構(gòu),而ATI則一直使用R600上面的SIMD(單指令多數(shù)據(jù)流)超標(biāo)量流處理器架構(gòu)。

    RV870的核心架構(gòu)與R600、RV670和RV770沒(méi)有本質(zhì)區(qū)別,它是一顆用新工藝制造的、用大量晶體管堆積而成的超高規(guī)格GPU。


RV770核心架構(gòu)圖

    RV870相比RV770/RV790除了流處理器數(shù)量之外,紋理單元和光柵單元數(shù)量也全面翻倍。與同頻率的HD4890相比,HD5870的理論數(shù)據(jù)正好是前者的兩倍。

    唯一遺憾的就是,RV870的顯存控制器位寬沒(méi)有翻倍,只是將GDDR5的顯存頻率進(jìn)一步提升。因此HD5870的實(shí)際游戲性能不可能達(dá)到HD4890的兩倍,只能是接近兩倍。

第五章/第二節(jié) RV870竟然是單芯片“雙核心”GPU

    細(xì)心的讀者應(yīng)該會(huì)發(fā)現(xiàn),此次RV870的核心架構(gòu)圖很有特點(diǎn),那就是流處理器部分并不是完整的一塊,而是被切割為左右對(duì)稱的兩半部分,與之關(guān)聯(lián)的紋理單元及一級(jí)緩存也被一分為二:


RV870的流處理器部分

    如果單獨(dú)拿一半流處理器出來(lái)觀察的話,就會(huì)發(fā)現(xiàn)它的結(jié)構(gòu)與RV770幾乎沒(méi)有區(qū)別,RV870的一半就是RV770,其主要規(guī)格如下:

  • 左右各10組SIMD陣列,每組SIMD綁定4個(gè)紋理單元及緩存;
  • 每組SIMD陣列當(dāng)中擁有16個(gè)線程處理器;
  • 每個(gè)線程處理器中包括5個(gè)流處理器。

    這樣的結(jié)構(gòu)與雙核CPU十分相似,兩顆“核心”各自獨(dú)立,獨(dú)享L1、共享L2和內(nèi)存控制器等其他總線模塊,而兩顆“核心”之間則通過(guò)專用的數(shù)據(jù)共享及請(qǐng)求總線通信。那為什么不把流處理器想以前那樣設(shè)計(jì)成為一個(gè)整體而要分為兩個(gè)模塊呢?


RV770的流處理器布局

    AMD產(chǎn)品事業(yè)部GPU工程研發(fā)副總裁王啟尚指出,RV870核心擁有規(guī)??涨暗?1.5億個(gè)晶體管,芯片設(shè)計(jì)及制造難度都相當(dāng)高,如果把最復(fù)雜的流處理器部分拆分為幾個(gè)模塊的話,復(fù)雜度就會(huì)大大降低,這就能極大的加快研發(fā)進(jìn)度,并一定程度上提高芯片良品率。

    當(dāng)然RV870依然是一顆完整核心,流處理器部分的模塊化設(shè)計(jì)并不會(huì)影響性能的發(fā)揮,因?yàn)镚PU本身就是一顆擁有較多核心的處理器,它并不像CPU那樣受到軟件因素的制約。但如果兩顆獨(dú)立的GPU通過(guò)交火模式組成雙核心顯卡的話,顯卡驅(qū)動(dòng)和游戲優(yōu)化就變得極為重要了。

第五章/第三節(jié) RV870核心控制引擎

    R870的圖形架構(gòu)可以拆分為以下幾個(gè)模塊,一個(gè)一個(gè)來(lái)看都有什么改進(jìn):

  • Command Processor(指令處理器)
  • Graphics Engine(圖形裝配引擎)
  • Ultra-Threaded Dispatch Processor(超線程分配處理器)
  • Stream Processing Units(流處理器)
  • Texture Units(紋理單元)
  • Cache & Buffer(緩存及緩沖區(qū))
  • Shader Export & Render Back-Ends(像素輸出部分)
  • Memory Control(顯存控制器)
  • Display Controllers(輸出接口控制器)

Command Processor(指令處理器)

    Command Processor負(fù)責(zé)從PCI-E總線發(fā)出或者接受指令流,讓GPU在驅(qū)動(dòng)程序給定的時(shí)間間隔中完成恒定數(shù)據(jù)流操作,此過(guò)程需要通過(guò)Parallel DMA Engine,調(diào)用系統(tǒng)內(nèi)存或者是本地顯存的相關(guān)資源。

● Graphics Engine(圖形裝配引擎)

    之前這個(gè)模塊被稱為Setup Engine,是GPU負(fù)責(zé)指令分配和安裝的模塊,主要負(fù)責(zé)給GPU內(nèi)部各大模塊將要執(zhí)行的指令準(zhǔn)備數(shù)據(jù),我們將其稱之為裝配引擎。裝配引擎之中有很多模塊,包括Tessellator(鑲嵌器)、Vertex Assembler(頂點(diǎn)裝配器)、Geometry Assembler(幾何裝配器)、Rasterizer(光柵器)、Hierarchial-Z(多級(jí)Z緩沖模塊)等。

    RV870相比RV770,最主要的變化就是擁有兩個(gè)光柵器和多級(jí)Z緩沖模塊,而此前的GPU都只有一個(gè)。這可不是因?yàn)镽V870本身是“雙核”的關(guān)系,因?yàn)轫旤c(diǎn)裝配器和幾何裝備器都只有一個(gè)。

    裝配過(guò)程:頂點(diǎn)數(shù)據(jù)裝配完畢后,頂點(diǎn)三角形內(nèi)插操作不再使用獨(dú)立的硬件單元,而是交由流處理器處理,由DX11中新增的外殼著色器和域著色器替代,這兩個(gè)著色器將輔助鑲嵌器進(jìn)行細(xì)分操作,生成新的頂點(diǎn)。

    接下來(lái)三角形頂點(diǎn)的2D坐標(biāo)信息經(jīng)過(guò)Rasterizer(光柵器)之后就得到了像素信息,也就是得到了屏幕上每個(gè)點(diǎn)的數(shù)據(jù)信息。進(jìn)行這部分操作的時(shí)候也經(jīng)過(guò)掃面轉(zhuǎn)換生成了每個(gè)點(diǎn)的Z軸信息,這些信息將被傳輸?shù)絑軸緩沖之中,以備后用。

    現(xiàn)在我們就可以理解為什么RV870要設(shè)計(jì)兩個(gè)光柵器和多級(jí)Z緩沖模塊了,因?yàn)镈X11 Tessellator的關(guān)系,最終的模型將變得十分復(fù)雜,需要處理的指令數(shù)量很多,合理的分配任務(wù)并暫存數(shù)據(jù)很關(guān)鍵。RV870改進(jìn)了連續(xù)存取緩存時(shí)的性能。

    Hierarchical Z是一項(xiàng)非常智能的技術(shù),在GPU完成坐標(biāo)轉(zhuǎn)換之后,Hierarchical Z會(huì)不斷對(duì)比各個(gè)頂點(diǎn)的Z軸位置,一旦Hierarchical Z發(fā)現(xiàn)這個(gè)頂點(diǎn)不需要顯示,將會(huì)直接將其剔除避免后續(xù)無(wú)效渲染,它將有效控制由Tessellator所帶來(lái)的性能損失。

    即便是在DX9或DX10應(yīng)用中,雙倍的Rasterizer和Hierarchical Z也能大幅提升GPU在高分辨率和多屏超高分辨率下的性能表現(xiàn)。

 Ultra-Threaded Dispatch Processor(超線程分配處理器)

    最后,所有的像素/頂點(diǎn)/幾何/紋理/顏色等數(shù)據(jù)經(jīng)過(guò)Interpolators(排序器)之后交給Shader進(jìn)行處理,當(dāng)然在此之前還有一項(xiàng)必備的工序,那就是數(shù)據(jù)的重新封裝打包,以及指定相應(yīng)的統(tǒng)一渲染單元運(yùn)算,這部分任務(wù)由超線程分配處理器完成。

第五章/第四節(jié) RV870流處理器規(guī)格特性解析

    繼續(xù)將RV870的SIMD陣列放大,就可以看到其流處理器的微觀架構(gòu)了。RV870總共擁有320個(gè)Thread Processor(線程處理器),這是它不可分割的最小單元,相當(dāng)于以前的Shader Unit,每個(gè)線程處理器內(nèi)部又包含了5個(gè)功能各異的處理核心,因此RV870總共擁有1600個(gè)流處理器:


RV870的Thread Processor結(jié)構(gòu)圖

    在線程處理器內(nèi)部,這5個(gè)流處理器是在Branch Unit(分歧執(zhí)行單元)的控制下處理數(shù)據(jù)流和條件運(yùn)算,在General Purpose Registers(通用寄存器)中存取或輸出數(shù)據(jù),但并不存放指令。與傳統(tǒng)GPU ALU架構(gòu)不同的是,這5個(gè)流處理器可以在動(dòng)態(tài)流控制的支配下自由的處理任何組合形式的指令,諸如1+1+1+1+1、2+2+1、4+1等組合形式。

完美DX10!ATI新王者HD2900XT權(quán)威評(píng)測(cè)

    宏觀上RV870依然是SIMD(單指令多數(shù)據(jù)流)矢量架構(gòu),但在微觀上可以稱之為超標(biāo)量架構(gòu)(Superscalar),完美支持Co-issue(矢量指令和標(biāo)量指令并行執(zhí)行),單時(shí)鐘周期可以進(jìn)行5次MAD(Multiply-Add,乘加)運(yùn)算。另外還可以看到,5個(gè)1D ALU其中有個(gè)“胖”一點(diǎn)的,它除了MAD之外還能夠進(jìn)行一些特殊(SIN、COS、LOG、EXP等函數(shù))運(yùn)算,在特殊條件下提高運(yùn)算效率!

    在流處理器部分,RV870加入了DX11新增的位操作類指令,并優(yōu)化了Sum of Absolute Differences(SAD,誤差絕對(duì)值求和)算法,指令執(zhí)行速度提升12倍,此項(xiàng)指令可以在OpenCL底層執(zhí)行。SAD算法應(yīng)用最多的就是H.264/AVC編碼的移動(dòng)向量估算部分(約占整個(gè)AVC編碼總時(shí)間的80%),如此一來(lái)使用RV870做視頻編碼類通用計(jì)算時(shí),性能會(huì)大幅提升!

    RV870的單精度浮點(diǎn)運(yùn)算能力為2720GFLOPS,雙精度浮點(diǎn)運(yùn)算能力為單精度的1/5,也高達(dá)544GFLOPS。對(duì)手GTX285的單精度浮點(diǎn)運(yùn)算能力為1063GFLOPS,但雙精度下降為1/8,僅133GFLOPS,很難滿足高精度的科學(xué)計(jì)算領(lǐng)域的需要。

第五章/第五節(jié) 紋理單元和緩存

圖形渲染部分:

    RV870的紋理單元及一級(jí)緩存是與SIMD流處理器陣列綁定的,左右各10組SIMD陣列,每組SIMD綁定4個(gè)紋理單元及緩存。雖然RV870的流處理器及紋理單元數(shù)量全面翻倍,但是每組SIMD陣列所獨(dú)享的數(shù)量卻沒(méi)有增多,但RV870對(duì)它做了一些改進(jìn)。

  • 紋理帶寬提升:每秒可完成680億次雙線性過(guò)濾,2720億次32bit紋理拾取
  • 一級(jí)緩存:容量160KB,帶寬1TB/s
  • 二級(jí)緩存:容量512KB,帶寬435GB/s
  • 新的DX11特性:支持16kx16k紋理,新的BC6/7 HDR紋理壓縮算法

    除了DX11的新特性外,RV870在紋理單元部分的改進(jìn)可以讓所有游戲受益,它可以支持完美無(wú)角度的各向異性紋理過(guò)濾,而性能衰減幅度與之前的AF算法一致,通過(guò)理想的細(xì)節(jié)度調(diào)整確保更高的紋理貼圖質(zhì)量。

通用計(jì)算部分:

  • 全芯片共享一個(gè)64KB的Global Data Share(公用數(shù)據(jù)緩存)
  • 每個(gè)SIMD陣列共享32KB本地?cái)?shù)據(jù)緩存,共20組,可彈性配置
  • 紋理單元在通用計(jì)算中負(fù)責(zé)數(shù)據(jù)拾取,每組紋理單元(4個(gè))共享8KB一級(jí)緩存,共20組
  • 每個(gè)顯存控制器綁定128KB二級(jí)緩存
  • 支持DirectComput 11中的附加緩沖利用技術(shù)

第五章/第六節(jié) 光柵單元和抗鋸齒

    同紋理單元類似,RV870的光柵單元數(shù)量也是全面翻倍,因此抗鋸齒性能同比提升一倍。除此之外,還有不少改進(jìn):

  • 紋理單元可直接讀取光柵單元中的色彩緩存數(shù)據(jù)
  • CFAA(可編程過(guò)濾抗鋸齒)性能大幅提升
  • 采樣率提升,高倍AA效能改進(jìn)
  • 有能力直接提供最高畫(huà)質(zhì)的SSAA(超級(jí)采樣抗鋸齒)
  • AAA(自適應(yīng)抗鋸齒)和CFAA可以與SSAA完美兼容

    根據(jù)AMD官方提供的數(shù)據(jù)來(lái)看,HD5870在開(kāi)啟8xAA模式后,性能相比4xAA下降幅度非常小,而對(duì)手單核最強(qiáng)的GTX285則在8xAA模式下性能損失非常大。RV870翻倍的光柵單元數(shù)量及改進(jìn)的算法功不可沒(méi)!

第五章/第七節(jié) 更高頻更節(jié)能的第四代GDDR5

    RV770首次了GDDR5顯存,但其威力尚未被完全釋放出來(lái),HD4870的顯存頻率只有900MHz(等效3600MHz),而且由于是第一代產(chǎn)品,GDDR5很多優(yōu)秀的特性沒(méi)能得到發(fā)揮,導(dǎo)致功耗與發(fā)熱比較大。

    GDDR5標(biāo)準(zhǔn)是在AMD的主導(dǎo)下建立的,在發(fā)現(xiàn)問(wèn)題之后,AMD在RV790核心與RV740核心中改進(jìn)了顯存控制器,解決一些問(wèn)題,從而使得GDDR5的功耗得到了很好的控制。

    RV870核心則再次改進(jìn)了顯存控制器,AMD稱這已經(jīng)是第三代GDDR5顯存,此次GDDR5的頻率被一舉提升至1200MHz(等效4800MHz),真正達(dá)到了雙倍于GDDR3的頻率,與此同時(shí)功耗控制卻做的相當(dāng)出色,使得HD5870空閑時(shí)的功耗得以降至難以想象的27W!

RV870為什么不使用384/512Bit顯存控制器?

    通過(guò)前文的介紹可以知道,在RV870內(nèi)部幾乎所有的硬性規(guī)格都翻了一倍,唯獨(dú)顯存控制器依然保持256Bit不變。要知道光有翻倍的流處理器和紋理單元,還不足以使得RV870的游戲性能相比RV770提升一倍,那為什么RV870不使用更高的384或者512Bit顯存控制器呢?

    AMD產(chǎn)品事業(yè)部GPU工程研發(fā)副總裁王啟尚指出,由于GDDR5顯存的頻率是GDDR3的兩倍,因此上代的HD4870和HD4890能夠以256bit達(dá)到接近于512bit的顯存帶寬,超過(guò)100GB/s的顯存帶寬對(duì)于RV770/RV790核心來(lái)說(shuō)有些富裕,因此玩家們超顯存所帶來(lái)的性能提升并不顯著,超核心則能獲得較大的提升。

    對(duì)于RV870核心來(lái)說(shuō),由于流處理器、紋理、光柵全面翻倍,對(duì)于顯存帶寬的需求也水漲船高,此時(shí)第一代GDDR5的帶寬有些捉襟見(jiàn)肘,所以AMD使用了頻率更高的第三代GDDR5,此時(shí)150GB/s的帶寬雖然還是滿足不了RV870的胃口,但也不至于造成瓶頸,玩家們通過(guò)超核心和超顯存都能獲得較大幅度的性能提升,可以說(shuō)核心規(guī)格和顯存規(guī)格達(dá)到了一個(gè)比較平衡的比率。

    如果使用512Bit顯存控制器的話,自然也能獲得性能提升,但是要付出很大的代價(jià)——512Bit控制器要占據(jù)不少晶體管,使得GPU核心面積大增,而且512Bit需要至少16顆顯存,顯存采購(gòu)成本和PCB及供電設(shè)計(jì)難度都很大,可謂是牽一發(fā)而動(dòng)全身,得不償失。

GDDR5顯存的主要特性及優(yōu)勢(shì)

  • 使用DDR3的8bit預(yù)取技術(shù),實(shí)現(xiàn)相同帶寬所需的內(nèi)核頻率減半;
  • 采用雙I/O總線,實(shí)現(xiàn)相同帶寬所需的I/O頻率減半;
  • 額定電壓從1.8V降至1.5V:功耗進(jìn)一步下降;
  • 數(shù)據(jù)和地址總線轉(zhuǎn)位技術(shù):信號(hào)質(zhì)量高、功率消耗少;
  • 智能的可編程I/O控制接口:簡(jiǎn)化PCB設(shè)計(jì)和成本;
  • 數(shù)據(jù)遮蓋技術(shù):減輕數(shù)據(jù)總線壓力;

    關(guān)于GDDR5顯存更詳細(xì)的技術(shù)解析請(qǐng)看“剪不斷理還亂!DDR1-3和GDDR1-5全解析”一文。

HD5870第三代GDDR5顯存的特性

  • 錯(cuò)誤偵測(cè)和校驗(yàn):提高高頻率下的傳輸效率,避免災(zāi)難性錯(cuò)誤;
  • 顯存頻率和溫度補(bǔ)償:在5GHz以上高頻率下工作時(shí)更穩(wěn)定可靠
  • 電壓和頻率快速切換:允許通過(guò)降頻和降壓的手段大幅降低顯存功耗與發(fā)熱

    可以看到,在2D模式下,HD5870的核心頻率從850MHz降至157MHz,顯存頻率從1200MHz降至300MHz。目前最強(qiáng)的核心搭配最強(qiáng)的顯存,待機(jī)功耗居然只有27W,真是不可思議!

第六章 ATI Eyefinity三屏/六屏顯示技術(shù)解析

第六章/第一節(jié) 單純提升分辨率已經(jīng)達(dá)到上限

    近年來(lái),GPU的性能翻了無(wú)數(shù)倍,畫(huà)面和特效有了質(zhì)的飛躍,但最終輸出的圖像分辨率卻是一成不變的——1920x1080是目前的絕對(duì)主流,2560x1600就已經(jīng)是上限了,為什么分辨率不能再大一點(diǎn)呢?


雙Dual-Link DVI的配置已經(jīng)沿用好多年沒(méi)變過(guò)了

    瓶頸就在液晶顯示器面板的制造上面,切割液晶面板跟切割硅晶片有些類似,面板/核心越大,良品率就越低,成本就越高,幾乎成級(jí)數(shù)增長(zhǎng)。硅晶片出了問(wèn)題還能夠激光修復(fù)或者屏蔽,正常使用完全沒(méi)有問(wèn)題,而一整塊液晶面板有較多壞點(diǎn)的話,相信沒(méi)人愿意買單。

擁抱高清!2560×1600極限實(shí)測(cè)8款游戲
單純提升分辨率達(dá)到了液晶面板的極限

    所以,高分辨率的液晶面板都是天價(jià),主要供醫(yī)療、科研、遙感等需要處理高精度圖像的專業(yè)領(lǐng)域使用,難以進(jìn)入消費(fèi)級(jí)市場(chǎng)。對(duì)于游戲玩家來(lái)說(shuō),優(yōu)異的30寸顯示器所提供的2560分辨率就是較高級(jí)別,3840分辨率的專業(yè)顯示器刷新率只能到30Hz,而且點(diǎn)距尺寸太小,根本不適合玩游戲。

    既然分辨率無(wú)法繼續(xù)提升,解決方法只有一個(gè),那就是組建多屏系統(tǒng)。相信很多人都有雙屏應(yīng)用的經(jīng)驗(yàn),對(duì)于多任務(wù)來(lái)說(shuō),雙屏可以獲得更大的自由分配空間,有利于提高工作效率;但對(duì)于游戲玩家來(lái)說(shuō),雙屏幾乎毫無(wú)用處,主屏玩游戲的話無(wú)法同時(shí)對(duì)副屏操作,如果雙屏擴(kuò)展的話對(duì)于游戲簡(jiǎn)直是個(gè)噩夢(mèng)!

你只玩了1/3的游戲!3D環(huán)幕技術(shù)大測(cè)試

    對(duì)于游戲玩家而言,雙顯示器是沒(méi)有意義的,當(dāng)擴(kuò)展分辨率之后,您所面對(duì)的屏幕最中間始終是顯示器的黑邊,從玩游戲的角度來(lái)說(shuō),不需要雙顯示器、四顯示器更沒(méi)必要,只有三顯示器才適合人類的視角——中間需要一個(gè)主屏幕,兩邊用來(lái)擴(kuò)充視野。那么現(xiàn)在的問(wèn)題就是單顯卡只能雙頭輸出而且性能有限,SLI/CrossFire和Quad SLI僅能單頭輸出,怎么辦呢。

第六章/第二節(jié) Matrox三屏環(huán)幕技術(shù)回顧

為什么要三頭輸出:

    實(shí)際上在此之前Matrox和NVIDIA/ATI都在專業(yè)2D領(lǐng)域擁有四頭甚至多頭輸出的解決方案,為什么Matrox還要努力推行三頭輸出技術(shù)呢?這是因?yàn)閷I(yè)顯卡和游戲顯卡的劃分是涇渭分明的,能夠多頭輸出的無(wú)法玩游戲,玩游戲的無(wú)法多頭輸出,難道就沒(méi)有完美的解決方案嗎?

你只玩了1/3的游戲!3D環(huán)幕技術(shù)大測(cè)試
幻日系列只有兩個(gè)DVI,但卻是完美的三頭輸出

    Matrox在消費(fèi)級(jí)市場(chǎng)的最后一款顯卡——“幻日”,本來(lái)就是針對(duì)主流市場(chǎng)設(shè)計(jì)的,Matrox既想要保持完美的2D輸出,還要保證強(qiáng)悍的3D游戲性能,另外就是加入了真正的三頭輸出支持。聽(tīng)起來(lái)非常完美,很可惜這款顯卡失敗了,Matrox也帶著自己的遺憾黯然離去,NVIDIA和ATI繼續(xù)瘋狂的在3D速度和規(guī)格方面廝殺——用Matrox的話說(shuō)在顯示和輸出方面不思進(jìn)取。

神奇的三頭輸出解決方案誕生——TripleHead2Go(3D環(huán)幕儀):

你只玩了1/3的游戲!3D環(huán)幕技術(shù)大測(cè)試   你只玩了1/3的游戲!3D環(huán)幕技術(shù)大測(cè)試

    終于,Matrox在之前DualHead2Go的基礎(chǔ)上,成功的研發(fā)了三頭輸出的TripleHead2Go,中文名稱為3D環(huán)幕儀。Matrox帶來(lái)的3D環(huán)幕儀能夠像變魔術(shù)一樣讓一個(gè)顯卡的輸出口擴(kuò)展為三個(gè),由此實(shí)現(xiàn)三屏幕環(huán)幕游戲或者是四屏幕專業(yè)作圖顯示。

Matrox重返游戲領(lǐng)域!3D環(huán)幕儀全賞析
3D環(huán)幕技術(shù)玩帝國(guó)時(shí)代III

    千萬(wàn)不要以為TripleHead2Go單純的比DualHead2Go多了一路輸出而已!TripleHead2Go是一款極具創(chuàng)意的全新產(chǎn)品,它能夠把三個(gè)顯示器模擬成為一個(gè)超寬屏幕的顯示器,從而讓游戲畫(huà)面能擴(kuò)展輸出至全部的三個(gè)屏幕,而多塊顯卡雖然理論上能支持?jǐn)?shù)十個(gè)屏幕,但大多數(shù)游戲都無(wú)法支持多屏輸出。

Matrox重返游戲領(lǐng)域!3D環(huán)幕儀全賞析

    TripleHead2Go的設(shè)計(jì)理念很有意思,但缺點(diǎn)也很明顯,它只能通過(guò)VGA模擬輸出,僅能支持1280x1024的普通顯示器,沒(méi)法支持更高分辨率的顯示器。因?yàn)樗墓δ苤皇菍@卡的一個(gè)輸出接口拆分成三個(gè)接口,這樣三個(gè)接口的總分辨率不可能超過(guò)Dual-Link DVI 2560*1600=4096000的像素限制,而1280*1024*3=3932160則剛剛好,再高一點(diǎn)點(diǎn)都不行。

    再者,這個(gè)顯示盒也價(jià)值不菲,驅(qū)動(dòng)設(shè)置更新比較麻煩,還有跟游戲也存在一些兼容性問(wèn)題。最主要的問(wèn)題還是無(wú)法兼容中高分辨率的顯示器,因此未能成為主流。

第六章/第三節(jié) ATI的驚人設(shè)計(jì) RV870最多支持六屏輸出

    當(dāng)Matrox的TripleHead2Go快要被遺忘的時(shí)候,ATI拿出了驚人的設(shè)計(jì)方案,在首顆DX11 GPU RV870當(dāng)中直接集成了一個(gè)6通道的顯示控制器——無(wú)需任何外接芯片或者輸出方案,而且這六個(gè)通道都能支持2560x1600分辨率的10bit色顯示!

    這項(xiàng)技術(shù)ATI稱之為“Eyefinity”,最多可以通過(guò)DisplayPort輸出六個(gè)屏幕,不過(guò)本次發(fā)布的HD5870僅能支持三個(gè)屏幕,是ATI故意限制了輸出嗎?

    其實(shí)是Dual-Link DVI的問(wèn)題,無(wú)論如何它都要占據(jù)兩個(gè)顯示通道。但市售30寸顯示器標(biāo)配就是Dual-Link DVI,HD5870為了保證兼容性和易用性,設(shè)計(jì)了兩個(gè)DVI接口,導(dǎo)致最多只能實(shí)現(xiàn)三屏輸出。不過(guò)三屏輸出對(duì)于游戲玩家來(lái)說(shuō)剛好合適,四屏和六屏都有些別扭。

    確實(shí)有六屏輸出的需要,那么可以購(gòu)買HD5870 Eyefinety6版本,它直接提供了6個(gè)DP接口,搭配響應(yīng)的顯示器或者轉(zhuǎn)接頭,就能實(shí)現(xiàn)完美的六屏輸出。

    目前,一塊支持4口DP輸出的2D專業(yè)顯卡售價(jià)就高達(dá)6000多人民幣,那史上最強(qiáng)的首款DX11游戲顯卡支持6口DP輸出的話相信也不會(huì)便宜,但也不會(huì)那么離譜。

第六章/第四節(jié) 靈活多變的三屏六屏輸出方案一覽

    有了強(qiáng)大而彈性的顯示控制器以及ATI Eyefinity技術(shù),HD5870在連接多顯示器的時(shí)候也很方便甚至隨意,單卡的時(shí)候可以按需要排列最多六臺(tái)不同規(guī)格的顯示器,四卡并行則最多能支持24臺(tái)顯示器組成一個(gè)寬廣的顯示墻。


豎排或橫排平放三臺(tái)顯示器,這是最常見(jiàn)的應(yīng)用
四臺(tái)或者六臺(tái)的排列組合形式就太多了


6口版本6屏輸出的輸出形式組合


普通4口版本3屏輸出輸出接口的組合形式

    Eyefinity技術(shù)已經(jīng)被完全整合在了催化劑驅(qū)動(dòng)當(dāng)中,ATI的HydraVision桌面管理器從此變得更加強(qiáng)大。多屏顯示的設(shè)置既方便又靈活,我們只要根據(jù)需要將幾臺(tái)顯示器按照排列順序綁定在一起,就能實(shí)現(xiàn)各種奇怪的分辨率。

    然后,只要游戲能夠支持非標(biāo)準(zhǔn)寬屏分辨率的話,就能將游戲畫(huà)面橫向或者縱向擴(kuò)充至所有的顯示器,但如果游戲不支持的話,畫(huà)面將會(huì)被拉升。經(jīng)過(guò)筆者的實(shí)際測(cè)試來(lái)看,只有較老的顯示器不支持超寬屏顯示,較新的游戲一般都不會(huì)有問(wèn)題。

第六章/第五節(jié) 三屏/六屏輸出玩游戲震撼效果展示

飛行模擬游戲:

賽車游戲:

FPS游戲:

RTS游戲:

幾乎所有的主流游戲都支持各種組合形式的特殊多屏(分辨率)模式

第六章/第六節(jié) 編輯實(shí)戰(zhàn)測(cè)試HD5870三屏玩游戲

    為了測(cè)試HD5870的三屏輸出效果,筆者特地找來(lái)兩臺(tái)Dell 3007和一臺(tái)3008,組成2560x1600x3的超強(qiáng)分辨率,來(lái)測(cè)試HD5870的極限游戲性能。

    通過(guò)驅(qū)動(dòng)中的HydraVision桌面管理器可以很方便的將三臺(tái)顯示器綁定在一起,然后整個(gè)桌面就會(huì)變成7680*1600的超寬分辨率,絕大多數(shù)支持寬屏的游戲中也會(huì)直接顯示出這個(gè)特殊的分辨率,無(wú)需太多繁瑣設(shè)置。


跑Crysis Benchmark的效果


魔獸世界,鐵爐堡一覽無(wú)余


優(yōu)品飛車13,道路兩旁盡收眼底


FarCry2廣袤的大草原


Google Earth實(shí)際效果圖

    我們測(cè)試過(guò)的眾多游戲?qū)θ恋闹С侄挤浅:?,只有街?有點(diǎn)問(wèn)題,街霸4雖然能支持超寬分辨率,但它的縱橫比其實(shí)是固定的,當(dāng)橫向尺寸固定擴(kuò)充三倍之后,縱向尺寸就會(huì)相應(yīng)裁剪,由此導(dǎo)致實(shí)際顯示的畫(huà)面不但沒(méi)有增多反而減少了。

    而其他所有的游戲,兩邊顯示器所顯示的畫(huà)面,完全就是單顯示器看不到的景色,超寬的視角對(duì)于任何類型的游戲都能起到很好的輔助作用。

第六章/第七節(jié) HD5870三屏/六屏實(shí)際應(yīng)用視頻展示

第七章 HD5870顯卡實(shí)物賞析

第七章/第一節(jié) AMD官方HD5870高清晰美圖大賞

    首先我們來(lái)看一組AMD官方提供的HD5870顯卡高清晰、多角度藝術(shù)照片,分辨率均為2560,很多都可以收藏當(dāng)作桌面壁紙(沒(méi)打Logo):

第七章/第二節(jié) HD5870顯卡實(shí)物拍攝圖

    HD5870顯卡的設(shè)計(jì)風(fēng)格不同與以前的任何一塊A卡,色調(diào)搭配為黑里透紅,看上去更像是一塊專業(yè)顯卡,而不是民用的游戲顯卡。下面為我們泡泡實(shí)拍的測(cè)試樣卡照片:


黑色的塑料外殼為磨砂設(shè)計(jì),手感不錯(cuò)


背面沒(méi)有任何芯片,但也安裝了金屬背板,起到加固并輔助散熱的作用


末端的開(kāi)口看上去很像電源接口,其實(shí)是渦輪風(fēng)扇的輔助進(jìn)風(fēng)口

    輸出接口異常豐富,在傳統(tǒng)的兩個(gè)Dual-Link DVI接口之外,還安置了一個(gè)DisplayPort和一個(gè)HDMI接口。HD5870是繼幻日之后,第二款能夠提供三頭輸出的消費(fèi)級(jí)顯卡,在這四個(gè)數(shù)字接口中,最多可以同時(shí)使用其中的任何三個(gè),因此最常見(jiàn)的連接方法就是兩個(gè)DVI加上DP,可以同時(shí)輸出三個(gè)2560x1600的超高分辨率。

    由于四個(gè)輸出接口占據(jù)了較多的位置,導(dǎo)致散熱器出風(fēng)口偏小,因此HD5870在正上方也設(shè)計(jì)了排風(fēng)口,確保散熱器效能不會(huì)降低,但這樣做會(huì)導(dǎo)致一半的熱風(fēng)未能吹到機(jī)箱之外,加重了系統(tǒng)的整體散熱負(fù)擔(dān),實(shí)際上GTX295也迫不得采用了這種設(shè)計(jì)。

第七章/第三節(jié) HD5870是最輕的高端卡


體積上,HD5870的長(zhǎng)寬高都與HD4870X和GTX295完全相等,都是雙槽設(shè)計(jì)

    在體重方面,HD5870的優(yōu)勢(shì)就體現(xiàn)出來(lái)了,由于核心和顯存的發(fā)熱較低,鋁制散熱片和塑料外殼的使用大大降低了整體重量。較低的重量顯然能夠減輕機(jī)箱的負(fù)擔(dān),防止長(zhǎng)期使用發(fā)生PCB變形的情況。

第七章/第四節(jié) HD5870顯卡拆解:40nm核心與GDDR5顯存

    一體式的散熱器還是很好拆的,拆開(kāi)之后就會(huì)發(fā)現(xiàn)HD5870與上代HD4870的設(shè)計(jì)風(fēng)格非常相似,ATI原廠卡常見(jiàn)的數(shù)字供電非常眼熟。


熱管+鋁質(zhì)散熱片+渦輪風(fēng)扇,一體式散熱設(shè)計(jì)


密密麻麻的元件再現(xiàn)原廠卡風(fēng)范


RV870核心采用斜45°封裝,防止散熱器壓壞邊角

    RV870核心擁有高達(dá)21.5億晶體管,達(dá)到了上代RV770的2.25倍。但在40nm工藝的支持下,核心面積卻只從263mm2升至334mm2,增幅只有1.27倍(比400mm2的GT200b核心小很多)。因此RV870的規(guī)格雖然聽(tīng)起來(lái)很嚇人,其實(shí)功耗和發(fā)熱不會(huì)很高,成本也會(huì)隨著40nm工藝投入量產(chǎn)、良品率提高而直線下降。

    HD5870的默認(rèn)核心頻率為850MHz,這個(gè)頻率與HD4890完全相同,看來(lái)這個(gè)頻率設(shè)定還是很保守的,40nm的優(yōu)勢(shì)尚未完全發(fā)揮,未來(lái)推出更高頻率的HD5890也未嘗不可。


三星0.5ns GDDR5顆粒,32Mx32顆粒,8顆組成1GB 256Bit的規(guī)格

    顯存方面,力挺GDDR5的奇夢(mèng)達(dá)雖然已經(jīng)破產(chǎn),但三星后來(lái)者居上,此次HD5870使用了0.4ns的顆粒,理論頻率5000MHz,而HD5870的默認(rèn)顯存頻率是4800MHz,相信還有不少超頻的空間。

第七章/第五節(jié) HD5870顯卡拆解:豪華的數(shù)字供電

    與N卡相比,A卡在做工用料方面一直都以奢華而著稱,超強(qiáng)的數(shù)字供電讓NFan看著都眼紅,此次HD5870的整卡最高功耗為188W,甚至比HD4890還要低2W,但供電部分的設(shè)計(jì)依然一絲不茍。


TDP下降,兩個(gè)6Pin供電接口就夠用了

    下面就詳細(xì)解析HD5870的供電設(shè)計(jì),依然是VOLTERRA的數(shù)字式方案:


核心供電主控芯片:VT1165MF

    GPU核心供電主控芯片為VT1165MF,它最多可以支持六相供電,此處只設(shè)計(jì)了四相,預(yù)留了一相空焊位。此前絕大多數(shù)數(shù)字供電顯卡的核心主控都是VT1165MF,比如HD2900XT、HD4870、4890、GTX280等。


核心供電為四相,使用了一個(gè)連體四胞胎電感,MOS為四顆VT1157SF

    VT1157SF是新型號(hào)的整合式IC+MOS,額定電流是多少并不清楚,如果按30A來(lái)算的話四相也有120A,這個(gè)數(shù)值已經(jīng)不低于HD4870了,而且RV870的I/O接口部分有單獨(dú)的一相供電:


核心I/O供電:VT1157SF

    這是位于顯卡PCB前端的一相供電,同樣是VT1157SF整合式MOS芯片,它專門負(fù)責(zé)給GPU的顯存控制器及I/O部分供電,以活動(dòng)更純凈更穩(wěn)定的電流,確保GDDR5能夠高速正確的與GPU協(xié)同工作。


顯存供電:兩顆VT243WF

    顯存供電為兩顆VT243WF,并沒(méi)有電源主控芯片,因?yàn)檫@顆VT235WF的集成度更高,它將主控芯片、驅(qū)動(dòng)IC電路和MOS管全部整合在了一起,因此看上去VT235WF比VT1157SF的芯片面積要更大一些。兩相式供電為顯存提供了最大60A電流,可滿足超高頻率下穩(wěn)定運(yùn)行。

    因此HD5870的供電設(shè)計(jì)就是4+1+2相,它還可以被擴(kuò)充成5+2+2相,ATI原廠卡的供電設(shè)計(jì)一直都很冗余,非常適合玩家超頻之用。數(shù)字供電還有另外一項(xiàng)優(yōu)勢(shì)就是,可以通過(guò)軟件直接給核心與顯存加壓,而不用硬改電路,從而降低了風(fēng)險(xiǎn),更有利于極限超頻沖擊世界記錄。

第八章 顯卡性能測(cè)試

    40nm工藝、21.5億晶體管、1600個(gè)流處理器、六屏DP輸出、第一款DX11顯卡——這就是RV870核心Radeon HD5870顯卡給我們帶來(lái)的恐怖數(shù)字。HD5870榮登最強(qiáng)單核心顯卡寶座已毫無(wú)懸念,那它能否擊敗自家上代雙核心的HD4870X2,撼動(dòng)對(duì)手GTX295的王者地位呢?

第八章/第一節(jié) 優(yōu)異測(cè)試平臺(tái)配置

PCPOP.COM評(píng)測(cè)室

硬件系統(tǒng)配置

處理器

Intel Core i7 975

3.33GHz L3=8MB 四核八線程)

 

MSI X58 Eclipse

   

HD5870 1GB (850/4800MHz)
HD4870X2 2GB (750/3600MHz)

HD4890 1GB (850/3900MHz)
GTX295 1792MB (576/1242/1998MHz)
GTX285 1GB (648/1476/2484MHz)

內(nèi)  

CORSAIR Dominator TWIN2X2048-10000C5DF

DDR3-1600(9-9-9-24-1T)

   盤(pán)

日立1TB

  

海盜船 1000W

軟件系統(tǒng)配置

  操作系統(tǒng)

Windows 7 RTM 7600.16385 64Bit

  DirectX

11

  顯示驅(qū)動(dòng)

NVIDIA Forceware 190.89 Beta

ATI Catalyst 9.9

● 優(yōu)異平臺(tái)——Core i7 975

    i7 975是目前Intel最強(qiáng)的CPU,主頻比965更高,達(dá)到了3.33GHz,45nm High-K工藝制造,擁有8MB三級(jí)緩存,還支持超線程技術(shù)(四核八線程),這樣即便是雙高端顯卡系統(tǒng)也不會(huì)受制于處理器瓶頸。

● 優(yōu)異平臺(tái)——DELL3007 顯示器

    既然是優(yōu)異卡,我們就要用最優(yōu)異玩家的使用環(huán)境來(lái)測(cè)試,我們選定分辨率為1920×1200(24寸寬)和2560×1600(30寸寬)兩種高端玩家最常用的分辨率做測(cè)試。

    所有的游戲默認(rèn)都開(kāi)啟最高特效,其中包括至少4xAA,如果支持8xAA的話也將進(jìn)行測(cè)試,如果游戲內(nèi)置AF支持的話,就直接調(diào)至最高的16AF。

第八章/第二節(jié) DX9C理論性能測(cè)試:3DMark06

比Crysis還BT!3DMark Vantage初測(cè)試

    游戲介紹:3DMark06作為DX9C權(quán)威的理論測(cè)試工具,包括了兩個(gè)SM2.0測(cè)試和兩個(gè)SM3.0測(cè)試場(chǎng)景,基本上達(dá)到了DX9C的畫(huà)面最高境界。雖然HD5870的發(fā)布宣告了DX11時(shí)代的來(lái)臨,但考慮到至今仍有不少新游戲依然采用DX9C引擎,加入3DMark06的測(cè)試結(jié)果對(duì)于很多主流游戲都有參考價(jià)值的。

    畫(huà)面設(shè)置:如今3DMark06已經(jīng)難不倒高端顯卡了,高端顯卡在3DMark06中難分高下,所以我們只能最大程度的提高它對(duì)系統(tǒng)的要求,比如說(shuō)提高分辨率開(kāi)啟抗鋸齒等。所以我們選定了在2560×1600最高分辨率開(kāi)啟4AA16AF以及最高的8AA16AF模式下,測(cè)試其總分和SM3.0成績(jī)。

    雖然HD5870的理論核心渲染能力要比HD4870X2更強(qiáng),但畢竟顯存帶寬和容量方面比較吃虧,此消彼長(zhǎng)之下HD5870的成績(jī)能夠如此接近于HD4870X2,對(duì)于玩家來(lái)說(shuō)已經(jīng)是個(gè)驚喜了。

    作為同時(shí)代的雙核心顯卡,GTX295的綜合實(shí)力要強(qiáng)于HD4870X2,所以HD5870想要超越它確實(shí)比較艱難。但在最高的8xMSAA模式下,GTX295敗給了HD4870X2和HD5870,通過(guò)成績(jī)分析來(lái)看GTX295的SM3.0性能是個(gè)軟肋,看來(lái)是HDR+AA效能較低所致。

第八章/第三節(jié) DX10理論性能測(cè)試:3DMark Vantage

比Crysis還BT!3DMark Vantage初測(cè)試

    游戲介紹:3DMark Vantage所使用的全新引擎在DX10特效方面和《孤島危機(jī)》不相上下,但3DMark不是游戲,它不用考慮場(chǎng)景運(yùn)行流暢度的問(wèn)題,因此Vantage在特效的使用方面比Crysis更加大膽,“濫用”各種消耗資源的特效導(dǎo)致Vantage對(duì)顯卡的要求空前高漲,號(hào)稱“顯卡危機(jī)”的Crysis也不得不甘拜下風(fēng)。

    畫(huà)面設(shè)置:3DMark Vantage中直接內(nèi)置了四種模式,分別為Extreme(旗艦級(jí))、High(高端級(jí))、Performance(性能級(jí))和Entry(入門級(jí)),只有在這四種模式下才能跑出總分,如果自定義模式就只能得到子項(xiàng)目分?jǐn)?shù)了。我們?yōu)檫@次的優(yōu)異卡對(duì)決選擇了最高的Extreme模式,它其實(shí)就是最高畫(huà)質(zhì)1920x1200分辨率再加上4AA16AF模式。

    測(cè)試方法:N卡支持PhysX,在CPU測(cè)試子項(xiàng)中成績(jī)會(huì)翻幾倍,最終總成績(jī)會(huì)提高不少,由于本次測(cè)試主要考驗(yàn)顯卡的渲染性能,因此在N卡驅(qū)動(dòng)中關(guān)閉物理加速,避免CPU成績(jī)影響總成績(jī)。

    此前的諸多測(cè)試表明,3DMark Vantage比較偏重與Shader性能,顯存方面的影響并不大,于是頻率更高的HD5870終于完成了對(duì)HD4870X2的超越。

    但GTX295依然更勝一籌,兩顆GT200核心加起來(lái)共有28億晶體管,跟21億晶體管的RV870不是一個(gè)級(jí)別,有如此性能表現(xiàn)并不意外。

第八章/第四節(jié) DX10渲染性能測(cè)試:3DMark Vantage子項(xiàng)

比Crysis還BT!3DMark Vantage初測(cè)試

    測(cè)試方法:3DMark Vantage除了常規(guī)的四個(gè)GPU和CPU測(cè)試場(chǎng)景外,還提供了六個(gè)特性測(cè)試項(xiàng)目,每一項(xiàng)都針對(duì)特定的圖形硬件功能,并將其推向極限。與圖形測(cè)試的大量特效、技術(shù)和內(nèi)容不同,填充率測(cè)試不影響3DMark Vantage總分和GPU子分?jǐn)?shù),也不受預(yù)設(shè)值的影響,只考驗(yàn)GPU的實(shí)際性能可否達(dá)到理論值。

多重紋理填充:將紋理坐標(biāo)數(shù)值通過(guò)旋轉(zhuǎn)、縮放的形式填充到整個(gè)屏幕

比Crysis還BT!3DMark Vantage初測(cè)試

色彩填充:16Bit浮點(diǎn)格式HDR顏色反復(fù)繪制通過(guò)Alpha通道直接寫(xiě)入渲染目標(biāo)

比Crysis還BT!3DMark Vantage初測(cè)試

視察映射貼圖:高度圖+全局光照渲染層次感鮮明的物體表面

比Crysis還BT!3DMark Vantage初測(cè)試

GPU加速布料:通過(guò)頂點(diǎn)著色和幾何著色配合繪制大量變換位置的頂點(diǎn)坐標(biāo)

比Crysis還BT!3DMark Vantage初測(cè)試

GPU獨(dú)立渲染大量相互碰撞的粒子:將頂點(diǎn)著色壓到極限的考驗(yàn)方法

比Crysis還BT!3DMark Vantage初測(cè)試

噪聲動(dòng)態(tài)生成紋理和體積云霧:純像素著色計(jì)算噪聲函數(shù)

比Crysis還BT!3DMark Vantage初測(cè)試

    以上純理論性能測(cè)試成績(jī)僅供參考,并不能代表實(shí)際游戲性能。

第八章/第五節(jié) DX10游戲:《孤島危機(jī)》

    游戲介紹:Crysis(孤島危機(jī))無(wú)疑是現(xiàn)階段對(duì)電腦配置要求最高的PC游戲大作。Crysis的游戲畫(huà)面達(dá)到了當(dāng)前PC系統(tǒng)所能承受的極限,超越了次世代平臺(tái)和之前所有的PC游戲。Crysis還有個(gè)資料片Warhead,使用了相同的引擎,只是多了一個(gè)關(guān)卡,因此我們還是使用原版做測(cè)試。

    畫(huà)面設(shè)置:Crysis只有在最高的VeryHigh模式下才是DX10效果,但此前所有高端顯卡都只能在低分辨率下才敢開(kāi)啟DX10模式,如今HD5870單卡性能都可以直逼上代雙核心顯卡,那么能否在高分辨率下征服Crysis呢?測(cè)試分辨率選擇了1920x1200和2560x1600兩種,都開(kāi)VeryHigh,分為不開(kāi)AA和4xAA兩種模式。

    測(cè)試方法:Crysis內(nèi)置了CPU和GPU兩個(gè)測(cè)試程序,我們使用GPU測(cè)試程序,這個(gè)程序會(huì)自動(dòng)切換地圖內(nèi)的全島風(fēng)景,得到穩(wěn)定的平均FPS值。

    在1920全高清分辨率下,無(wú)論是否開(kāi)AA,HD5870都能保證30幀的最低要求,這是首款能夠流暢運(yùn)行Crysis的單核心顯卡,有“顯卡危機(jī)”之稱的DX10游戲終于被DX11顯卡所征服!

    提高至2560分辨率后,此時(shí)對(duì)顯存的要求更加苛刻HD5870與HD4870X2的差距被縮小。整體來(lái)看GTX295的性能還是要高于兩款A(yù)卡的,但在開(kāi)啟4AA的模式下三者處于同一水準(zhǔn),看來(lái)還是A卡的抗鋸齒效能更高一籌。

第八章/第六節(jié) DX10游戲:《沖突世界:蘇聯(lián)進(jìn)攻》

    游戲介紹:《沖突世界》將帶領(lǐng)玩家返回著名的冷戰(zhàn)時(shí)期,玩家每一個(gè)決定均影響游戲中人物和情節(jié)。可于游戲中感受不一樣的團(tuán)隊(duì)精神,與隊(duì)友于陰森恐怖的戰(zhàn)場(chǎng)上一同作戰(zhàn)。《蘇聯(lián)進(jìn)攻》是其最新的資料片,收錄全新角色、扮演蘇聯(lián)軍隊(duì)、10套新影片和全新多人聯(lián)機(jī)地圖等等。

    畫(huà)面設(shè)置:《沖突世界》是首批DX10游戲之一,采用了自行研發(fā)的MassTech引擎,支持多種當(dāng)前的主流顯示特效,如容積云,景深效果,軟陰影等,光照系統(tǒng)也表現(xiàn)出色,尤其是半透明的容積云特效營(yíng)造出了十分逼真的戶外場(chǎng)景,物理加速結(jié)合體積光照渲染出了最逼真的爆炸效果。

DX10視覺(jué)盛宴!9大顯卡決戰(zhàn)[沖突世界]

    測(cè)試方法:內(nèi)置Benchmark是一段非常華麗的過(guò)場(chǎng)動(dòng)畫(huà)作為測(cè)試程序,最終得出最大、最小和平均FPS,測(cè)試結(jié)果非常精確。WIC最高支持4AA,因此我們只測(cè)試4AA模式,分為1920和2560兩個(gè)分辨率。

    這款游戲?qū)︼@存帶寬十分敏感,直接導(dǎo)致HD5870的表現(xiàn)不理想,但HD4870X2的表現(xiàn)不俗,甚至比GTX295還要強(qiáng)悍。

第八章/第七節(jié) DX10游戲:《生化危機(jī)5》

    游戲介紹:09年3月初,《生化危機(jī)5》成功登陸PS3和XBOX360平臺(tái),并在首日就創(chuàng)下了400萬(wàn)的驚人出貨量,向玩家證明了《生化危機(jī)》系列的成功。上周末,Capcom終于確定了《生化危機(jī)5》(ResIDEnt Evil 5)PC版的發(fā)售日期,于09年9月18日在歐洲地區(qū)上市。

    《生化危機(jī)5》游戲故事設(shè)定在1代洋房事件10年后,主角為原S.T.A.R.S隊(duì)員克里斯(Chris),他曾在1代中擔(dān)任主角。游戲承襲《生化危機(jī)4》的基本系統(tǒng),同樣采用第三人稱背后視點(diǎn)的動(dòng)作冒險(xiǎn)方式呈現(xiàn)。不同于先前系列作慣用的黑暗場(chǎng)景未知恐懼感,本代將以明暗激烈轉(zhuǎn)變下所造成的短暫視力喪失,來(lái)展現(xiàn)另一種不同的恐懼感。

    畫(huà)面設(shè)置:《生化危機(jī)5》是一款很有特點(diǎn)的DX10游戲,在開(kāi)啟DX10的情況下,它不但運(yùn)行速度更快,而且在HDR和紋理方面的表現(xiàn)更出色,這是傳統(tǒng)低效率DX10游戲所無(wú)法比擬的。

    測(cè)試方法:游戲自帶Benchmark,1920和2560兩種分辨率,4AA和8AA兩種模式

    也許是游戲尚未正式發(fā)布的原因,A卡在測(cè)試版游戲中的表現(xiàn)差強(qiáng)人意,而N卡在新驅(qū)動(dòng)的支持下性能表現(xiàn)十分出色,最優(yōu)異畫(huà)面設(shè)置下都能有流暢的FPS。

    ATI驅(qū)動(dòng)在更新速度方面一直無(wú)法同NVIDIA相提并論,此次我們拿到的驅(qū)動(dòng)為HD5870專用的內(nèi)部版本,并未對(duì)這款剛剛泄漏的游戲進(jìn)行優(yōu)化,希望未來(lái)在新驅(qū)動(dòng)當(dāng)中有所改進(jìn)。

第八章/第八節(jié) DX10.1游戲:《鷹擊長(zhǎng)空》

    游戲介紹:《鷹擊長(zhǎng)空》由Ubisoft旗下的Bucharest Studio工作室所研發(fā)制作而成,以湯姆克蘭西最擅長(zhǎng)的近現(xiàn)代國(guó)際沖突為背景,加上現(xiàn)代化的軍事武器,和五角大廈不愿證實(shí)的開(kāi)發(fā)中的先進(jìn)武器,交織出最激烈的高科技攻防戰(zhàn)。而《鷹擊長(zhǎng)空》也脫離前面幾項(xiàng)作品的框架,將戰(zhàn)爭(zhēng)從地面拉拔到空中,享受廣大無(wú)界限的戰(zhàn)斗空間。

    畫(huà)面設(shè)置:《鷹擊長(zhǎng)空》直接內(nèi)置了對(duì)DX10和DX10.1的支持,它會(huì)自動(dòng)檢測(cè)顯卡最高能支持的級(jí)別。通過(guò)此前的測(cè)試來(lái)看DX10.1并不會(huì)讓畫(huà)質(zhì)變得更高,但的確能夠讓游戲跑得更快。我們使用1920和2560兩種分辨率,4AA和8AA兩種模式進(jìn)行測(cè)試。

    測(cè)試方法:游戲自帶Benchmark,A卡開(kāi)DX10.1模式,N卡開(kāi)不了。

    從4xAA到8xAA,N卡的性能下降幅度明顯要比A卡高,DX10.1在MSAA方面的改進(jìn)讓A卡受益頗多。在2560 8AA這種嚴(yán)酷模式下真正能流暢運(yùn)行的就只有HD5870了。分辨率越高、抗鋸齒精度越大,HD5870的優(yōu)勢(shì)就越顯著。

第八章/第九節(jié) DX10.1游戲:《潛行者:晴空》

    游戲介紹:《S.T.A.L.K.E.R.:晴空》是《S.T.A.L.K.E.R.》的前傳資料片,會(huì)講述一個(gè)發(fā)生在2010年的故事,在前作當(dāng)中沒(méi)能體現(xiàn)的創(chuàng)意都被應(yīng)用在了《晴空》當(dāng)中。切爾諾貝利的歷史、地理特質(zhì)和基本生活環(huán)境都將被一一展現(xiàn),新作NPC的智能更高,玩家還能扮演NPC的領(lǐng)導(dǎo)者,游戲樂(lè)趣更上一層樓。

    畫(huà)面設(shè)置:與前作還停留在DX9C的畫(huà)面特效相比,《晴空》加入了大量DX10特效(神光、柔和粒子、SSAO、動(dòng)態(tài)容積霧、動(dòng)態(tài)浸潤(rùn)表面),讓游戲畫(huà)質(zhì)全面提升了一個(gè)檔次。除了支持DX10外,《晴空》還通過(guò)一個(gè)升級(jí)補(bǔ)丁對(duì)DX10.1提供了支持,采用了Alpha-to-Coverage技術(shù),對(duì)于陽(yáng)光陰影增加了新的Ultra畫(huà)質(zhì)模式,同時(shí)會(huì)通過(guò)DX10.1技術(shù)來(lái)實(shí)現(xiàn)更好的光暈渲染,并使得游戲性能進(jìn)一步提升。

    測(cè)試方法:使用官方Benchmark包進(jìn)行測(cè)試,A卡開(kāi)啟DX10.1模式,N卡只能使用DX10模式。分辨率為1920和2560,分為不開(kāi)AA和4xAA兩種模式。

    很遺憾HD5870沒(méi)能超越HD4870X2,但我們可以注意到在不開(kāi)AA時(shí)兩者差距較大,但開(kāi)啟AA后性能完全相同,由此可見(jiàn)HD5870確實(shí)擁有更強(qiáng)的抗鋸齒效能。

    GTX295的表現(xiàn)與HD4870X2比較類似,不開(kāi)AA時(shí)性能不錯(cuò),開(kāi)AA后下降很明顯,2560 4AA下干脆無(wú)法完成測(cè)試,看來(lái)不支持DX10.1確實(shí)很吃虧。

    值得一提的是,《晴空》對(duì)于DX10.1的支持比《鷹擊長(zhǎng)空》更完美,開(kāi)啟DX10.1不但能夠提高性能,還能進(jìn)一步提升抗鋸齒和光影畫(huà)質(zhì),“DX10.1無(wú)用論”不攻自破。

第八章/第十節(jié) DX10游戲:《孤島驚魂2》

    游戲介紹:自《孤島驚魂》系列的版權(quán)被UBI購(gòu)買之后,該公司蒙特利爾分部就已經(jīng)開(kāi)始著手開(kāi)發(fā)新作,本作不但開(kāi)發(fā)工作從Crytek轉(zhuǎn)交給UBI,而且游戲的故事背景也與前作毫無(wú)關(guān)系,游戲的圖形和物理引擎由UBI方面完全重新制作。

    畫(huà)面設(shè)置:借助于蒙特利爾工作室開(kāi)發(fā)的全新引擎,游戲中將表現(xiàn)出即時(shí)的天氣與空氣效果,所有物體也都因?yàn)槿碌奈锢硪妫@得更加真實(shí)。你甚至可以在游戲中看到一處火焰逐漸蔓延,從而將整個(gè)草場(chǎng)燒光!而且首次對(duì)DX10.1提供支持,雖然我們很難看到。

    測(cè)試方法:游戲自帶Benchmark工具。

    在4AA模式下,HD5870和HD4870X2的性能差不多,但在8AA模式下,HD5870超高AA效能的優(yōu)勢(shì)就體現(xiàn)出來(lái)了。

    在優(yōu)異的2560 8AA模式下,GTX295因?yàn)轱@存不足已經(jīng)無(wú)法運(yùn)行完整個(gè)測(cè)試了,而HD5870則依然保持較高的效能,拉開(kāi)了與HD4870X2的差距。

第八章/第十一節(jié) DX9C游戲:《街頭霸王4》

    游戲介紹:CAPCOM公司于1987年推出的大型電玩機(jī)臺(tái)格斗游戲《街頭霸王》,堪稱目前格斗類游戲的始祖。經(jīng)過(guò)了20多年的不斷演化之后,如今的PC版《街頭霸王4》不僅在畫(huà)面上走向了全新方向,而且加入了各種新系統(tǒng),試圖讓傳統(tǒng)2D格斗游戲得到重生。

    畫(huà)面設(shè)置:街霸4 PC版和游戲機(jī)版相比,除了支持高分辨率輸出之外,還為玩家提供了畫(huà)面渲染風(fēng)格選擇的功能,除與家用機(jī)版一樣的“普通”模式外,還有“水彩”、“海報(bào)”和“煙灰墨”這三種追加的渲染風(fēng)格,帶給完全全新的視覺(jué)體驗(yàn)。

    測(cè)試方法:由于DX9游戲?qū)︼@卡要求并不高,因此我們直接上最高的2560分辨率進(jìn)行測(cè)試,并開(kāi)啟4AA和8AA兩種模式,測(cè)試時(shí)使用游戲自帶Benchmark。

    令人奇怪的是,A卡開(kāi)啟8AA后性能比4AA幾乎沒(méi)有下降,而N卡的損失則很大。看來(lái)AMD稱RV870擁有極強(qiáng)的8xAA效能絕非大放厥詞,通過(guò)大量的游戲測(cè)試來(lái)看,HD5870在大多數(shù)游戲中開(kāi)啟8xAA后的性能損失都要低于N卡。

第八章/第十二節(jié) DX9C游戲:《優(yōu)品飛車13:變速》

    游戲介紹:作為優(yōu)品飛車系列游戲的最新作品,《優(yōu)品飛車:變速》早在發(fā)布之前就倍受媒體關(guān)注,而這其中不僅僅是IT、游戲媒體,專業(yè)的汽車媒體也對(duì)這款游戲給出了不少的報(bào)道。世界優(yōu)異汽車廠商也紛紛對(duì)這款游戲的開(kāi)發(fā)給了很大的贊助,游戲中隨處可見(jiàn)汽車廠商的廣告。據(jù)統(tǒng)計(jì),《優(yōu)品飛車:變速》這款游戲一共包含了72輛世界優(yōu)異跑車,所涉及廠商也多達(dá)數(shù)十個(gè),可見(jiàn)各大汽車廠商對(duì)這款游戲的關(guān)注。特別是寶馬公司,細(xì)心的朋友應(yīng)該可以看出,正版游戲封面的車輛正是寶馬的M3 GT2,而游戲中練習(xí)賽所采用的車輛也是來(lái)自寶馬公司的產(chǎn)品。

    游戲畫(huà)面:優(yōu)品飛車13依然沿用了前幾代的游戲引擎,還是DX9C并未進(jìn)入DX10時(shí)代,但EA對(duì)畫(huà)面進(jìn)行了精心優(yōu)化,并信誓旦旦的稱優(yōu)品13絕對(duì)是目前畫(huà)面最強(qiáng)的賽車游戲。此外優(yōu)品13還采用了PhysX物理引擎,但只使用CPU進(jìn)行演算,因此A卡不會(huì)有性能損失。

    測(cè)試方法:由于《優(yōu)品飛車:變速》并沒(méi)有提供BenchMark程序,同時(shí)AI非常智能,這樣就會(huì)導(dǎo)致游戲每次在同樣的賽道上同樣的開(kāi)車,都可能走出不同的路線或者其他效果,這給我們?cè)u(píng)測(cè)帶來(lái)了很大的麻煩。最后,我們只能找一段路況較好的車道,并在游戲開(kāi)始前就統(tǒng)計(jì)幀數(shù),直到一次撞墻結(jié)束后,再計(jì)算其平均幀數(shù),下面的視頻就是測(cè)試的賽道。

    和街霸4類似,優(yōu)品13開(kāi)啟8AA模式后,A卡的性能下降幅度都很小,而N卡損失慘重,雙核心GTX295在4xAA模式下很強(qiáng)大,但8xAA下被輕易超越,的確很遺憾。

第八章/第十三節(jié) 物理游戲:《鏡之邊緣》

    游戲介紹:《Mirror''s Edge》主機(jī)版本一上市就獲得了萊比錫GC大會(huì)的“非常好的XBox360游戲”,E3的“非常好的原創(chuàng)游戲”等多項(xiàng)大獎(jiǎng),是一款風(fēng)格獨(dú)特的“主視角逃跑”游戲作品。玩家扮演一位名叫“Faith”的亞裔女孩,生活在一個(gè)被惡勢(shì)力控制的大都市中。在經(jīng)過(guò)特殊訓(xùn)練后,她的工作就是為各種地下組織傳遞信件。由于警察從天上到地下處處追擊,雖然玩家也能夠撂倒一兩個(gè)敵人,但非常好的的生存方式只有逃。其動(dòng)作風(fēng)格沒(méi)有“波斯猴子”那樣神話似的夸張,類似時(shí)下流行的極限運(yùn)動(dòng)“跑酷”。整個(gè)游戲以第一人稱視角進(jìn)行,玩家在大廈叢林中奔跑跳躍,緊張的尋找逃出生天之路,耳旁聽(tīng)著女主角輕輕的喘息聲,游戲體驗(yàn)相當(dāng)特別。

    畫(huà)面設(shè)置:PC版《Mirror''s Edge》支持NVIDIA PhysX物理引擎,在整個(gè)游戲中提升真實(shí)感,主要包括隨風(fēng)搖擺特效、武器傷害效果及運(yùn)動(dòng)效果等。游戲中的橫幅、旗幟可以被子彈擊穿撕裂、隨風(fēng)搖曳,地面上的薄霧會(huì)隨著玩家腳步的趟過(guò)散開(kāi),爆炸后會(huì)讓空氣中彌漫著煙霧和碎片,子彈在建筑和環(huán)境物體上的損傷效果也得到了增強(qiáng)。

    測(cè)試方法:使用Fraps記錄50秒內(nèi)游戲運(yùn)行FPS,該游戲?qū)︼@卡要求很低,因此測(cè)試統(tǒng)一使用最高的2560 8AA16AF。由于A卡不支持PhysX,所以測(cè)試分為開(kāi)啟PhysX和關(guān)閉PhysX兩種模式。

    拋開(kāi)物理引擎不談的話,這款游戲的實(shí)際畫(huà)面很一般,對(duì)顯卡的要求也不高,即便是在2560 8AA這種極限模式下,除了4870外所有顯卡都能輕松跑到60幀的上限。

    一旦開(kāi)啟PhysX模式的話,A卡不支持GPU物理加速的弊端就暴露出來(lái)了,三款顯卡不管強(qiáng)弱都只有20幀出頭。NVIDIA稱如果顯卡不支持物理加速時(shí)CPU就會(huì)做軟加速,但i7 975如此強(qiáng)大的CPU都沒(méi)幫上什么忙。

    有意思的是,如果在NVIDIA顯卡驅(qū)動(dòng)中關(guān)閉物理加速,但游戲中開(kāi)啟物理加速的話,兩塊優(yōu)異N卡也只能跑出22幀左右的速度。看來(lái)要么PhysX引擎的CPU軟加速效率很低,要么是NVIDIA刻意做了限制。

第八章/第十四節(jié) OpenGL游戲:《敵占區(qū):雷神戰(zhàn)爭(zhēng)》

    游戲介紹:正如游戲副標(biāo)題所示,二戰(zhàn)的血淚史已經(jīng)成為過(guò)去,ETQW描述的是另一場(chǎng)規(guī)模更大的戰(zhàn)爭(zhēng),這場(chǎng)戰(zhàn)爭(zhēng)取源于“Quake”正史,相當(dāng)于“Quake3”和“Quake4之間的序曲,我們甚至可以稱它為“Quake”外傳。ETQW的故事大約發(fā)生在2060-2065年之間,外星異形“Strogg”大規(guī)模入侵地球,給人類世界帶來(lái)了騷動(dòng),地球精英部隊(duì)組成全球防御力量(GDF)進(jìn)行抵抗,一場(chǎng)勢(shì)均力敵的對(duì)抗則演變成驚天動(dòng)地的世紀(jì)大戰(zhàn)。

    畫(huà)面設(shè)置:作為為數(shù)不多的OpenGL游戲,Quake系列已然廉頗老矣,不過(guò)一高效率著稱的Quake引擎依然有不少游戲使用,因此我們保留了這項(xiàng)這款游戲。

    測(cè)試方法:自行錄制Demo,控制臺(tái)調(diào)用Timedemo命令回放得出平均值。由于該游戲要求并不高,因此只測(cè)試2560分辨率,分為4AA和8AA兩種模式。

    自HD4000開(kāi)始,N卡在OpenGL應(yīng)用中一枝獨(dú)秀的局面就被打破,憑借改進(jìn)的紋理單元A卡的表現(xiàn)也非常不錯(cuò)。通過(guò)成績(jī)來(lái)看,4AA模式下N卡發(fā)揮出色,但8xAA模式下性能損失較大,被HD5870反超。

    看來(lái)HD2000/3000時(shí)代A卡AA效能低下已經(jīng)徹底成為歷史,現(xiàn)在無(wú)論是DX9C\\DX10\\DX10.1還是OpenGL應(yīng)用,在高倍AA模式下都是A卡占優(yōu)。

第九章 成績(jī)匯總與性能總結(jié)

第九章/第一節(jié) 功耗測(cè)試

    我們的功耗測(cè)試方法是直接統(tǒng)計(jì)整套平臺(tái)的總功耗,既簡(jiǎn)單、又直觀。測(cè)試儀器為微型電力監(jiān)測(cè)儀,它通過(guò)實(shí)時(shí)監(jiān)控輸入電源的電壓和電流計(jì)算出當(dāng)前的功率,這樣得到的數(shù)值就是包括CPU、主板、內(nèi)存、硬盤(pán)、顯卡、電源以及線路損耗在內(nèi)的主機(jī)總功率(不包括顯示器)。

    以上為雙卡在跑3DMarkVantage時(shí)的峰值功耗,GTX295雙卡系統(tǒng)足足比HD5870雙卡高出了330W之多,令人驚訝無(wú)比,下面再來(lái)看看單卡系統(tǒng)的總功耗對(duì)比。

    果不其然,HD5870的待機(jī)功耗要比HD4870低將近70W,這個(gè)數(shù)字與AMD官方公布的差不多。在所有高端卡當(dāng)中HD5870的待機(jī)功耗是最低的,幾乎達(dá)到了9600GSO和HD4670這種中低端顯卡的水準(zhǔn)。

    滿載功耗HD5870要比HD4870高一些,基本上就是HD4890的水平,但兩者的性能相差甚遠(yuǎn)。

    通過(guò)TDP來(lái)看,HD4870X2應(yīng)該比GTX295更省電一些,但我們的測(cè)試結(jié)果正好相反,不過(guò)也無(wú)所謂這兩塊雙核心顯卡是半斤八兩,性能并不比HD5870強(qiáng),功耗卻高了150W左右,無(wú)論性價(jià)比還是能耗比都很低。

第九章/第二節(jié) 測(cè)試成績(jī)匯總:HD5870 PK GTX285

    除了新出的《生化危機(jī)5》和《鏡之邊緣》開(kāi)物理模式外,HD5870絕對(duì)是橫掃GTX285,性能優(yōu)勢(shì)相當(dāng)明顯,而且分辨率越大、AA精度越高,領(lǐng)先幅度越大,體現(xiàn)出了新一代單核心之王恐怖實(shí)力。

第九章/第三節(jié) 測(cè)試成績(jī)匯總:HD5870 PK HD4870X2

    HD5870和HD4870X2的核心規(guī)格是完全相等的,RV870只是大規(guī)模擴(kuò)充了流處理器并加入了DX11支持,而在架構(gòu)方面的改進(jìn)比較少。所以HD5870的優(yōu)勢(shì)就是高主頻,而HD4870X2的優(yōu)勢(shì)就是高顯存容量和帶寬。

    不同的游戲?qū)诵呐c顯存的要求各不相同,因此HD5870和HD4870X2是互有勝負(fù),即便是拋開(kāi)功耗與發(fā)熱因素不談,綜合考慮還是HD5870略占優(yōu)勢(shì),畢竟買優(yōu)異顯卡的玩家都想要在優(yōu)異畫(huà)質(zhì)下運(yùn)行游戲,這正是HD5870的強(qiáng)項(xiàng)。

第九章/第四節(jié) 測(cè)試成績(jī)匯總:HD5870 PK GTX295

    GTX295的綜合實(shí)力要?jiǎng)龠^(guò)HD4870X2,因此HD5870在面對(duì)GTX295時(shí)就有些英雄氣短了。但HD5870依然是可圈可點(diǎn)的,它超高的AA效能給筆者留下了深刻印象,尤其在Crysis之中性能和GTX295如此接近,作為一款單核心顯卡來(lái)說(shuō)真是難能可貴。

    而且HD5870在8xMSAA模式下?lián)碛懈鼜?qiáng)的效能,這點(diǎn)令GTX295也不得不甘敗下風(fēng)。GTX295雖然實(shí)力強(qiáng)悍,但由于顯存問(wèn)題,很多游戲在2560分辨率下開(kāi)高倍AA都可能會(huì)出現(xiàn)問(wèn)題,這一點(diǎn)讓人無(wú)法接受。

第九章/第五節(jié) 雙卡戰(zhàn)四核:HD5870 CF對(duì)決GTX295 SLI

    HD5870單卡已經(jīng)表現(xiàn)除了相當(dāng)強(qiáng)悍的實(shí)力,在不少游戲中都能超越此前的單卡雙核心之王GTX295。那么同樣是組建雙卡系統(tǒng),HD5870交火的性能將會(huì)如何呢?


HD5870 CF:兩顆RV870核心


GTX295 SLI:四顆GT200核心

    對(duì)于如此優(yōu)異的系統(tǒng),自然所有游戲都要選最高分辨率最高特效進(jìn)行測(cè)試,默認(rèn)2560x1600 8AA,如果運(yùn)行起來(lái)吃力的話,保留4AA模式下的成績(jī)。

    優(yōu)品飛車13和鏡之邊緣這兩款DX9C游戲由于存在幀數(shù)限制,雙卡體現(xiàn)不出性能優(yōu)勢(shì),就取消測(cè)試了。

    可以看出,GTX295 Quad SLI的優(yōu)勢(shì)項(xiàng)目只有《生化危機(jī)5》和《孤島危機(jī)》這兩款游戲,當(dāng)然它在3DMark Vantage中跑分很不錯(cuò),除此之外幾乎是一敗涂地。

    HD5870單卡在Crysis里面就有著接近GTX295的性能,但組建交火后差距反而被拉大,看來(lái)目前HD5870的驅(qū)動(dòng)支持還是不夠好。

    GTX295在很多游戲中開(kāi)啟8AA模式都跑不下來(lái),要么游戲直接卡死要么FPS只有個(gè)位數(shù),問(wèn)題主要出在顯存容量及顯存管理機(jī)制上面,作為一款優(yōu)異顯卡不能在優(yōu)異模式下運(yùn)行游戲,的確非常遺憾。而HD5870 CF則憑借優(yōu)秀的高倍AA效能,4AA下基本能與GTX295 SLI戰(zhàn)平或者略勝一籌,8AA下則大幅領(lǐng)先。

第十章 全文總結(jié)

第十章\\第一節(jié) 測(cè)試手記:相當(dāng)完美的高端卡

    在短短的一周測(cè)試時(shí)間內(nèi),HD5870除了超強(qiáng)的規(guī)格和性能比較誘人外,還在其他方面給筆者和同事都留下了深刻的印象。

  • 難以想象的安靜

    跑GTX295或HD4870X2的時(shí)候,渦輪風(fēng)扇發(fā)出的噪音讓周圍的同事苦惱不已,而換上HD5870之后幾乎聽(tīng)不見(jiàn)任何聲音;

  • 發(fā)熱量出奇的小

    當(dāng)GTX295和HD4870X2測(cè)試完成之后,換顯卡時(shí)必須多個(gè)心眼,如果一把手抓住顯卡拔下來(lái)的話,被燙掉一層皮是必然的;而HD5870的外殼和金屬背板則只是微溫,很難想像21.5億晶體管的怪獸是如此的冷靜;

  • 2560隨便跑游戲

    單(核心)卡中,能在1920分辨率下流暢運(yùn)行Crysis的顯卡只有HD5870,能在2560分辨率下流暢運(yùn)行主流游戲的只有HD5870;

  • 8AA性能如此強(qiáng)悍

    HD5870在不少游戲中8xAA模式下的性能與4xAA非常接近,以至于筆者懷疑測(cè)試成績(jī)是不是有問(wèn)題,游戲中是不是8xAA沒(méi)有生效。最終通過(guò)AMD官方提供的參考成績(jī)和技術(shù)資料來(lái)看,證實(shí)了原來(lái)是為RV870的AA效能太強(qiáng)悍的原因;

  • 3D環(huán)幕儀免費(fèi)送

    筆者在兩年前曾經(jīng)測(cè)試過(guò)Matrox 3D環(huán)幕儀,對(duì)于三屏幕玩游戲的視覺(jué)感受依然歷歷在目,不過(guò)這玩意太貴且局限性很大。如今AMD居然在GPU內(nèi)部直接整合了6屏輸出,而且支持6個(gè)30寸LCD,真讓人佩服萬(wàn)分。三個(gè)2560和三個(gè)1280,真不是一個(gè)級(jí)別的;

  • 超低待機(jī)功耗

    高端顯卡因?yàn)樵胍?、發(fā)熱和電費(fèi)的關(guān)系有時(shí)候不敢用,所以筆者和很多同事及朋友都是常備雙顯卡,平時(shí)上網(wǎng)或玩WC3這種游戲的時(shí)候用低端的95GT,想玩新大型游戲的時(shí)候就換上GTX260/4870。如果有了HD5870的話,就可以把備份用的低端卡徹底拋棄了,它的待機(jī)功耗也就跟95GT/96GT之流差不多……

第十章\\第二節(jié) 總結(jié):敢為人先,勇于創(chuàng)新的AMD-ATI

    在DX10初代HD2000慘遭滑鐵盧后,痛定思痛的ATI近幾代產(chǎn)品的進(jìn)步非常大,HD3000率先支持DX10.1標(biāo)準(zhǔn),HD4000首次使用尚未定型的GDDR5顯存,HD5000則大踏步進(jìn)入DX11時(shí)代。

    ATI總是能夠引領(lǐng)技術(shù)和標(biāo)準(zhǔn)的發(fā)展,一次又一次的在新工藝方面上演傳奇,整合聲卡、DX10.1、單PCB雙芯、包括競(jìng)爭(zhēng)對(duì)手所鼓吹的CUDA并行計(jì)算以及PhysX物理加速,其實(shí)最早也是ATI提出來(lái)的。ATI總是能夠拔得頭籌,但卻總是被競(jìng)爭(zhēng)對(duì)手后來(lái)者居上,讓AFan們惋惜不已。

    也許你會(huì)說(shuō)ATI一直在這方面比較激進(jìn),但這就是科技發(fā)展的動(dòng)力,保守固然可靠,但是失去敢于挑戰(zhàn)的勇氣,就不會(huì)有進(jìn)步。8800GT是一代經(jīng)典,但連續(xù)三代來(lái)回?fù)Q馬甲難免讓人厭煩。ATI一次又一次的更新?lián)Q代,不得不令對(duì)手加快腳步,這也為GPU的發(fā)展起到了推波助瀾的作用,不斷的日新月異。

    總體來(lái)看,NVIDIA給人的感覺(jué)就是成熟、保守、踏實(shí)、務(wù)實(shí),每款產(chǎn)品都很在意成本控制,處處透露著商業(yè)的氣息,追求利潤(rùn)最大化,每年都會(huì)有非常可觀的財(cái)報(bào)(經(jīng)濟(jì)危機(jī)特殊時(shí)期除外)。而ATI則是努力追求完美卻很難達(dá)到,在做工、新工藝、新技術(shù)方面很激進(jìn),甚至甘愿冒險(xiǎn)一試,當(dāng)然代價(jià)就是經(jīng)常有不成熟的產(chǎn)品或技術(shù)。

    世界上沒(méi)有十全十美的東西,不斷的發(fā)展進(jìn)步才能看到希望,不過(guò)此次AMD新一代HD5870的表現(xiàn)的確超出預(yù)期的出色,很難想像在架構(gòu)不變的情況下單核心顯卡能比肩雙核心顯卡,那雙核心的HD5870X2有多么強(qiáng)大已經(jīng)可以預(yù)期,如此一來(lái)給對(duì)手NVIDIA所施加的壓力就更大了。

    NVIDIA一直都對(duì)尚未發(fā)布的新品秘而不宣,據(jù)傳GT300將會(huì)是一顆擁有多達(dá)30億晶體管的怪物,性能方面將會(huì)帶來(lái)驚喜,但良率并不理想所以被RV870搶先發(fā)布??磥?lái)短期內(nèi)RV870及其多路系統(tǒng)是無(wú)敵的,可一旦NVIDIA也踏入40nm及DX11時(shí)代的話,就有好戲可看了,據(jù)NVIDIA方面稱新旗艦很快就會(huì)發(fā)布,敬請(qǐng)期待!■<

2人已贊

關(guān)注我們

泡泡網(wǎng)

手機(jī)掃碼關(guān)注