適者生存!顯卡 DirectX API 進化論
★ 黑猩猩——GeForce 6800
在經(jīng)歷了GeForce FX系列慘痛的失敗后,NVIDIA痛定思痛,要挽回在高端產(chǎn)品上的失利局面,僅靠架構(gòu)已完全定型的NV3x系列作一定程度的增補顯然是很難實現(xiàn)的。NVIDIA將更大的希望押寶在了新一代產(chǎn)品之上,它吸取了上一代產(chǎn)品的教訓,重新設計的架構(gòu)和完整支持DX9C標準,讓這款顯卡以全新的形象展現(xiàn)在用戶面前。甚至有分析家評論GeForce 6800和GeForce FX簡直不是一家公司設計的產(chǎn)品,其架構(gòu)變化之大可見一斑!
NV3X最大的弊端就是像素渲染單元效能低下,而NV40最強大之處就在像素單元架構(gòu)部分。NV40擁有多達16條像素渲染管線暫且不談,其每一個PSU的結(jié)構(gòu)都值得探討,NVIDIA將其稱為Superscalar(超標量)的設計。普通的像素渲染管線只提供一組著色器單元,每個周期最多只能執(zhí)行四組運算,而NV40的超標量架構(gòu)則內(nèi)含第二組著色器單元,讓每個周期的運算量增加一倍。
NV40的像素渲染管線結(jié)構(gòu)
正因為如此,對手ATI的X800系列雖然在硬件規(guī)格上與NV40完全相同,但在DX9b游戲中的性能差距依然不小,這就是超標量架構(gòu)的優(yōu)勢。當然固步自封的ATI在X800時代依然僅支持DX9b,無法開啟HDR,喪失了很多賣點,讓用戶大失所望。
6800的成功讓NVIDIA風光無限,整個GeForce 6家族在各個價位都力壓對手的X800家族,而且完美的架構(gòu)使得NVIDIA可以輕易的擴充規(guī)模,發(fā)布了擁有多達24條像素渲染管線的第二代DX9C顯卡——GeForce 7800系列(其架構(gòu)基本沒變,只做了些許優(yōu)化,這里就不多做介紹了)。
★ 支持HDR+AA的DX9C顯卡——X1800/X1900
X800的對手是6800系列,但它既沒有性能優(yōu)勢,也不支持DX9C/HDR,這使得ATI經(jīng)歷了9700/9800系列短暫的輝煌之后再次陷入被動局面。于是,ATI開始研發(fā)下一代GPU,改良架構(gòu),準備重奪王位。但事與愿違,R520核心的X1800XT雖然使用了全新的架構(gòu),完美支持DX9C,但依然沒能擊敗已經(jīng)發(fā)布半年之久的7800GTX,因為X1800XT依然只有16條像素渲染管線,而7800GTX擁有多達24條,差距如此之大,根本無法用新架構(gòu)的效率及高頻率來彌補。
R520與R580的架構(gòu)幾乎完全相同,不同的只有像素單元數(shù)量
當時誰都沒有料到ATI還預留了一手,原來R520這種架構(gòu)的實力遠不止16條像素渲染管線這么簡單,ATI完全顛覆了傳統(tǒng)“管線”的概念,R580核心緊隨其后,將像素渲染單元提升只48個之多,整整是R520的3倍!而頂點渲染單元和紋理單元以及GPU其它所有模塊都沒有做任何改動。
從R520到R580的這種改變當時令所有人都很費解,因為包括G70和R420在內(nèi)的以往所有GPU都是管線式架構(gòu),就是像素渲染單元內(nèi)部包含了紋理單元,一般像素和紋理的比例是1:2或者1:1。而R520首次將像素單元和紋理單元拆分開來,成為獨立的設計,所有的像素單元都可以互相共享所有紋理單元資源,R520的像素和紋理比例依然是1:1,而R580的比例則瞬間提升至3:1,相信資歷較老的玩家一定記得ATI當年大肆鼓吹“三比一架構(gòu)”。
這樣設計是因為ATI發(fā)現(xiàn)了游戲的發(fā)展趨勢,像素渲染的比重越來越高,而紋理貼圖的增長比較緩慢,相信大家還記得當年ATI的DX7顯卡,其一條管線中包括了3個紋理單元,以前是1:3后來是1:2接著變成1:1,現(xiàn)在被ATI一舉提升至3:1。雖然當時很多人都不好理解,但從現(xiàn)在的發(fā)展來看,像素與紋理的比例越拉越大,DX10時代大概是3:1,DX11時代則變成了5:1甚至更高!
除了具有前瞻性的3:1架構(gòu)外,X1000架構(gòu)還有另一大絕招就是HDR+AA技術(shù)。大家知道6800系列連續(xù)兩年都是市面上唯一的DX9C顯卡,當時所有的DX9C游戲都是基于NVIDIA的架構(gòu)而開發(fā),當使用N卡開啟HDR特效時(準確的說是FP32格式),會占據(jù)原本屬于MSAA的緩沖區(qū),導致HDR和AA無法共存。HDR是DX9C的代表技術(shù),能大大提升畫面效果,而AA消除鋸齒也能大幅改善畫質(zhì),這兩項關(guān)鍵特效無法同時開啟讓玩家們很郁悶。
ATI的DX9C產(chǎn)品比NV晚了一代,ATI意識到了DX9C的這一缺陷之后,在其架構(gòu)設計之初就考慮到了HDR和AA共存的問題,因此特別設計了專用的緩沖區(qū),可以通過游戲或者驅(qū)動重新指定MSAA的緩存位置,從而同時開啟HDR+AA。遺憾的是修改游戲或驅(qū)動兼容性并不好,支持的游戲也不多,雖然這確實是一個很大的賣點,ATI銳意進取的精神也值得尊重,但最終效果還是不如人意。
另外,X1000也改進了像素著色單元的內(nèi)部結(jié)構(gòu),每個像素單元都擁有兩個算術(shù)邏輯單元和一個分支執(zhí)行單元,其中ALU1只能執(zhí)行加法(ADD)計算,ALU2能執(zhí)行包括加法、乘法(MUL)、乘加(MADD)各類運算,兩個ALU最高可以執(zhí)行兩條指令(3D+1D)。為了控制如此龐大的像素單元,ATI還針對SM3.0的特性改進了動態(tài)流控制功能,大大改進了SIMD架構(gòu)的動態(tài)分支性能,讓像素著色效能得到提升。
功夫不負有心人,全新架構(gòu)并且擁有多達48像素單元的X1900XTX,性能比X1800XT獲得了大幅提升,完勝對手的7900GTX,而且越新的游戲優(yōu)勢越明顯。強大的X1900XTX迫使NVIDIA推出雙G71核心的7950GX2來對抗,雖然7950GX2單卡超越了X1950XTX,但雙卡的話則因效率問題依然是A卡占優(yōu)。
★ 小結(jié):DX9C時代雙方架構(gòu)各有所長
DX9C是一代經(jīng)典API,至今依然有很多游戲無視DX10/DX11,堅守DX9C平臺,以至于HDR+AA的問題被遺留至今依然沒能得到完美解決。NV40是因為發(fā)布較早沒能解決這一難題,G70則是擴充像素和頂點的產(chǎn)物,也沒能解決。
ATI在X800時代未能搶得先機,因此在X1000架構(gòu)當中花了很多心思,爭取做最完美的DX9C顯卡,他們確實做到了這一點,無論架構(gòu)和性能都有優(yōu)勢。但由于晶體管規(guī)模太大,功耗表現(xiàn)不如人意,因此在市場方面X1000與GF7相比并無優(yōu)勢。
關(guān)注我們
