[7800GTX專題]CineFX4.0引擎優(yōu)勢剖析
在不久前結(jié)束的2005年E3大展上,微軟和索尼先后發(fā)布了各自旗下最新一代的游戲主機——XBOX 360和PS3。不知是巧合抑或必然,在這兩款新游戲機上,圖形處理單元分別采用了來自當(dāng)前兩大圖形芯片巨頭ATI和NVIDIA的芯片。電視游戲機采用PC圖形芯片廠商的產(chǎn)品,這說明了什么問題呢?
微軟的XBOX 360采用了來自ATI的圖形芯片
索尼的PS3使用了NVIDIA的“RSX”GPU
在PS2與XBOX對壘的時代,XBOX由于使用了NVIDIA代號為“NV2A”的圖形芯片,再加上較對手更高主頻的CPU和更大的內(nèi)存,從而在3D運算能力上大大領(lǐng)先于PS2。有趣的是,在PS3與XBOX 360的時代,索尼開始采用NVIDIA的圖形芯片,而微軟卻放棄了與老朋友的合作,而把橄欖枝伸向了NVIDIA的競爭對手ATI。但無論如何,我們可以得出這樣一個結(jié)論:當(dāng)前在圖形芯片的技術(shù)方面,NVIDIA和ATI已經(jīng)遙遙走在了整個行業(yè)的最前沿。也因此在新世代游戲機的競爭中,不約而同得到了各家巨頭的青睞。
2005年6月22日,NVIDIA為電腦玩家?guī)砹怂麄冏钚碌膱D形芯片——GeForce 7800 GTX。作為最新一代的GeForce芯片系列,這款產(chǎn)品將再次為PC帶來前所未有的圖形處理能力,也帶來了全新的以往不可想象的游戲體驗。
相信大家已經(jīng)看過本站的相關(guān)數(shù)據(jù)評測。而在這篇文章中,我們要探討的主題則是大家熟悉而又陌生的一個新關(guān)鍵詞——CineFX。說它熟悉,是因為早在GeForce FX5800時代,它就已經(jīng)成為一個宣傳概念而被我們所熟知;說它陌生,是因為可能大多數(shù)讀者至今都并不太清楚它究竟意味著什么。

2003年NVIDIA發(fā)布GeForce FX5800的時候,同時開始大力宣傳一套全新的概念——CineFX引擎。隨之而來的是一句深入人心的宣傳用語:電腦畫質(zhì)電影化。很顯然,NVIDIA意識到僅有速度的提升遠遠不能滿足用戶的需求,畫質(zhì)的重要性正日益凸現(xiàn)。
在使用CineFX引擎的第一代產(chǎn)品GeForce FX5800誕生之前,NVIDIA一直致力于提高GPU的速度,而不是設(shè)計復(fù)雜的管線??傻紾eForce FX5800時代,情況有所改觀。聯(lián)合Cg編程語言的CineFX架構(gòu),讓GeForce FX5800成為可靈活處理頂點和像素指令的可編程GPU。換言之,CineFX引擎的誕生,意味著圖形芯片廠商的發(fā)展方向,已經(jīng)由以往單純的速度之爭,而轉(zhuǎn)向了畫質(zhì)與速度的雙重競爭。
時間一晃而過,2005年6月最新發(fā)布的GeForce 7800GTX給我們帶來了第4代的CineFX4.0引擎,它再一次地為我們帶來了不可思議的強勁表現(xiàn)。新技術(shù)的基本特性與改進如下:
● CineFX 4.0特點
1.全新設(shè)計的頂點處理單元(vertex shader unit)減少了處理頂點的時間,提高了幾何運算的能力。
2.最新的像素處理單元(pixel shader unit )提供了高達原來兩倍的浮點運算能力,為顯卡的速度提供了巨大的性能提升。
3.先進的紋理單元(texture unit )讓紋理的過濾和混合速度加快,提高效率。
那么,作為第4代CineFX引擎,CineFX4.0這些改進,都體現(xiàn)在哪些具體的方面,而它為我們又帶來了哪些實實在在的驚喜呢?本文將為您揭示這一切。
CineFX,對于廣大的硬件愛好者特別是N卡Fans來講應(yīng)該已經(jīng)非常熟悉了。現(xiàn)如今CineFX引擎已經(jīng)發(fā)展到了第4代,在熟悉第4代CineFX引擎之前,我們先來回頭看看CineFX引擎的歷史。
● 第一代CineFX引擎
CineFX 1.0引擎誕生于GeForce 5800(NV30)發(fā)布的時候。


CineFX Shaders能夠提供實現(xiàn)電影級驚人視覺效果的編程能力,更讓人驚異的是,為了實現(xiàn)電影級別渲染,GeForceFX不惜代價首次提供了128位的顏色表示以及運算能力。配合GeForceFX GPU,NVIDIA宣稱讓桌面領(lǐng)域圖像渲染第一次達到了實時的電影級別渲染水準(zhǔn),這個進步也讓圖形工業(yè)從單純的注重像素填充率轉(zhuǎn)移到成熟的像素效果實現(xiàn)上。
當(dāng)然,歷史紀(jì)念碑上的先驅(qū),往往在當(dāng)時卻并不被世人所重視。CineFX的威力,在GeForce FX5800時代也并未被完全發(fā)揮出來,而大家反而詬病其速度表現(xiàn)一般。這也跟當(dāng)時DirectX的主流應(yīng)用還處于8.1時代有關(guān)。但敢于走在前面的NVIDIA,歷史給予的回報也同樣豐厚。如今DirectX 9.0已經(jīng)真正在游戲當(dāng)中普及,我們也終于認(rèn)識到,原來畫質(zhì)的改變可以帶來如此多的驚喜!
意義:首次引入CineFX概念,將電腦圖形處理引入實時的電影級別渲染水準(zhǔn),提供了可以動態(tài)分支與循環(huán)控制的CG程序模式。
對于CineFX 1.0以及GeForce FX5800的介紹,大家可以查看我們之前的文章《代號NV30!NVIDIA的終極武器GeForce FX5800》
CineFX 2.0引擎誕生于GeForce FX5900(NV35)發(fā)布之時,它的具體特點是:改進了浮點Pixel Shader的運算能力(NVIDIA宣稱可以達到NV30兩倍的性能),采用了256位的顯存結(jié)構(gòu),并改善了各向異性過濾的圖像質(zhì)量等。
意義:改進了Pixel Shader的運算能力,提高了性能。
相對于一代的“從無到有”而言,CineFX 2.0的改進并不算是翻天覆地。關(guān)于CineFX 2.0以及GeForce FX5900的解析和測試,大家可以參考我們之前的文章:《NV35強擊登場!GeForce FX5900 Ultra》
CineFX 3.0引擎是NVIDIA上一代產(chǎn)品的最主要特點,也就是GeForce 6800(NV40)的驅(qū)動引擎。
CineFX 3.0的最重要意義在于完全支持微軟DirectX 9.0中的Shader Model 3.0。這個最新版本的Model包括大家非常熟悉的VertexShader 3.0以及PixelShader 3.0。完全支持最初由SGI提出的OpenGL 1.5版本。在編程語言方面,同時支持微軟的HLSL、OpenGL Shader Language以及NVIDIA自己的CG語言。
假如說在GeForce FX時代,大家還難以理解“畫質(zhì)”二字蘊涵的意義的話。那么現(xiàn)如今,通過SM3.0特效在《分裂細胞·明日潘多拉》、《FarCry》、《兄弟連》等游戲作品中的實際應(yīng)用,相信沒有人能夠否認(rèn)它帶給我們的驚喜了。
意義:首款支持SM3.0的圖形引擎,帶來了HDR(高動態(tài)范圍)的出色效果。
關(guān)于CineFX 3.0、GeForce 6800的測試以及解析,請看我們之前的文章:《王者歸來 GeForce 6800U完全解析》以及《王者歸來性能翻番 GeForce6技術(shù)解析》。
下面,我們就要進入本文的正題——CineFX 4.0的全面解析上來了。
我們知道,在計算機圖形中,看到的最終3D模型生成的過程是由點到線,再由線到面的。
一個3D模型的基礎(chǔ)就是“頂點”,3D模型的一切位置和形狀的變換,最基礎(chǔ)的狀態(tài)就是這些頂點坐標(biāo)的不斷變換。在一個3D模型中,頂點的數(shù)目非常多,這些頂點的位置變換決定著整個3D模型的調(diào)整。所以,頂點運算在3D游戲中處于基礎(chǔ)的地位,是3D游戲流暢運行的第一個必要保證。
左為5287個三角形模型,右為200萬三角形模型(點擊放大)
NVIDIA賦予了GeForce 7800GTX這款支持CineFX 4.0的最新圖形芯片全新的Vertex Shader單元,提供了比上一代產(chǎn)品更為強大的3D頂點運算性能。在最新的CineFX 4.0引擎中,NVIDIA改變了上一代的Vertex Shader單元的內(nèi)部結(jié)構(gòu),增強了并行處理頂點位置數(shù)據(jù)的能力。新一代的GeForce 7800GTX內(nèi)部的Vertex Shader單元的數(shù)目,由上一代的并行處理6個,增強到了8個,性能進一步得到了提高。


CineFX 4.0中另外一個重要的部分就是Pixel Shader部分了,這個部分是負(fù)責(zé)象素處理的。在CineFX 3.0的時代,NVIDIA的圖形芯片就已經(jīng)全面支持SM3.0了,其中的Pixel Shader 3.0自然也不在話下。然而今天我們所關(guān)心的是,在CineFX 4.0引擎中,Pixel Shader的改進有哪些。
出色的游戲效果需要多次運算才能得到
首先從架構(gòu)上講,在G70中,Pixel Shader單元的數(shù)目有了大幅度的提高,從上一代的16個,增加到了24個,這也就是指我們常說的“管線”數(shù)有了50%的提高。
然而值得我們更加高興的是,在CineFX 4.0引擎中的Pixel Shader單元中,每個單元內(nèi)部也有了進一步的改進。這就是提高了MADD的運算能力。
所謂MADD,就是Multiply-ADD 的縮寫,直譯過來就是“乘法-加法”的意思,這是一種操作。提高這個操作的效能能夠?qū)Ψ瓷湫Ч?,折射效果,模糊效果等許多種效果提高效能。
這是為什么呢?因為在圖形的象素級操作中,每個象素包含RGBA四種“顏色”(實際是四個通道),所有效果的產(chǎn)生均是靠對每個象素的顏色以及Alpha值進行變換得到的,在這些操作的程序中,大量的操作均是依靠加法以及乘法實現(xiàn)的,所以加法和乘法的運算速度很大程度上將決定這些特效的性能。
在CineFX 4.0中,NVIDIA對Pixel Shader進行了改進,使得新一代的GeForce 7800能夠比上一代的GPU提供翻被的MADD性能。
下面我們就來看看在全新的CineFX4.0中的浮雕貼圖(Relief Mapping)技術(shù)。
浮雕貼圖技術(shù),是一種利用法線貼圖技術(shù)實現(xiàn)凹凸效果的技術(shù),這種技術(shù)僅僅使用法線貼圖就可以在一個平面上生成立體效果,對于增強游戲畫面的效果有很大的幫助。

效果

紋理貼圖對于HDR(High Dynamic-Range 高動態(tài)),我想大家應(yīng)該已經(jīng)非常熟悉了,這種技術(shù)能夠讓游戲中的畫面效果有大幅度的提升,這主要體現(xiàn)在用這種效果的游戲中的畫面,能夠?qū)Σ煌炼鹊膱鼍斑M行出色的表現(xiàn),無論是高亮度的地方,還是低亮度的地方,細節(jié)都能夠被很好的表現(xiàn)出來。
關(guān)閉HDR
開啟HDR
據(jù)科學(xué)家研究,人類的眼睛對光線可以分辯的精度是10e14:1,而我們的計算機中標(biāo)準(zhǔn)的32位顏色只能提供255:1的動態(tài)范圍,簡直是天壤之別。傳統(tǒng)的LDR模式根本不足以表現(xiàn)出多層次的動態(tài)范圍。
在GeForce 7800 GTX具備的CineFX4.0引擎中,將HDR的精度增強到了64bit,這為實現(xiàn)更好的效果提供了保證。
關(guān)閉HDR
開啟HDR
在CineFX 4.0中,對亮度的計算是采用16位浮點數(shù)據(jù)進行運算的,具體格式是1位符號,11位底數(shù),4位指數(shù),所表示的數(shù)值的范圍是+/-2^11:1,比傳統(tǒng)的方式能夠顯示的亮度范圍大的多。
在最新的圖形芯片中,大家都很看重抗鋸齒的能力,因為抗鋸齒能夠讓游戲的畫面的精細度大大提高,真實性也大大提高。兩家圖形芯片商更是不斷推出新的抗鋸齒的方案,力圖提供給大家最好的效果。

普通抗鋸齒這次,GeForce 7800GTX中添加了一種新的抗鋸齒模式,叫做SuperSampling AntiAlising(超級采樣抗鋸齒)。這種抗鋸齒功能為我們帶來了非同尋常的震撼。
說出這樣的話小編自然不是信口開河,因為這種抗鋸齒功能和我們之間見到的抗鋸齒的原理有所不同,帶來的效果也有所不同。

超級采樣抗鋸齒我們知道,F(xiàn)SAA(全屏抗鋸齒)是針對畫面中物體的邊緣進行的,GPU會對物體邊緣的象素進行采樣,進行計算之后重新賦予新的顏色,這樣就能夠消除鋸齒效應(yīng)了。
但是這種傳統(tǒng)的抗鋸齒模式卻沒有辦法對同一個多邊形內(nèi)部的東西進行抗鋸齒,而這種方法正是目前游戲中很主流的一種技術(shù)。
目前,在很多游戲中,對于一些厚度很小的物體,游戲開發(fā)者都喜歡用一張帶有透明色的貼圖來表現(xiàn),這樣能夠節(jié)約資源,比如鐵絲網(wǎng),如果用3D建模來實現(xiàn),肯定會特別的不值,數(shù)據(jù)運算量會很大,而且效果也不見得多好,相同的還有很多樹木的樹冠只需要用數(shù)片這樣的貼圖就能完成了。
但是,這種在一個貼圖上甚至是在一個多邊形上的“邊緣”,圖形芯片通常是檢測不到的,因為它并不會認(rèn)為這是需要做抗鋸齒的地方,而GeForce 7800GTX卻具備了這樣的功能,它能夠自動分辯透明度高的地方和不透明的地方,對這些邊緣進行抗鋸齒。
CineFX4.0引擎作為最新一代NVIDIA圖形芯片的動力來源,為我們提供了更強勁的性能以及豐富實用的功能。
性能方面,除了增加管線數(shù)目之外,CineFX4.0引擎在每一個渲染管線上都有改進,增加了數(shù)據(jù)處理單元,每個單元的性能都得到了提升。
功能方面,增加了超級采樣抗鋸齒的功能,讓原來不能進行抗鋸齒操作的透明貼圖中的內(nèi)容也能有很好的效果。
精度方面,全面支持64bit浮點精度,提高了運算過程中的精度,獲得了更大的動態(tài)范圍,從而實現(xiàn)了更好的效果。
對于GeForce 7800GTX圖形芯片,我們除了本文是專門針對CineFX引擎之外,還有其他方面的文章,大家可以點擊下面的鏈接查看。
關(guān)注我們


