適者生存!顯卡 DirectX API 進(jìn)化論
D-Sub:喜感的命名緣何悲劇的人生?DVI第四者插足誰(shuí)的邯鄲一夢(mèng)?有做小四的資本,卻終究抵不過(guò)野心家……;革命拉開(kāi)顯卡接口混亂之治的序章,HDMI 和 DisplayPort 終將一戰(zhàn)!上次我們從接口說(shuō)起,闡述了顯卡發(fā)展史上影響力最大的幾種接口之間的淵源糾葛,小小一個(gè)接口主導(dǎo)的是全球顯卡、顯示設(shè)備龐大的市場(chǎng),其中自然少不了爾虞我詐。(文章鏈接 《欲望貪婪和野心!看顯示接口混亂之治》)而今天我們將驚心動(dòng)魄的歷程再度回放,看看過(guò)去的十年,顯卡核心架構(gòu)為誰(shuí)而變、顯卡發(fā)展史的幕后誰(shuí)主沉浮,而Direct API 又在扮演什么樣的角色!
19世紀(jì)中葉,達(dá)爾文創(chuàng)立了科學(xué)的生物進(jìn)化學(xué)說(shuō),以自然選擇為核心的達(dá)爾文進(jìn)化論,第一次對(duì)整個(gè)生物界的發(fā)生、發(fā)展,作出了唯物的、規(guī)律性的解釋?zhuān)品颂貏?chuàng)論等唯心主義形而上學(xué)在生物學(xué)中的統(tǒng)治地位,使生物學(xué)發(fā)生了一場(chǎng)變革。
神創(chuàng)論者調(diào)侃達(dá)爾文
他認(rèn)為,生物之間存在著生存斗爭(zhēng),適應(yīng)者生存下來(lái),不適者則被淘汰,這就是自然的選擇。生物正是通過(guò)遺傳、變異和自然選擇,從低級(jí)到高級(jí),從簡(jiǎn)單到復(fù)雜,種類(lèi)由少到多地進(jìn)化著、發(fā)展著。以上三點(diǎn),就是我們常聽(tīng)到的“物競(jìng)天擇,適者生存”,現(xiàn)在基因?qū)W誕生之生,為此提供了重要的證據(jù),事實(shí)上,物競(jìng)天擇,競(jìng)的是“基因”。
以達(dá)爾文進(jìn)化論為基礎(chǔ)的間斷平衡論認(rèn)為,進(jìn)化以跳躍的方式快速形成;新種一旦形成就處于保守或進(jìn)化停滯狀態(tài),直到下一次物種形成事件發(fā)生……
顯示芯片領(lǐng)域同樣的競(jìng)爭(zhēng)也在延續(xù)。從GPU誕生至今雙方都已推出了十多代產(chǎn)品,每一代產(chǎn)品之間的對(duì)決都令無(wú)數(shù)玩家心動(dòng)不已,而NVIDIA和ATI每一代產(chǎn)品誰(shuí)更強(qiáng)大似乎有某種規(guī)律可循,DirectX之于GPU架構(gòu)就象環(huán)境之于物種。其中最精彩的戰(zhàn)役往往就在微軟DirectX API版本更新時(shí)出現(xiàn)。
在我們的地球上,曾經(jīng)有很多生物種類(lèi)出現(xiàn)后又消失了,這是一個(gè)生物演化史中的必然階段。
有一天,恐龍們還在地球樂(lè)園中無(wú)憂無(wú)慮地盡情吃喝,突然天空中出現(xiàn)了一道刺眼的白光,一顆直徑10公里相當(dāng)于一座中等城市般大的巨石從天而降。那是一顆小行星,它以每秒40公里的速度一頭撞進(jìn)大海,在海底撞出一個(gè)巨大的深坑,海水被迅速氣化,蒸氣向高空噴射達(dá)數(shù)萬(wàn)米,隨即掀起的海嘯高達(dá)5公里,并以極快的速度擴(kuò)散,沖天大水橫掃著陸地上的一切,洶涌的巨浪席卷地球表面后會(huì)合于撞擊點(diǎn)的背面一端,在那里巨大的海水力量引發(fā)了德干高原強(qiáng)烈的火山噴發(fā),同時(shí)使地球板塊的運(yùn)動(dòng)方向發(fā)生了改變。
那是一場(chǎng)多么可怕的災(zāi)難啊。隕石撞擊地球產(chǎn)生了鋪天蓋地灰塵,極地雪融化,植物毀滅了,火山灰也充滿(mǎn)天空。一時(shí)間暗無(wú)天日,氣溫驟降,大雨滂沱,山洪暴發(fā),泥石流將恐龍卷走并埋葬起來(lái)。在以后的數(shù)月乃至數(shù)年里,天空依然塵煙翻滾,烏云密布,地球因終年不見(jiàn)陽(yáng)光而進(jìn)入低溫中,蒼茫大地一時(shí)間沉寂無(wú)聲。生物史上的一個(gè)時(shí)代就這樣結(jié)束了。
如果說(shuō)3DFX顯卡就象當(dāng)時(shí)統(tǒng)治地球的恐龍,那Windows 95無(wú)疑就是白堊紀(jì)撞擊地球的小行星了,它的發(fā)布真正讓個(gè)人計(jì)算機(jī)熱席卷全球,全新的圖形界面讓整個(gè)業(yè)界興奮不已,全球軟硬件廠商都不得不向其靠攏。正是這樣環(huán)境的巨大改變,集成在windows下的DirectX才有資格與OpenGL/Glide分庭抗禮,而最終結(jié)果是曾經(jīng)不可一世的3Dfx帝國(guó)土崩瓦解,NVIDIA和ATI適者生存。
在DirectX 5.0以前,顯卡和游戲都以支持OpenGL和Glide(3DFX的專(zhuān)用API)為榮,DirectX只是在市場(chǎng)的一隅茍且偷生,基于DOS系統(tǒng)的Windows還不夠強(qiáng)大,而微軟的影響力還遠(yuǎn)遠(yuǎn)沒(méi)到左右游戲開(kāi)發(fā)商和芯片廠商的地步。
沉船側(cè)畔千帆過(guò),病樹(shù)前頭萬(wàn)木春??茖W(xué)家認(rèn)為如果沒(méi)有6500萬(wàn)年前的大撞擊導(dǎo)致恐龍滅絕,作為哺乳動(dòng)物的人類(lèi)難以發(fā)展成為地球的主宰。
一滅一生,一個(gè)循環(huán),如果沒(méi)有3DFX帝國(guó)的轟然倒塌,同樣也沒(méi)有目前虛擬現(xiàn)實(shí)技術(shù)的華麗轉(zhuǎn)生,而從那時(shí)起,兩大陣營(yíng)的殊死較量才剛剛開(kāi)始……
冰川時(shí)期是指地球表面覆蓋有大規(guī)模冰川的地質(zhì)時(shí)期,又稱(chēng)為冰川時(shí)期。兩次冰期之間為一相對(duì)溫暖時(shí)期,稱(chēng)為間冰期。地球歷史上曾發(fā)生過(guò)多次冰期,最近一次是第四紀(jì)冰期。
冰期時(shí)期最重要的標(biāo)志是全球性大幅度氣溫變冷,在中、高緯(包括極地)及高山區(qū)廣泛形成大面積的冰蓋和山岳冰川。由于水分由海洋向冰蓋區(qū)轉(zhuǎn)移,大陸冰蓋不斷擴(kuò)大增厚,引起海平面大幅度下降。所以,冰期盛行時(shí)的氣候表現(xiàn)為干冷。冰蓋的存在和海陸形勢(shì)變化,氣候帶也相應(yīng)移動(dòng),大氣環(huán)流和洋流都發(fā)生變化,這均直接影響動(dòng)植物生長(zhǎng)、演化和分布。
如果說(shuō)windows的發(fā)布對(duì)于3Dfx的影響類(lèi)似于小行星撞地球?qū)τ诳铸埖挠绊?,那DirectX 7.0的發(fā)布則宣告了顯卡間冰期的到來(lái),在這樣的環(huán)境變遷之下,顯卡產(chǎn)業(yè)走上了欣欣向榮的發(fā)展和輝煌之路。
DirectX 7.0堪稱(chēng)一次革命性的改進(jìn),其最大的特色就是支持Transform & Lighting,中文名稱(chēng)——“坐標(biāo)轉(zhuǎn)換和光源”。
3D游戲中的任何一個(gè)物體都有一個(gè)坐標(biāo),當(dāng)此物體運(yùn)動(dòng)時(shí),它的坐標(biāo)發(fā)生變化,這指的就是坐標(biāo)轉(zhuǎn)換;3D游戲中除了場(chǎng)景+物體還需要燈光,沒(méi)有燈光就沒(méi)有3D物體的表現(xiàn),無(wú)論是實(shí)時(shí)3D游戲還是3D影像渲染,加上燈光的3D渲染是最消耗資源的。
基于T&L技術(shù)的演示Demo
雖然OpenGL中已有相關(guān)技術(shù),但此前從未在民用級(jí)硬件中出現(xiàn)。而在T&L問(wèn)世之前,位置轉(zhuǎn)換和光照效果都需要CPU來(lái)計(jì)算,CPU速度越快,游戲表現(xiàn)越流暢。使用了T&L功能后,這兩種效果的計(jì)算用顯卡核心來(lái)計(jì)算。
也許這樣說(shuō)大家還不是很明白,舉個(gè)例子,DX7以前的顯卡并不能算是真正意義上的顯卡,至少功能不全,而支持DX7的顯卡就可以自行計(jì)算位置轉(zhuǎn)換和光照效果,從而把CPU從繁忙的勞動(dòng)中解脫出來(lái),讓CPU做他該作的事情,比如邏輯運(yùn)算、數(shù)據(jù)計(jì)算等等。
改進(jìn)的效果顯而易見(jiàn),在CPU不堪重負(fù)的時(shí)代,DX7顯卡用T&L渲染游戲時(shí),即使沒(méi)有高速的CPU,同樣能能流暢的跑3D游戲。顯卡對(duì)于PC的重要性上升到一個(gè)新的高度,所以很多人認(rèn)為,DirectX 7.0是API發(fā)展史上的一個(gè)里程碑。
★ 始祖鳥(niǎo)時(shí)代:GeForce 256(NV10)
DirectX 7.0架構(gòu)首次讓CPU走下了神壇,讓大家知道原來(lái)PC中可以有第二顆運(yùn)算處理器——GPU。
T&L優(yōu)秀的特性成為當(dāng)時(shí)業(yè)界關(guān)注的焦點(diǎn),這樣的環(huán)境孕育出了全球首顆GPU,支持DX7與T&L的——NVIDIA GeForce 256,可以說(shuō)它是一款劃時(shí)代的產(chǎn)品,為了突出它先進(jìn)的技術(shù)特性,NVIDIA將GeForce 256的顯示核心稱(chēng)為GPU(Graphic Processing Unit,圖形處理器)。
GeForce 256所采用的核心技術(shù)除了硬件T&L之外,還有立方環(huán)境材質(zhì)貼圖、頂點(diǎn)混合、紋理壓縮和凹凸映射貼圖、雙重紋理四像素、256位渲染引擎等諸多先進(jìn)技術(shù)。在性能大幅提升的同時(shí),3D游戲的畫(huà)面得到了質(zhì)的提升。
此后發(fā)布的GeForce 2 GTS就是GeForce 256的提速版本,架構(gòu)、規(guī)格和技術(shù)沒(méi)有多少改變。因此可以說(shuō)GeForce 256就已經(jīng)確立了當(dāng)今GPU的整體架構(gòu)雛形,我們可以看到它擁有專(zhuān)門(mén)的坐標(biāo)轉(zhuǎn)換與光源引擎,還有裝配引擎、渲染管線、后期處理模塊等等,這些功能單元基本都被沿用至今。
★ 兩強(qiáng)爭(zhēng)霸局面形成:Radeon 256
在DX7大勢(shì)所趨的局面下,ATI也發(fā)布了首款DX7顯卡,其命名都與NVIDIA驚人的一致——Radeon 256,由此掀開(kāi)了NVIDIA與ATI、GeForce與Radeon爭(zhēng)霸的局面。
Radeon 256獨(dú)特的單管線3紋理架構(gòu)
Radeon 256同樣支持硬件T&L、環(huán)境貼圖和凹凸貼圖,還支持Hyper及和DOT3壓縮技術(shù),Radeon 256只有兩條渲染管線,但每條管線擁有多達(dá)3個(gè)紋理單元,而GeForce 256每條管線只有1一個(gè)紋理單元,GeForce 2 GTS才改進(jìn)為2個(gè)。但遺憾的是Radeon 256的第3個(gè)貼圖單元直到它退市的時(shí)候也沒(méi)有任何程序能夠支持它,同時(shí)令人詬病的驅(qū)動(dòng)也令用戶(hù)大為惱火。
Radeon 256及其衍生的Radeon VE/LE/SE等都是優(yōu)秀的產(chǎn)品,技術(shù)與架構(gòu)不輸給GeForce系列,功能甚至還更豐富,但糟糕的軟硬件支持度導(dǎo)致它無(wú)法同GeForce相抗衡,口碑和市場(chǎng)都不如人意。
★ 小結(jié):DX7架構(gòu)平分秋色,硬件規(guī)格決定性能
GeForce 256與Radeon 256的基本架構(gòu)是相同的,不同的是管線設(shè)計(jì),GeForce 256擁有更多4條管線,但紋理單元也只有4個(gè);Radeon 256雖然只有2條管線,但每管線擁有3個(gè)紋理單元,而且工作頻率很高,因此在理論性能上占優(yōu)勢(shì)。
在當(dāng)時(shí)來(lái)說(shuō),游戲大量使用了各種紋理貼圖,因此對(duì)紋理單元提出了很高的要求,所以NVIDIA在GeForce 2 GTS當(dāng)中改進(jìn)為單管線雙紋理。NVIDIA管線:紋理=1:2、ATI管線:紋理=1:3的架構(gòu)都維持了很多年,直到DX9時(shí)代才有了較大的變化。
DirectX 8.0 的每個(gè)組件都包括了重要的新特性,它們極大地增強(qiáng)了 DirectX 的功能。圖形、音頻和網(wǎng)絡(luò)三個(gè)組件被徹底重寫(xiě)。DirectInput 包括了新的配置功能、操作映射和更好的國(guó)際化支持。DirectShow 第一次作為 DirectX 的一部分出現(xiàn)在運(yùn)行時(shí)和 SDK 中。
現(xiàn)在看來(lái),DirectX 8.0架構(gòu)重要性可以和DirectX 7.0相提并論,T&L的引入第一次將顯卡從一個(gè)單純的打印機(jī)變成了有主動(dòng)操作功能的圖形處理器,而DirectX 8.0 shader的引入則將運(yùn)算能力這個(gè)無(wú)限可能的大門(mén)放置在了顯卡面前,透過(guò)運(yùn)算能力,人們終于可以準(zhǔn)確并且實(shí)時(shí)的操作紋理上像素的色彩,并最終透過(guò)正確的色彩表達(dá)正確的效果了。
● DirectX 8.0:引入像素和頂點(diǎn)兩大渲染管線
面向圖形計(jì)算,讓GPU逐漸找到了自己的方向,那就是給予用戶(hù)更真更快地視覺(jué)體驗(yàn),但是GPU架構(gòu)也遇到一些問(wèn)題亟待解決。首要問(wèn)題就是,要實(shí)現(xiàn)更加復(fù)雜多變的圖形效果,不能僅僅依賴(lài)三角形生成和固定光影轉(zhuǎn)換,雖然當(dāng)時(shí)游戲畫(huà)面的提高基本上都是通過(guò)大量的多邊形、更復(fù)雜的貼圖來(lái)實(shí)現(xiàn)的。
但后期的發(fā)展中,頂點(diǎn)和像素運(yùn)算的需求量猛增。每個(gè)頂點(diǎn)都包含許多信息,比頂點(diǎn)上的紋理信息,散光和映射光源下表現(xiàn)的顏色,所以在生成多邊形的時(shí)候帶上這些附加運(yùn)算,就可以帶來(lái)更多的效果,但這也更加考驗(yàn)頂點(diǎn)和像素計(jì)算能力。
2001年微軟發(fā)布了DirectX 8.0,一場(chǎng)新的顯卡革命開(kāi)始,它首次引入了ShaderModel的概念,ShaderModel就相當(dāng)于是GPU的圖形渲染指令集。其中像素渲染引擎(Pixel Shader)與頂點(diǎn)渲染引擎(Vertex Shader)都是ShaderModel 1.0的一部分,此后每逢DirectX有重大版本更新時(shí),ShaderModel也會(huì)相應(yīng)的升級(jí)版本,技術(shù)特性都會(huì)大大增強(qiáng)。
與DX7引入硬件T&L僅僅實(shí)現(xiàn)的固定光影轉(zhuǎn)換相比,VS和PS單元的靈活性更大,它使GPU真正成為了可編程的處理器,時(shí)至今日DX11時(shí)代ShaderModel都在不停地更新,以便渲染出更逼真更完美的畫(huà)面。這意味著程序員可通過(guò)它們實(shí)現(xiàn)3D場(chǎng)景構(gòu)建的難度大大降低,但在當(dāng)時(shí)來(lái)說(shuō)可編程性還是很弱,GPU的這一特性還是太超前了。
DX8動(dòng)態(tài)光影效果展示:變色龍和不同角度的人臉
DirectX 8.0當(dāng)中的Pixel Shader和Vertex Shader的引入,使得GPU在硬件邏輯上真正支持像素和頂點(diǎn)的可編程,反映在特效上就是動(dòng)態(tài)光影效果,當(dāng)時(shí)波光粼粼的水面都是第一次展現(xiàn)在玩家面前。
在DirectX 8.0推出之后,環(huán)境變化太快,物種進(jìn)化有點(diǎn)跟不上了,當(dāng)時(shí)的DX8顯卡都定位太高,NVIDIA和ATI雙方都沒(méi)有推出過(guò)低端DX8顯卡,而支持DX7的上一代顯卡依然占據(jù)著市場(chǎng)的主導(dǎo),直到DX9誕生之后,昔日高端的DX8顯卡屈尊降貴,這是后話……
★ 鴨嘴獸時(shí)代:GeForce 3 Ti在DX8之前,無(wú)論NVIDIA還是ATI,都在強(qiáng)調(diào)顯卡前端及后端輸出。而Shader理念提出之后,雙方逐漸將競(jìng)爭(zhēng)重點(diǎn)放在了顯卡的渲染核心部分——像素渲染管線和頂點(diǎn)渲染管線,無(wú)論是GeForce 3 Ti還是Radeon 8500都內(nèi)置的規(guī)格和頻率更強(qiáng)的PS和VS單元。當(dāng)然也對(duì)顯卡的后端ROP(光柵化引擎,負(fù)責(zé)完成像素的輸出)也做了相應(yīng)的改進(jìn),各種各樣的多重采樣AA模式和材質(zhì)過(guò)濾技術(shù)逐步得以實(shí)現(xiàn)。
上圖就是GeForce 3的核心架構(gòu)圖,可以看出,由于DX8渲染模式的改變,GeForce 3相對(duì)于DX7的GeForce 2/256有了天翻地覆的變化,一半以上的模塊需要重新設(shè)計(jì)(綠色部分)。
GeForce 3的頂點(diǎn)管線設(shè)計(jì)
硬件規(guī)格方面,GeForce 3依然只有4條渲染管線,每條管線內(nèi)置2個(gè)紋理單元,這與上代的GeForce 2沒(méi)有區(qū)別。但是GeForce 3的核心晶體管數(shù)竟然是GeForce 2的兩倍以上,額外的晶體管大都用在了頂點(diǎn)管線部分,雖然它只有一個(gè)頂點(diǎn)著色單元。這個(gè)頂點(diǎn)著色單元其實(shí)就是一個(gè)4D SIMD(單指令多數(shù)據(jù)流)處理器,可以計(jì)算最多16項(xiàng)數(shù)據(jù)的頂點(diǎn),這在當(dāng)時(shí)來(lái)說(shuō)運(yùn)算能力已經(jīng)非常富裕了。
不過(guò),主流的游戲還是基于DX7開(kāi)發(fā),因此GeForce 3的VS單元很多時(shí)候都派不上用場(chǎng),由此導(dǎo)致GeForce 3在DX7游戲當(dāng)中領(lǐng)先GeForce 2 Ti的優(yōu)勢(shì)并不大,畢竟它們的像素渲染管線和紋理單元數(shù)目是相同的,頻率也沒(méi)有提升太多。
★ ATI直上DX8.1:Radeon 8500
DX8方面ATI再次落后于NVIDIA,但后發(fā)制人也有好處,ATI直接采用了微軟更新的DX8.1 API,因此在硬件特性方面要更勝一籌。不過(guò)DX8.1的改進(jìn)極為有限,只是改進(jìn)了大紋理水波紋的效能,未能得到整個(gè)業(yè)界的重視。
Radeon 8500與DX7版的Radeon系列相比,架構(gòu)上也產(chǎn)生了翻天覆地的變化,除了加入頂點(diǎn)引擎外,更多尚處于實(shí)驗(yàn)性的技術(shù)都被置于其中,而且2D輸出部分的功能更為豐富,可以說(shuō)在技術(shù)和功能方面完全超越了GeForce 3 Ti。
規(guī)格方面,Radeon 8500擁有4條像素渲染管線,這與GeForce 3是相同的,但是8500擁有2個(gè)頂點(diǎn)著色單元,而GeForce 3只有1個(gè),這就使得8500的理論性能更占優(yōu)勢(shì)。紋理單元方面ATI放棄了管線:紋理=1:3的設(shè)計(jì),采用了與NVIDIA相同的1:2設(shè)計(jì),因?yàn)榈?個(gè)紋理單元在多數(shù)游戲中都毫無(wú)用處,這樣雙方的紋理單元數(shù)量也完全相同。
★ 小結(jié):DX8架構(gòu)ATI更出色,NV性能更強(qiáng)
整體來(lái)看雙方都是重新設(shè)計(jì)的優(yōu)秀架構(gòu),考慮到眾多的特色功能和技術(shù),Radeon 8500的確要優(yōu)于GeForce 3 Ti。這是在3DFX滅亡之后,第一次有一家公司對(duì)NVIDIA造成如此大的壓力,所以NVIDIA發(fā)布了更高頻率的GeForce 3 Ti 500才勉強(qiáng)奪回性能之王的寶座。當(dāng)然NVIDIA成熟穩(wěn)定的驅(qū)動(dòng)和長(zhǎng)期積累的用戶(hù)口碑以幫助GeForce 3 Ti力壓Radeon 8500系列。
后期NVIDIA推出更多管線的GeForce 4 Ti自然擁有更強(qiáng)的DX8性能,但考慮到ATI方面沒(méi)有與之相對(duì)應(yīng)的產(chǎn)品,就不做對(duì)比了,因?yàn)锳TI已經(jīng)直接進(jìn)入了DX9時(shí)代。
● DirectX 9.0:高精度渲染時(shí)代來(lái)臨
2002年底,微軟發(fā)布DirectX 9.0,如果從技術(shù)規(guī)格上看,DX9似乎沒(méi)有DX7和DX8那種讓人眼前一亮的革命性技術(shù),它只是將ShaderModel版本從1.0升級(jí)到2.0而已。其實(shí)不然,此次ShaderModel指令集的改進(jìn)讓圖形渲染畫(huà)質(zhì)提高到了新的水平。
首先,PixelShader 2.0具備完全可編程架構(gòu),能對(duì)紋理效果即時(shí)演算、動(dòng)態(tài)紋理貼圖,還不占用顯存,理論上對(duì)材質(zhì)貼圖的分辨率的精度提高無(wú)限多;另外PS1.4只能支持28個(gè)硬件指令,同時(shí)操作6個(gè)材質(zhì),而PS2.0卻可以支持160個(gè)硬件指令,同時(shí)操作16個(gè)材質(zhì)數(shù)量,新的高精度浮點(diǎn)數(shù)據(jù)規(guī)格可以使用多重紋理貼圖,可操作的指令數(shù)可以任意長(zhǎng),電影級(jí)別的顯示效果輕而易舉的實(shí)現(xiàn)。
3DMark03中的最后一個(gè)場(chǎng)景就是DX9渲染,讓人眼前一亮
其次,VertexShader 2.0通過(guò)增加頂點(diǎn)指令的靈活性,顯著的提高了老版本的頂點(diǎn)性能,新的控制指令,可以用通用的程序代替以前專(zhuān)用的單獨(dú)著色程序,效率提高許多倍;增加循環(huán)操作指令,減少工作時(shí)間,提高處理效率;擴(kuò)展著色指令個(gè)數(shù),從128個(gè)提升到256個(gè)。
Radeon 9700所提供的HDR Demo
另外,增加對(duì)浮點(diǎn)數(shù)據(jù)的處理功能,以前只能對(duì)整數(shù)進(jìn)行處理,這樣提高渲染精度,使最終處理的色彩格式達(dá)到電影級(jí)別。突破了以前限制PC圖形圖象質(zhì)量在數(shù)學(xué)上的精度障礙,它的每條渲染流水線都升級(jí)為128位浮點(diǎn)顏色,讓游戲程序設(shè)計(jì)師們更容易更輕松的創(chuàng)造出更漂亮的效果,讓程序員編程更容易。
★ 哺乳動(dòng)物時(shí)代:Radeon 9700
當(dāng)NVIDIA沉浸于GeForce 4 Ti大獲全勝的DX8時(shí)代時(shí),ATI在DX9標(biāo)準(zhǔn)正式確立之前就提前發(fā)布了Radeon 9700顯卡,打得NVIDIA措手不及。這款產(chǎn)品來(lái)得如此突然,以至于ATI發(fā)布之時(shí)甚至沒(méi)有提供相關(guān)技術(shù)PPT/PDF。
由于DX9相比DX8并沒(méi)有改變3D渲染流程,僅僅是強(qiáng)化了ShaderModel指令集,因此R300的架構(gòu)相比R200改進(jìn)并不大,主要的變化是規(guī)模的擴(kuò)充與外圍控制模塊的加強(qiáng)。比如:首次使用256bit顯存控制器、類(lèi)似CPU的FCBGA封裝、更先進(jìn)的紋理壓縮技術(shù)以及后期處理單元。
R300的頂點(diǎn)和像素著色單元結(jié)構(gòu)
當(dāng)然,R300的Shader單元經(jīng)過(guò)了重新設(shè)計(jì),定址、色彩和紋理單元都支持浮點(diǎn)運(yùn)算精度,這是它能夠完美運(yùn)行DX9程序的關(guān)鍵。R300核心擁有8條像素渲染管線及4個(gè)頂點(diǎn)著色單元,每條像素管線中只有1個(gè)紋理單元。至此ATI的像素與紋理的比例從1:3到1:2再到1:1,在DX9C時(shí)代將會(huì)進(jìn)一步拉大至3:1,也就是風(fēng)靡一時(shí)的3:1架構(gòu),當(dāng)然這是后話了。
★ NVIDIA遭遇滑鐵盧——GeForce FX 5800
NV30核心采用了業(yè)界非常先進(jìn)的0.13微米工藝制造,并使用了最高頻率的GDDR2顯存,而且發(fā)布時(shí)間較晚,理應(yīng)占盡優(yōu)勢(shì)才對(duì)。但是這一次NVIDIA沒(méi)能跟上微軟的步伐,不僅在時(shí)間上晚于ATI,而且在DX9技術(shù)方面也未能超越。NV30的架構(gòu)存在較大的缺陷,NVIDIA艱難的完成了從DX8到DX9的過(guò)渡,但結(jié)果很不理想。
從宏觀上說(shuō),NV30的整體架構(gòu)更像是一個(gè)DX7(固定功能TRUE T&L單元)、DX8(FX12combiner整數(shù)處理單元)、DX9(浮點(diǎn)像素單元)的混合體。而在DX9的應(yīng)用中,不能出現(xiàn)非浮點(diǎn)精度的運(yùn)算,所以前兩者是不起作用的,造成了NV30晶體管資源的浪費(fèi),同時(shí)也影響了性能。
NV30的PiexlShader單元沒(méi)有Co-issue(標(biāo)量指令+矢量指令并行處理)能力,而在DX9中,單周期3D+1D是最常見(jiàn)指令處理方式,即在很多情況下RGB+A是需要非綁定執(zhí)行的,這時(shí)候NV30就無(wú)法并行執(zhí)行,指令吞吐量大大降低。其次,NV30沒(méi)有miniALU單元,也限制了NV30的浮點(diǎn)運(yùn)算能力(在NV35中DX8整數(shù)單元被替換為miniALU)。
另外,NV30在寄存器設(shè)計(jì)(數(shù)量及調(diào)用方式)、指令存儲(chǔ)方式(讀寫(xiě)至顯存)等方面也有缺陷。NV30的寄存器數(shù)量較少,不能滿(mǎn)足實(shí)際程序的需要。而且,用微軟的HLSL語(yǔ)言所編寫(xiě)的pixel shader2.0代碼可以說(shuō)NV30的“天敵”,這些shader代碼會(huì)使用大量的臨時(shí)寄存器,并且將材質(zhì)指令打包成塊,但是NV30所采用的顯存是DDR-SDRAM,不具備塊操作能力。同時(shí),NV30材質(zhì)數(shù)據(jù)的讀取效率低下,導(dǎo)致核心的Cache命中率有所下降,對(duì)顯存帶寬的消耗進(jìn)一步加大。
由于NV30是VILW(超長(zhǎng)指令,可同時(shí)包含標(biāo)量和SIMD指令)設(shè)計(jì)類(lèi)型的處理器,對(duì)顯卡驅(qū)動(dòng)的Shader編譯器效率有較高的要求。排列順序恰當(dāng)?shù)膕hader代碼可以大幅度提升核心的處理能力。在早期的一些游戲中,這種優(yōu)化還是起到了一定的作用。但對(duì)于后期Shader運(yùn)算任務(wù)更為繁重的游戲則效果不大。
最終,雖然NV30與上代的NV25相比架構(gòu)變化很大,但性能方面全面落后與對(duì)手的R300。不過(guò)NV30的架構(gòu)還是有一定的前瞻性,ATI的R600在Shader設(shè)計(jì)方面與NV30有很多相似之處。
★ 小結(jié):非“真DX9架構(gòu)”導(dǎo)致NV30失敗
現(xiàn)在再來(lái)看看,相信沒(méi)人會(huì)認(rèn)為DX9的改進(jìn)有限了。正是由于NVIDIA沒(méi)能適應(yīng)DX9所帶來(lái)ShaderModel指令的諸多改進(jìn),采用DX8+DX9混合式的架構(gòu),才導(dǎo)致NV30存在很大缺陷,在運(yùn)行DX9游戲時(shí)效率很低。另外冒險(xiǎn)采用先進(jìn)工藝、不成熟的GDDR2顯存、128bit位寬這些都極大的限制了NV30的性能,即便在DX8游戲中都無(wú)法勝過(guò)R300。
而ATI則占據(jù)天時(shí)地利人和等一切優(yōu)勢(shì),完全按照DX9標(biāo)準(zhǔn)而設(shè)計(jì),甚至在DX9標(biāo)準(zhǔn)確立之前就早早的發(fā)布了DX9顯卡,這不免讓人懷疑微軟的動(dòng)機(jī)和做法,顯然他不希望NVIDIA成為第二個(gè)Intel。
從多重材質(zhì)到T&L,從Shader programe到Unified Shader,在DirectX的影響下,圖形API走向了光柵化過(guò)程,實(shí)時(shí)演算圖像效果得以完善,有效的平衡了圖形運(yùn)算和虛擬現(xiàn)實(shí)的兩者之間供需矛盾。
號(hào)稱(chēng)實(shí)現(xiàn)“一切圖形特效”的DX9C
整個(gè)DirectX發(fā)展命運(yùn)的節(jié)點(diǎn)一個(gè)是DirectX 7中T&L的引入,一個(gè)是DirectX 8中shader的引入。T&L的引入第一次將顯卡從一個(gè)單純的打印機(jī)變成了有主動(dòng)操作功能的圖形處理器,而shader的引入則將運(yùn)算能力這個(gè)無(wú)限可能的大門(mén)放置在了顯卡面前,透過(guò)運(yùn)算能力,人們終于可以比較準(zhǔn)確并且實(shí)時(shí)的操作紋理上像素的色彩,雖然在當(dāng)時(shí)已經(jīng)是達(dá)到了桌面圖形效果的極限,但是這些色彩離真實(shí)還相去甚遠(yuǎn)。這兩個(gè)劃時(shí)代的API都無(wú)法與DirectX 9.0C進(jìn)行比較,因?yàn)橹钡紻irectX 9.0C,光柵化的眾多特效才得以最終實(shí)現(xiàn)。
但是這樣就完美了么?不是的。每次DirectX從應(yīng)用程序那里接收到一條命令,它就需要先對(duì)這條命令進(jìn)行分析和處理,再向圖形硬件發(fā)送相對(duì)應(yīng)的硬件命令。由于這個(gè)分析和處理的過(guò)程是在CPU上完成的,這就意味著每一條3D繪圖命令都會(huì)帶來(lái)CPU的負(fù)載。這種負(fù)載給3D圖象帶來(lái)兩個(gè)負(fù)面影響:限制了畫(huà)面中可以同時(shí)繪制的物體數(shù)量;限制了可以在一個(gè)場(chǎng)景中使用的獨(dú)立的特效的數(shù)量。這就使得游戲畫(huà)面中的細(xì)節(jié)數(shù)量受到了很大的限制。而使圖像具有真實(shí)感的重要因素,偏偏是細(xì)節(jié)量。
雖然DX9C號(hào)稱(chēng)可以顯然僅僅能夠?qū)崿F(xiàn)所有特效是遠(yuǎn)遠(yuǎn)不夠的,隨著圖形技術(shù)和硬件規(guī)格的快速發(fā)展,看似完美的DX9C很多矛盾逐漸顯露,程序員開(kāi)始抱怨拮據(jù)的資源和不兼容的接口,更為讓人無(wú)法接受的是,更高階的特效實(shí)現(xiàn)往往需要成千上萬(wàn)行的代碼,很多實(shí)例已經(jīng)趨于無(wú)法完成的危險(xiǎn)邊緣。
這是DirectX歷史上唯一一次半代更新就引起渲染大波的版本,DirectX 9.0c,大名鼎鼎的HDR技術(shù)誕生。
● DirectX 9.0c:非常好的光影渲染
以上諸多改進(jìn)相信很多人都不關(guān)心也不想知道,絕大多數(shù)人記住的只有一個(gè),那就是只有DX9C顯卡才支持HDR技術(shù),因?yàn)镠DR所帶來(lái)華麗的光影效果給所有人都留下了深刻的印象,那種從暗淡無(wú)光到流光溢彩的美好回憶,可以說(shuō)是很少見(jiàn)的的!
HDR的全稱(chēng)是High Dynamic Range,即高動(dòng)態(tài)范圍,是一種色彩存儲(chǔ)方式,在游戲用于存儲(chǔ)渲染和光照數(shù)據(jù)。HDR渲染可以用4句話來(lái)概括:1.亮的地方很亮;2.暗的地方很暗;3.亮暗部的細(xì)節(jié)非常非常明顯;4.所有光照為實(shí)時(shí)計(jì)算生成,可模擬人眼視網(wǎng)膜動(dòng)態(tài)改變明暗細(xì)節(jié)。
在DX9C之前,HDR已經(jīng)得到了廣泛應(yīng)用,一般有FP16 HDR(半精度浮點(diǎn)型)和INT32 HDR(整數(shù)型),但效果都不如人意,F(xiàn)P16的動(dòng)態(tài)范圍不夠大,而IN32的效率很低,因此這些HDR格式并未帶來(lái)震撼效果。而FP32 HDR(32bit浮點(diǎn)格式)的誕生則大大拓展了明暗度擴(kuò)展空間,使得游戲的光影效果有了質(zhì)的提升,當(dāng)年的《細(xì)胞分裂》、《FarCry》、《3DMark06》等一系列游戲開(kāi)啟HDR后的畫(huà)面讓人驚訝不已!
★ 黑猩猩——GeForce 6800
在經(jīng)歷了GeForce FX系列慘痛的失敗后,NVIDIA痛定思痛,要挽回在高端產(chǎn)品上的失利局面,僅靠架構(gòu)已完全定型的NV3x系列作一定程度的增補(bǔ)顯然是很難實(shí)現(xiàn)的。NVIDIA將更大的希望押寶在了新一代產(chǎn)品之上,它吸取了上一代產(chǎn)品的教訓(xùn),重新設(shè)計(jì)的架構(gòu)和完整支持DX9C標(biāo)準(zhǔn),讓這款顯卡以全新的形象展現(xiàn)在用戶(hù)面前。甚至有分析家評(píng)論GeForce 6800和GeForce FX簡(jiǎn)直不是一家公司設(shè)計(jì)的產(chǎn)品,其架構(gòu)變化之大可見(jiàn)一斑!
NV3X最大的弊端就是像素渲染單元效能低下,而NV40最強(qiáng)大之處就在像素單元架構(gòu)部分。NV40擁有多達(dá)16條像素渲染管線暫且不談,其每一個(gè)PSU的結(jié)構(gòu)都值得探討,NVIDIA將其稱(chēng)為Superscalar(超標(biāo)量)的設(shè)計(jì)。普通的像素渲染管線只提供一組著色器單元,每個(gè)周期最多只能執(zhí)行四組運(yùn)算,而NV40的超標(biāo)量架構(gòu)則內(nèi)含第二組著色器單元,讓每個(gè)周期的運(yùn)算量增加一倍。
NV40的像素渲染管線結(jié)構(gòu)
正因?yàn)槿绱?,?duì)手ATI的X800系列雖然在硬件規(guī)格上與NV40完全相同,但在DX9b游戲中的性能差距依然不小,這就是超標(biāo)量架構(gòu)的優(yōu)勢(shì)。當(dāng)然固步自封的ATI在X800時(shí)代依然僅支持DX9b,無(wú)法開(kāi)啟HDR,喪失了很多賣(mài)點(diǎn),讓用戶(hù)大失所望。
6800的成功讓NVIDIA風(fēng)光無(wú)限,整個(gè)GeForce 6家族在各個(gè)價(jià)位都力壓對(duì)手的X800家族,而且完美的架構(gòu)使得NVIDIA可以輕易的擴(kuò)充規(guī)模,發(fā)布了擁有多達(dá)24條像素渲染管線的第二代DX9C顯卡——GeForce 7800系列(其架構(gòu)基本沒(méi)變,只做了些許優(yōu)化,這里就不多做介紹了)。
★ 支持HDR+AA的DX9C顯卡——X1800/X1900
X800的對(duì)手是6800系列,但它既沒(méi)有性能優(yōu)勢(shì),也不支持DX9C/HDR,這使得ATI經(jīng)歷了9700/9800系列短暫的輝煌之后再次陷入被動(dòng)局面。于是,ATI開(kāi)始研發(fā)下一代GPU,改良架構(gòu),準(zhǔn)備重奪王位。但事與愿違,R520核心的X1800XT雖然使用了全新的架構(gòu),完美支持DX9C,但依然沒(méi)能擊敗已經(jīng)發(fā)布半年之久的7800GTX,因?yàn)閄1800XT依然只有16條像素渲染管線,而7800GTX擁有多達(dá)24條,差距如此之大,根本無(wú)法用新架構(gòu)的效率及高頻率來(lái)彌補(bǔ)。
R520與R580的架構(gòu)幾乎完全相同,不同的只有像素單元數(shù)量
當(dāng)時(shí)誰(shuí)都沒(méi)有料到ATI還預(yù)留了一手,原來(lái)R520這種架構(gòu)的實(shí)力遠(yuǎn)不止16條像素渲染管線這么簡(jiǎn)單,ATI完全顛覆了傳統(tǒng)“管線”的概念,R580核心緊隨其后,將像素渲染單元提升只48個(gè)之多,整整是R520的3倍!而頂點(diǎn)渲染單元和紋理單元以及GPU其它所有模塊都沒(méi)有做任何改動(dòng)。
從R520到R580的這種改變當(dāng)時(shí)令所有人都很費(fèi)解,因?yàn)榘℅70和R420在內(nèi)的以往所有GPU都是管線式架構(gòu),就是像素渲染單元內(nèi)部包含了紋理單元,一般像素和紋理的比例是1:2或者1:1。而R520首次將像素單元和紋理單元拆分開(kāi)來(lái),成為獨(dú)立的設(shè)計(jì),所有的像素單元都可以互相共享所有紋理單元資源,R520的像素和紋理比例依然是1:1,而R580的比例則瞬間提升至3:1,相信資歷較老的玩家一定記得ATI當(dāng)年大肆鼓吹“三比一架構(gòu)”。
這樣設(shè)計(jì)是因?yàn)锳TI發(fā)現(xiàn)了游戲的發(fā)展趨勢(shì),像素渲染的比重越來(lái)越高,而紋理貼圖的增長(zhǎng)比較緩慢,相信大家還記得當(dāng)年ATI的DX7顯卡,其一條管線中包括了3個(gè)紋理單元,以前是1:3后來(lái)是1:2接著變成1:1,現(xiàn)在被ATI一舉提升至3:1。雖然當(dāng)時(shí)很多人都不好理解,但從現(xiàn)在的發(fā)展來(lái)看,像素與紋理的比例越拉越大,DX10時(shí)代大概是3:1,DX11時(shí)代則變成了5:1甚至更高!
除了具有前瞻性的3:1架構(gòu)外,X1000架構(gòu)還有另一大絕招就是HDR+AA技術(shù)。大家知道6800系列連續(xù)兩年都是市面上唯一的DX9C顯卡,當(dāng)時(shí)所有的DX9C游戲都是基于NVIDIA的架構(gòu)而開(kāi)發(fā),當(dāng)使用N卡開(kāi)啟HDR特效時(shí)(準(zhǔn)確的說(shuō)是FP32格式),會(huì)占據(jù)原本屬于MSAA的緩沖區(qū),導(dǎo)致HDR和AA無(wú)法共存。HDR是DX9C的代表技術(shù),能大大提升畫(huà)面效果,而AA消除鋸齒也能大幅改善畫(huà)質(zhì),這兩項(xiàng)關(guān)鍵特效無(wú)法同時(shí)開(kāi)啟讓玩家們很郁悶。
ATI的DX9C產(chǎn)品比NV晚了一代,ATI意識(shí)到了DX9C的這一缺陷之后,在其架構(gòu)設(shè)計(jì)之初就考慮到了HDR和AA共存的問(wèn)題,因此特別設(shè)計(jì)了專(zhuān)用的緩沖區(qū),可以通過(guò)游戲或者驅(qū)動(dòng)重新指定MSAA的緩存位置,從而同時(shí)開(kāi)啟HDR+AA。遺憾的是修改游戲或驅(qū)動(dòng)兼容性并不好,支持的游戲也不多,雖然這確實(shí)是一個(gè)很大的賣(mài)點(diǎn),ATI銳意進(jìn)取的精神也值得尊重,但最終效果還是不如人意。
另外,X1000也改進(jìn)了像素著色單元的內(nèi)部結(jié)構(gòu),每個(gè)像素單元都擁有兩個(gè)算術(shù)邏輯單元和一個(gè)分支執(zhí)行單元,其中ALU1只能執(zhí)行加法(ADD)計(jì)算,ALU2能執(zhí)行包括加法、乘法(MUL)、乘加(MADD)各類(lèi)運(yùn)算,兩個(gè)ALU最高可以執(zhí)行兩條指令(3D+1D)。為了控制如此龐大的像素單元,ATI還針對(duì)SM3.0的特性改進(jìn)了動(dòng)態(tài)流控制功能,大大改進(jìn)了SIMD架構(gòu)的動(dòng)態(tài)分支性能,讓像素著色效能得到提升。
功夫不負(fù)有心人,全新架構(gòu)并且擁有多達(dá)48像素單元的X1900XTX,性能比X1800XT獲得了大幅提升,完勝對(duì)手的7900GTX,而且越新的游戲優(yōu)勢(shì)越明顯。強(qiáng)大的X1900XTX迫使NVIDIA推出雙G71核心的7950GX2來(lái)對(duì)抗,雖然7950GX2單卡超越了X1950XTX,但雙卡的話則因效率問(wèn)題依然是A卡占優(yōu)。
★ 小結(jié):DX9C時(shí)代雙方架構(gòu)各有所長(zhǎng)
DX9C是一代經(jīng)典API,至今依然有很多游戲無(wú)視DX10/DX11,堅(jiān)守DX9C平臺(tái),以至于HDR+AA的問(wèn)題被遺留至今依然沒(méi)能得到完美解決。NV40是因?yàn)榘l(fā)布較早沒(méi)能解決這一難題,G70則是擴(kuò)充像素和頂點(diǎn)的產(chǎn)物,也沒(méi)能解決。
ATI在X800時(shí)代未能搶得先機(jī),因此在X1000架構(gòu)當(dāng)中花了很多心思,爭(zhēng)取做最完美的DX9C顯卡,他們確實(shí)做到了這一點(diǎn),無(wú)論架構(gòu)和性能都有優(yōu)勢(shì)。但由于晶體管規(guī)模太大,功耗表現(xiàn)不如人意,因此在市場(chǎng)方面X1000與GF7相比并無(wú)優(yōu)勢(shì)。
高效快捷的利用硬件實(shí)現(xiàn)才是更加現(xiàn)實(shí)的任務(wù)。在敏銳的感覺(jué)到這一點(diǎn)之后,微軟將下一代DX API的核心任務(wù)定位為進(jìn)一步解放編程。
在DirectX 10中,通過(guò)常量緩沖器、紋理陣列、動(dòng)態(tài)shader執(zhí)行分支等特性,將Instancing技術(shù)從這些局限中解放了出來(lái)。模型的實(shí)例沒(méi)必要使用同一張紋理貼圖;它們可以通過(guò)自己本身的紋理來(lái)從紋理陣列中取出各自的紋理;它們甚至可以有不同的特效——程序員可以寫(xiě)一個(gè)包含很多特效的“超級(jí)”shader,然后為每個(gè)模型實(shí)例運(yùn)用這個(gè)shader程序的不同執(zhí)行分支部分,從而給不同的模型賦以不同的材質(zhì)特效。甚至連為每個(gè)模型實(shí)例使用骨骼蒙皮動(dòng)畫(huà)這種需要大量變換矩陣操作的問(wèn)題,在16×4096常量寄存器的強(qiáng)大攻勢(shì)下都可以迎刃而解。
“克隆人”的時(shí)代已經(jīng)結(jié)束了^_^ 通過(guò)DirectX 10的高級(jí)特性,Instancing將允許每個(gè)模型實(shí)例擁有它的個(gè)性:紋理貼圖,pixel和vertex shader,以及動(dòng)作動(dòng)畫(huà)。每個(gè)實(shí)例都將會(huì)有它自己的生命。
Microsoft發(fā)布的DirectX 10代表了自從可編程Shader出現(xiàn)以來(lái)在3D API方面的最巨大的進(jìn)步。通過(guò)一番脫胎換骨般的重建,DirectX 10展現(xiàn)出一系列非常醒目的新特性,包括高度優(yōu)化的運(yùn)行時(shí),強(qiáng)大的Geometry Shader,紋理數(shù)組等等;這些特性將引領(lǐng)PC實(shí)時(shí)三維圖形進(jìn)入一個(gè)全新的世界。但是如此眾多的改變對(duì)圖形硬件廠商提出了前所未有的挑戰(zhàn),同時(shí)對(duì)游戲廠商亦是如此。
之前適合處理DX9C游戲的GPU架構(gòu)已經(jīng)無(wú)法滿(mǎn)足的要求了,NVIDIA和ATI在這個(gè)時(shí)候沒(méi)有任何的規(guī)則可以依靠,也沒(méi)有成功的先例可以借鑒,完全是摸石頭過(guò)河。就在這樣的背景下,誕生了第一代統(tǒng)一架構(gòu),NVIDA的G80和ATI的R600。
另一方面,DirectX 10為游戲開(kāi)發(fā)者提供了很多新的特性,采用這些特性可以用來(lái)開(kāi)發(fā)大量的次世代圖形效果。一些游戲廠商開(kāi)始積極參與其中,CE2這樣優(yōu)秀的引擎脫穎而出,但由于這是基于強(qiáng)大、靈活的可編程特性基礎(chǔ)上的,開(kāi)發(fā)難度也是可想而知。實(shí)際上,更多的廠商決定保守的在原有引擎基礎(chǔ)上穩(wěn)扎穩(wěn)打,慢慢升級(jí),代表UE3。
最后的結(jié)果想必大家已然明了,雖然G80相比上一代有了質(zhì)的的提升,但是在發(fā)布初期,根本無(wú)法滿(mǎn)足Crysis這樣大量采用DX10技術(shù)的先進(jìn)游戲。而相對(duì)于NVIDIA,ATI的R600更是一敗涂地,連之前的DX9C游戲效率都乏善可稱(chēng)。
以往的DirectX游戲無(wú)論多么優(yōu)秀,始終都會(huì)有OpenGL引擎和游戲站出來(lái)發(fā)起挑戰(zhàn),而且其畫(huà)面還相當(dāng)不錯(cuò)。但DX9C之后,就只有ID Software還在負(fù)隅頑抗了,到了DX10時(shí)代,再也沒(méi)有任何一款OpenGL能與DX游戲相抗衡,微軟終于一統(tǒng)江湖!
★ 類(lèi)人猿——GeForce 8800
無(wú)論從哪個(gè)方面來(lái)看,GeForce 8800與DX9時(shí)代的Radeon 9700都非常相似,微軟的新一代API尚未正式發(fā)布,而新顯卡居然開(kāi)賣(mài)了大半年,雖然沒(méi)有新游戲的支持,但在老游戲下的性能依然非常完美。因此每一代成功的顯卡最關(guān)鍵的還不是API,還是核心架構(gòu)。DX10是API的又一次革命,而G80則是GPU架構(gòu)的一次偉大革命:
如果說(shuō)R580像素與紋理3:1的比例讓人很費(fèi)解的話,那么G80的流處理器設(shè)計(jì)則讓用戶(hù)們一頭霧水:從G71的24條像素管線一下變成了128個(gè)流處理器,哪來(lái)的這么多?
傳統(tǒng)的GPU Shader架構(gòu)
傳統(tǒng)的Shader不管是像素還是頂點(diǎn),其實(shí)都是SIMD(單指令多數(shù)據(jù)流)結(jié)構(gòu),就是個(gè)4D矢量處理器,可以一次性的改變像素的RGBA數(shù)據(jù)或者頂點(diǎn)的XYZW數(shù)據(jù)。而G80的流處理器則是1D標(biāo)量處理器,它一次只能計(jì)算像素和頂點(diǎn)4個(gè)數(shù)據(jù)中的1個(gè),如此說(shuō)來(lái)效率豈不是很低?
當(dāng)然不是,因?yàn)殡S著游戲的發(fā)展,GPU所要處理的指令已經(jīng)不是4D這種常規(guī)數(shù)據(jù)流了,進(jìn)入DX10時(shí)代后Z緩沖區(qū)(1D)或紋理存?。?D)等非4D指令所占比重越來(lái)越多,此時(shí)傳統(tǒng)的Shader單元在執(zhí)行此類(lèi)指令時(shí)的效率會(huì)降至1/2甚至1/4,即便有Co-issue技術(shù)的支持效率改進(jìn)也十分有限。
G80的SP
而G80 1D標(biāo)量流處理器執(zhí)行各種類(lèi)型指令時(shí)的效率都能達(dá)到100%,這也就是NVIDIA對(duì)于GPU架構(gòu)大換血的主要目的。G80的這種架構(gòu)被稱(chēng)為MIMD(多指令多數(shù)據(jù)流),其特色就是執(zhí)行效率非常高,但也不是沒(méi)有缺點(diǎn),理論運(yùn)算能力偏低、晶體管消耗較大,當(dāng)然由于對(duì)手產(chǎn)品實(shí)力不行,這些缺點(diǎn)在很長(zhǎng)一段時(shí)間內(nèi)都沒(méi)有被發(fā)現(xiàn)。
而且NVIDIA的1D標(biāo)量流處理器還可以異步工作在超高頻率之下,一般是GPU核心頻率的兩倍,由此大幅提升了渲染能力。這一技術(shù)ATI至今都未能實(shí)現(xiàn)。
★ ATI的DX10圖形架構(gòu)——R600
與革命性的G80架構(gòu)不同,R600身上有很多傳統(tǒng)GPU的影子,其Stream Processing Units很像上代的Shader Units,它依然是傳統(tǒng)的SIMD架構(gòu)。
R600擁有4個(gè)SIMD陣列,每個(gè)SIMD陣列包括了16個(gè)Stream Processing Units,這樣總共就是64個(gè),但不能簡(jiǎn)單地認(rèn)為它擁有64個(gè)流處理器,因?yàn)镽600的每個(gè)Units內(nèi)部包含了5個(gè)ALU:
我們來(lái)仔細(xì)看看R600的流處理器架構(gòu):Branch Execution Unit(分歧執(zhí)行單元)就是指令發(fā)射和控制器,它獲得指令包后將會(huì)安排至它管轄下5個(gè)ALU,進(jìn)行流控制和條件運(yùn)算。General Purpose Registers(通用寄存器)存儲(chǔ)輸入數(shù)據(jù)、臨時(shí)數(shù)值和輸出數(shù)據(jù),并不存放指令。
由于內(nèi)部的5個(gè)1D ALU共享同一個(gè)指令發(fā)射端口,因此宏觀上R600應(yīng)該算是SIMD(單指令多數(shù)據(jù)流)的5D矢量架構(gòu)。但是R600內(nèi)部的這5個(gè)ALU與傳統(tǒng)GPU的ALU有所不同,它們是各自獨(dú)立能夠處理任意組合的1D/2D/3D/4D/5D指令,完美支持Co-issue(矢量指令和標(biāo)量指令并行執(zhí)行),因此微觀上可以將其稱(chēng)為5D Superscalar超標(biāo)量架構(gòu)。
通過(guò)上圖就可以清楚的看到,單指令多數(shù)據(jù)流的超標(biāo)量架構(gòu)可以執(zhí)行任意組合形式的混合指令,在一個(gè)Stream Processing Units內(nèi)部的5個(gè)ALU可以在單時(shí)鐘周期內(nèi)進(jìn)行5次MAD(Multiply-Add,乘加)運(yùn)算,其中比較“胖”的ALU除了MAD之外還能執(zhí)行一些函數(shù)(SIN、COS、LOG、EXP等)運(yùn)算,在特殊條件下提高運(yùn)算效率!
現(xiàn)在我們就知道R600確實(shí)擁有64x5=320個(gè)流處理器。R600的流處理器之所以能比G80多好幾倍就是得益于SIMD架構(gòu),可以用較少的晶體管堆積出龐大規(guī)模的流處理器。但是在指令執(zhí)行效率方面,SIMD架構(gòu)非常依賴(lài)于將離散指令重新打包組合的算法和效率,正所謂有得必有失。
★ 總結(jié):DX10架構(gòu)G80笑到了最后
通過(guò)前面的分析我們可以初步得出這樣的結(jié)論:G80的MIMD標(biāo)量架構(gòu)需要占用額外的晶體管數(shù),在流處理器數(shù)量和理論運(yùn)算能力方面比較吃虧,但卻能保證超高的執(zhí)行效率;而R600的SIMD超標(biāo)量架構(gòu)可以用較少的晶體管數(shù)獲得很多的流處理器數(shù)量和理論運(yùn)算能力,但執(zhí)行效率方面卻不如人意。
G80的架構(gòu)顯然要比R600改進(jìn)更為徹底,所以打從一開(kāi)始G80/G92就遙遙領(lǐng)先與R600/RV670,其后續(xù)產(chǎn)品GT200一如既往的保持領(lǐng)先優(yōu)勢(shì),但幅度沒(méi)有G80那么大了,因?yàn)镽600的架構(gòu)的特性就是通過(guò)數(shù)量彌補(bǔ)效率的不足。
DX9C和DX10聽(tīng)起來(lái)非常完美,但也有明顯的缺點(diǎn),就是系統(tǒng)資源開(kāi)銷(xiāo)很大,運(yùn)算效率比較低,所以DX11的重點(diǎn)就落在了改進(jìn)渲染效能方面。DX11除了將ShaderModel從4.0升級(jí)至5.0外,還有兩項(xiàng)最重要的改進(jìn)就是Tessellation和DirectCompute,其中DirectCompute的指令集主要來(lái)源于ShaderModel 5.0。
當(dāng)然還有多線程渲染、增強(qiáng)的紋理壓縮格式等其它若干改進(jìn),在我們之前的HD5800和GTX480評(píng)測(cè)中已經(jīng)做過(guò)詳細(xì)介紹了,因此就不再贅敘。
Tessellation被譯為鑲嵌,就是一種能讓GPU在模型內(nèi)部自動(dòng)插入新的頂點(diǎn),從而讓幾何圖形變得無(wú)比復(fù)雜細(xì)膩的技術(shù),它可以在很少的性能損失下?lián)Q取明顯的畫(huà)質(zhì)提升。DX11游戲在畫(huà)面上的改進(jìn)主要來(lái)自于曲面細(xì)分技術(shù),而且曲面細(xì)分還能帶來(lái)很多意想不到的特效!
為了配合Tessellation技術(shù),微軟還專(zhuān)門(mén)設(shè)計(jì)了兩種全新的Shader著色器,Hull和Domain,以便更精確的控制鑲嵌位置,并置換位移貼圖。這就與DX9/DX10時(shí)代的Tessellation有著本質(zhì)區(qū)別,無(wú)法照抄照搬。
DirectCompute則是微軟的GPU計(jì)算API,可以讓GPU處理一些非圖形類(lèi)指令,獲得遠(yuǎn)超CPU的性能。
不過(guò)目前DirectCompute主要還是用在圖形渲染后處理器方面,可以產(chǎn)生非常逼真的景深、透明效果。限于篇幅我們不再贅述DX11的技術(shù)細(xì)節(jié),在《決戰(zhàn)性能之巔!NV雙芯旗艦GTX590評(píng)測(cè)》一文中有詳細(xì)論述,有興趣的朋友不妨參閱。
★ 類(lèi)猿人——HD5800
在經(jīng)歷了DX10時(shí)代R600的失利之后,ATI對(duì)于微軟新一代API十分重視,第一時(shí)間對(duì)于DX10.1提供了支持,可惜DX10.1相對(duì)于DX10改進(jìn)有限,并不像DX9C那樣帶來(lái)震撼的HDR技術(shù),因此未能得到足夠的重視。但ATI積極向上的精神讓它在DX11時(shí)代搶得先機(jī)。
但令人奇怪的是,ATI并沒(méi)有因?yàn)镈X11而改變架構(gòu),而是幾乎原封未動(dòng)的照搬了上代RV770核心,除了顯存位寬維持256bit不變之外,Cypress的其它所有規(guī)格都正好是RV770的兩倍,而且在流處理器部分可以看作是雙核心的設(shè)計(jì),幾乎就是并排放置了兩顆RV770核心。
在流處理器部分,RV870相對(duì)于RV770改進(jìn)有限,只是加入了DX11新增的位操作類(lèi)指令,并優(yōu)化了Sum of Absolute Differences(SAD,誤差絕對(duì)值求和)算法?;旧?,除了新增DX11支持和擴(kuò)充規(guī)模外,Cypress與RV770在架構(gòu)方面沒(méi)有本質(zhì)區(qū)別。
HD5000系列的主要優(yōu)勢(shì)就是功耗控制比較出色,另外功能方面Eyefinity多屏顯示以及次世代音頻源碼輸出都很有特色,架構(gòu)方面確實(shí)沒(méi)有多少亮點(diǎn)。
★ 完全針對(duì)DX11而設(shè)計(jì)的顯卡——GTX480、580
HD5800這一領(lǐng)先,又是半年,這次NVIDIA的陣腳并沒(méi)有像NV30那樣被打亂,而是按部就班的按照既定的設(shè)計(jì)目標(biāo)推出全新架構(gòu)的一代產(chǎn)品,而不是像ATI那樣在上代產(chǎn)品基礎(chǔ)上改改就發(fā)布新品,因?yàn)镈X11是全新的API,必須為DX11新的特性做相應(yīng)的優(yōu)化,才能獲得最出色的DX11效能。
GF100核心是既G80和R600之后,近4年來(lái)GPU架構(gòu)改進(jìn)最大的一次,主要體現(xiàn)在以下四個(gè)方面:
1. GPU核心處理部分被劃分為4個(gè)區(qū)塊(GPC),每個(gè)區(qū)塊內(nèi)部囊括了所有主要的圖形處理單元。它代表了頂點(diǎn)、幾何、光柵、紋理以及像素處理資源的均衡集合。除了ROP功能以外,GPC可以被看作是一個(gè)自給自足的GPU,所以說(shuō)GF100就是一顆四核心的GPU。
2. 每個(gè)GPC都擁有一個(gè)獨(dú)立的Raster Engine(光柵化引擎),負(fù)責(zé)邊緣設(shè)置、光柵器消隱以及Z軸壓縮功能??纱蠓嵘鼼PU在高分辨率下的性能。
3. 每組SM都擁有一個(gè)獨(dú)立的PolyMorph Engine(多形體引擎),負(fù)責(zé)GPU的幾何圖形轉(zhuǎn)換以及Tessellation曲面細(xì)分功能,徹底消除GPU的幾何性能不足的瓶頸,從而大幅提升DX11性能。
4. GPU的一二級(jí)緩存都經(jīng)過(guò)了重新設(shè)計(jì),架構(gòu)上更類(lèi)似于Intel的多核CPU,改進(jìn)流處理器和紋理單元的性能,進(jìn)一步提升MIMD架構(gòu)的效能。
和上代的GT200相比,GF100的所有模塊幾乎都經(jīng)過(guò)了重新的設(shè)計(jì),就連CUDA核心(流處理器)內(nèi)部的ALU運(yùn)算單元都針對(duì)新的浮點(diǎn)運(yùn)算格式以及函數(shù)做了改進(jìn)與優(yōu)化,而不僅僅是兼容SM5.0指令集而已。相反ATI的Cypress核心與上代的RV770相比幾乎所有模塊都未做任何改進(jìn)。
★ 小結(jié):DX10架構(gòu)無(wú)法滿(mǎn)足DX11的需要
通過(guò)以上分析可以看出,由于HD5800的架構(gòu)與HD4800完全相同,只是流處理器規(guī)模翻倍而已,因此它確實(shí)擁有出色的DX10/10.1性能,但DX11的性能卻很一般。因?yàn)镈X11是一款全新的API,并不是針對(duì)DX10的小修小補(bǔ),很多特性不是兼容SM5.0指令集就能做得到的。
ATI雖然通過(guò)搶先發(fā)布DX11顯卡賺得了滿(mǎn)堂彩,但卻沒(méi)能經(jīng)得住時(shí)間的考驗(yàn),未能重現(xiàn)DX9時(shí)代R300的輝煌。因?yàn)闀r(shí)代變了,當(dāng)年的R300是全新的架構(gòu),完美支持DX9,而NV30架構(gòu)存在很多缺陷。而現(xiàn)在正好相反,Cypress完全是新瓶裝舊酒,而GF100則是真正的DX11架構(gòu),這在所有DX11測(cè)試中都得到了證實(shí)。
● 回顧GPU和DirectX發(fā)展史,有規(guī)律可循
回顧DirectX的發(fā)展史,就會(huì)發(fā)現(xiàn)雖然微軟一直在左右著兩大顯示巨頭的發(fā)展,但這只是外因而不是內(nèi)因,真正決定勝敗的關(guān)鍵還是在GPU體系架構(gòu)方面,這才是雙方設(shè)計(jì)實(shí)力的體現(xiàn)。
縱觀NVIDIA和ATI近幾年的交鋒:DX7 NV占優(yōu),DX8前期ATI占優(yōu)后期NV反超,DX9 ATI優(yōu)勢(shì)明顯,DX9C前期NV大獲全勝后期被反超,DX10 NV一路遙遙領(lǐng)先,DX11 ATI搶得先機(jī)但又被NV反超——似乎毫無(wú)規(guī)律可循,實(shí)則不然,且聽(tīng)筆者慢慢道來(lái):
★ DirectX重大版本更新,GPU必采用全新架構(gòu)
從DX7、DX8、DX9、DX9C、DX10,每逢DirectX有重大版本更新時(shí)(主要是ShaderModel指令集),GPU架構(gòu)都會(huì)做大幅度的調(diào)整,甚至是拋棄老架構(gòu)重新設(shè)計(jì)一套新的架構(gòu),NVIDIA和ATI雙方無(wú)一例外!而且新的架構(gòu)總是能夠取得勝利,因?yàn)槿碌募軜?gòu)完全針對(duì)新的API設(shè)計(jì),能夠徹底發(fā)揮出新技術(shù)和特性的優(yōu)勢(shì),確保發(fā)揮出預(yù)期的效果。
比如DX7 DX8時(shí)代,雙方都是全新的架構(gòu),產(chǎn)品的性能其實(shí)相差不多,DX8的Radeon 8500甚至超越了GeForce 3,GeForce 4的優(yōu)勢(shì)是建立在ATI已經(jīng)放棄DX8提前進(jìn)入DX9時(shí)代的基礎(chǔ)上;DX9時(shí)代全新架構(gòu)的R300大獲全勝,NV30的混合架構(gòu)效率極差一敗涂地;DX9C時(shí)代NV40重返王座,其后續(xù)產(chǎn)品G70/G71因?yàn)闆](méi)有更換架構(gòu),在ATI全新的R580面前失去了以往的輝煌;DX10時(shí)代G80/G92革命性的架構(gòu)一路遙遙領(lǐng)先,R600的架構(gòu)脫胎于R580,表現(xiàn)不甚理想,曾一度遭到懷疑,但隨著800SP RV770誕生后,其出色的表現(xiàn)證明了ATI當(dāng)初的設(shè)計(jì)思路其實(shí)并沒(méi)有錯(cuò),但始終沒(méi)有得到翻身的機(jī)會(huì)。
NVIDIA要讓GT200添加DX11支持是很容易的,但并沒(méi)有這么做
★ 間斷平衡論:
小進(jìn)化研究種以下的進(jìn)化改變,包括:①小進(jìn)化的因素和機(jī)制,研究遺傳突變、自然選擇、隨機(jī)現(xiàn)象(如遺傳漂變)等因素如何引起群體的遺傳組成的改變等。②種形成,研究新種的形成方式和過(guò)程,研究小進(jìn)化因素如何導(dǎo)致同種的群體之間的隔離的形成和發(fā)展,研究種內(nèi)分化和由亞種、半種到完全的種的發(fā)展過(guò)程等。
科學(xué)家認(rèn)為很多物種的形成是在幾萬(wàn)年的段時(shí)間內(nèi)形成的
大進(jìn)化研究種以上的分類(lèi)單元在地質(zhì)時(shí)間尺度上的進(jìn)化改變,其對(duì)象主要是化石,最小研究單位是種。主要研究?jī)?nèi)容包括:①種及種以上分類(lèi)單元的起源和大進(jìn)化的因素。②進(jìn)化型式,在時(shí)間向度上進(jìn)化的線系的變化和形態(tài)。③進(jìn)化速度,形態(tài)改變的速度和分類(lèi)單元的產(chǎn)生或絕滅速度,種的壽命等。④進(jìn)化的方向和趨勢(shì)。⑤絕滅的規(guī)律、原因及其與進(jìn)化趨勢(shì)、速度的關(guān)系等。 小進(jìn)化與大進(jìn)化在物種這一層次上相互銜接,事實(shí)上小進(jìn)化與大進(jìn)化都研究物種形成。
和生物的間斷平衡進(jìn)化類(lèi)似,如果DirectX版本停滯不前的話,GPU架構(gòu)更不會(huì)更換,比如DX9C時(shí)代的GF6和GF7,DX10時(shí)代的GF8/GF9/GT200和RV670/RV770。DirectX的半代更新,比如DX7.1、DX8.1、DX9.0b、DX10.1這些版本(DX9C不算,因?yàn)槠銼haderModel從2.0升至3.0),雙方都不會(huì)更改GPU架構(gòu),只是在上代產(chǎn)品基礎(chǔ)上小修小補(bǔ),通過(guò)擴(kuò)充指令集的方式兼容新API即可。尤其是DX10.1這個(gè)版本,由于改進(jìn)太少,雙方竟然將G80/R600這一套架構(gòu)用了5年之久!
以上結(jié)論看起來(lái)很有意思,但是唯獨(dú)DX11是個(gè)例外:ATI對(duì)RV770(還是R600架構(gòu))小修小補(bǔ)制造出了DX11顯卡,這樣的做法確實(shí)讓人感到意外,但也不難理解,ATI信奉“先行者勝”的理念,認(rèn)為只要搶先發(fā)布DX11顯卡就能取得成功。
現(xiàn)在看來(lái),ATI冒險(xiǎn)的選擇是明智的。這是由兩個(gè)原因造成的。我們可以理解為ATI舍棄了地利而順應(yīng)了天時(shí)、人和。
★ 顯卡行業(yè)的天時(shí):
搶先、縮短研發(fā)前導(dǎo)時(shí)間對(duì)于顯卡行業(yè),甚至整個(gè)半導(dǎo)體行業(yè)來(lái)說(shuō)都是勝利的鐵則。
★ 顯卡行業(yè)的地利:
能夠敏銳的跟上先進(jìn)的API無(wú)疑就是獲得了階段性的主場(chǎng)優(yōu)勢(shì)。
★ 顯卡行業(yè)的人和:
顯卡和游戲相伴相生,互為羈絆,得游戲者得天下。
天時(shí)不如地利地利不如人和,追尋顯卡發(fā)展的軌跡,三大條件就如同達(dá)摩克利斯劍,雖然不能看到它的存在,但卻從來(lái)沒(méi)有消失。而只要缺少一環(huán),后果不堪設(shè)想,3Dfx就是失去地利而死的經(jīng)典案例。
恐龍不滅絕而進(jìn)化的話,地球上出現(xiàn)的智慧生物可能如圖所示
ATI是個(gè)銳意進(jìn)取的公司,曾經(jīng)的紅色激進(jìn)美學(xué)深入人心,在DX11時(shí)代,他首先完美充當(dāng)了市場(chǎng)的快速反應(yīng)者,當(dāng)大家都對(duì)DX10顯卡糟糕的性能表現(xiàn)失望不已之時(shí),ATI以驚人的速度推出的HD5000系列DX11顯卡,雖然只是打了個(gè)補(bǔ)丁就匆匆上市,但依然斬獲了市場(chǎng)大量份額。到此本來(lái)應(yīng)該是一個(gè)良好的開(kāi)端,可是后來(lái)我們看到的卻是糟糕的結(jié)局。如果說(shuō)HD5000的商業(yè)搶先策略無(wú)可厚非的話,HD6000的拼湊升級(jí)就有些莫名其妙了,至于即將發(fā)布的HD7000還是延續(xù)原有架構(gòu)……
近年來(lái)我們?cè)贏TI身上看到的是在市場(chǎng)營(yíng)銷(xiāo)方面的銳意進(jìn)取和技術(shù)創(chuàng)新方面的裹足不前!
相比ATI,NVIDIA則走向了另一個(gè)極端,醉心于藍(lán)海的開(kāi)拓和迷信新技術(shù)讓他處處受挫,通過(guò)HD5000、6000系列核心和Fermi的對(duì)比我們不難看出,后者貌似富于前瞻的CUDA核心并不能在PC應(yīng)用中和競(jìng)爭(zhēng)對(duì)手拉開(kāi)距離,反而效率不盡人意,也許達(dá)到了貼近DirectX 11 API的目的,但是卻在決定性因素“人和”上沒(méi)能擴(kuò)大戰(zhàn)果。原因在《DX11誰(shuí)主沉???3DMark華麗背后的隱患》一文中已經(jīng)有了詳細(xì)的論述,這里簡(jiǎn)單總結(jié)就是:
家用機(jī)平臺(tái)的躑躅不前讓顯卡賴(lài)以生存的游戲行業(yè)畸形發(fā)展。面對(duì)大量涌現(xiàn)的新DX9.0C游戲大作,空有真DX11的N卡無(wú)用武之地。 但復(fù)雜核心架構(gòu)和相對(duì)落后的制造工藝造成了良品率的問(wèn)題卻讓成本控制雪上加霜。回過(guò)頭來(lái)看看現(xiàn)在兩大陣營(yíng)的糾結(jié)對(duì)峙,我們不難就理解了。事實(shí)上顯卡生存的環(huán)境正在朝多元化發(fā)展,游戲行業(yè)和API的不同步,工藝進(jìn)步的未知性導(dǎo)致了環(huán)境的復(fù)雜化?,F(xiàn)階段按照以前發(fā)展的思維千方百計(jì)貼近API,堆積晶體管并不一定能取得優(yōu)勢(shì),因?yàn)檫m者生存而不是強(qiáng)者生存。
適者生存,NVIDIA會(huì)是下一頭特異龍么?
但兩家偉大的公司接下來(lái)的表現(xiàn)讓我不禁懷疑當(dāng)局者迷,他們依然日復(fù)一日著低級(jí)而又乏味的口水戰(zhàn),N說(shuō)A胸?zé)o大志,滿(mǎn)足小修小補(bǔ)難成氣候。A說(shuō)N好高騖遠(yuǎn),眼高于頂走路必然摔跤……吃了虧不知道為何吃虧算是人生的悲劇,占了便宜不知道為啥占到便宜更是杯具中的杯具。ATI從HD5000以來(lái)不思進(jìn)取的策略恰好符合了市場(chǎng)和環(huán)境,但是如果不明就理繼續(xù)延續(xù)這種策略,則又走到了危機(jī)的邊緣。顯卡市場(chǎng)經(jīng)過(guò)十余年的高速發(fā)展,已經(jīng)逐漸完成藍(lán)海到紅海的轉(zhuǎn)變,用簡(jiǎn)單的產(chǎn)品定位來(lái)打擊對(duì)手、經(jīng)過(guò)簡(jiǎn)單修改甚至只是刷新Bios便虛標(biāo)代號(hào)上市。這種做法對(duì)于企業(yè)自身無(wú)異于飲鴆止渴,獲得了短期的市場(chǎng)效益,損失的卻是辛苦經(jīng)營(yíng)來(lái)之不易的企業(yè)形象,在這一點(diǎn)上代表高科技的芯片老大們是不是應(yīng)該向傳統(tǒng)行業(yè)的成功者們學(xué)習(xí)學(xué)習(xí)?
能否在競(jìng)爭(zhēng)白熱化的紅海中找到快速發(fā)展的藍(lán)海,關(guān)鍵在于決策者能否抓住行業(yè)發(fā)展的本質(zhì),同時(shí)理解藍(lán)海真正的含義。兵無(wú)常勢(shì),水無(wú)常形,人不可能踏入同一條河流,復(fù)制任何人成功的經(jīng)驗(yàn)顯然都難以克隆成功本身,那出路又在何方?
簡(jiǎn)單以產(chǎn)品科技領(lǐng)先作為藍(lán)海戰(zhàn)略的思維,家電數(shù)碼行業(yè)在上世紀(jì)末已經(jīng)走到了窮途末路,追隨API也好、優(yōu)化主流游戲也好做市場(chǎng)的快速反應(yīng)者也罷,顯卡芯片廠商做這些事情天經(jīng)地義,但千萬(wàn)不要把手段和目的混為一談,如果搞不清楚為什么要去追隨API,為什么要去優(yōu)化游戲的本質(zhì),必然在企業(yè)發(fā)展的道路上迷失方向……。缺乏競(jìng)爭(zhēng)的行業(yè)是僵化低效的行業(yè),而只盯著一個(gè)對(duì)手搞競(jìng)爭(zhēng)同樣會(huì)讓企業(yè)活力喪失殆盡。下一代游戲平臺(tái)已不再遙遠(yuǎn),強(qiáng)大的第三方勢(shì)力早已虎視眈眈,留給老朋友們的時(shí)間都不多了,任何危機(jī)從形成到爆發(fā)都是一個(gè)量變引發(fā)質(zhì)變的過(guò)程,而誰(shuí)會(huì)成為下一個(gè)出局者取決于誰(shuí)犯的錯(cuò)誤更加致命!■<
關(guān)注我們
