王者歸來性能翻番 GeForce6技術解析
● 超標量設計
超標量設計,這個技術名詞我們其實早就聽說過,不過都是在一些關于處理器的信息中看到的,而對于顯示芯片,采用超標量設計才是比較新的一種方式。
作為超標量設計,其實就是在一個時鐘周期內完成多個操作,從而實現(xiàn)性能的翻倍。為了更好的解釋問題,我們先來看看傳統(tǒng)的著色器。

沒有采用超標量設計
我們看到,在這樣的情況下,整個著色單元擁有一個像素著色單元,由于每個單元的處理能力是4個操作,所以每一個時鐘周期能夠完成4個操作。

采用超標量設計
我們再來看看采用了超標量設計的GeForce 6系列圖形芯片的著色器。它擁有了第2組著色器單元,每個周期能完成兩倍的像素操作,也就是8個操作。
憑借兩組著色器單元,GeForce 6系列圖形芯片的體系架構可以支持真正的并行雙路處理,也就是在不同的著色器單元上同時執(zhí)行兩條指令。
有些體系架構也會嘗試采用非超標量的單著色器架構來實現(xiàn)單周期雙指令執(zhí)行。然而這種體系架構和我們今天介紹的GeForce 6系列圖形芯片擁有的架構卻完全不同,因為它們在完成著色的方式上的區(qū)別是非常大的。

傳統(tǒng)的架構(左)對NVIDIA超標量架構(右)
對于單著色器架構,只有兩條指令在同一個著色器單元上執(zhí)行,并且兩條指令必須作用于同一像素或者全部字段的分量上。
而在GeForce 6系列圖形芯片的體系架構上,我們能在像素分量上實現(xiàn)更多的總算術計算的吞吐量。在每個周期里,雙著色器單元能在每個周期執(zhí)行4條指令,相當于每個像素能進行了8個操作。
● 全32位浮點處理
GeForce架構始終允許游戲開發(fā)人員可以為每個畫面或者場景選擇所需的精度級別。隨著GeForce 6系列圖形芯片正式支持32位精度,現(xiàn)在開發(fā)者的選擇更簡單了,因為使用全32位浮點精度的時候會造成性能降低的問題已經消除了。
開發(fā)人員依然能在優(yōu)先考慮內存空間利用率的時候使用16位模式,但是他們能夠在需要更加精細的畫質以及效果的時候采用32位精度。那樣就能夠做出效果更為出眾的圖像,而用戶也將體驗到更豐富、更絢麗的畫面,游戲開發(fā)人員也能夠以此讓自己的作品獲得更好的評價。<
關注我們


