從CPU架構(gòu)和技術(shù)的演變看GPU未來發(fā)展
從以往的多處理器系統(tǒng)到現(xiàn)在的雙核、四核、六核,CPU只能依靠增加核心數(shù)量來提升性能。而GPU從一開始就是作為并行渲染的管線式架構(gòu),GPU性能的強弱主要就是看誰的管線、流處理器數(shù)量更多。
不過雙顯卡甚至多顯卡也成為提升電腦游戲性能的一種途徑,通過SLI和CrossFire技術(shù)能夠輕松讓3D性能倍增,于是雙核心的顯卡成為NVIDIA和AMD雙方角逐3D性能王者寶座的殺手锏,近年來的旗艦級顯卡幾乎都是雙核心設(shè)計的。
但與CPU單芯片整合多核心的設(shè)計不同,顯卡一般是單卡多GPU設(shè)計,很少有單一GPU多核心設(shè)計,因為GPU性能提升的瓶頸主要在于制造工藝,只要工藝跟得上,那么他們就有能力在GPU內(nèi)部植入盡可能多的流處理器。
★ 雙核心設(shè)計的Cypress核心:
不管GPU架構(gòu)改不改,流處理器數(shù)量總是要擴充的,準確的說是以級數(shù)規(guī)模增長,這樣才能大幅提升理論性能。在流處理器數(shù)量急劇膨脹之后,如何管理好如此龐大的規(guī)模、并與其它模塊協(xié)調(diào)工作成為新的難題。
RV870的雙核心模塊設(shè)計
ATI RV870包括流處理器在內(nèi)的所有核心規(guī)格都比RV770翻了一倍,ATI選擇了“雙核心”設(shè)計,幾乎是并排放置兩顆RV770核心,另外在裝配引擎內(nèi)部設(shè)計有兩個Rasterizer(光柵器)和Hierarchial-Z(多級Z緩沖模塊),以滿足雙倍核心規(guī)格的胃口。
★ 四核心設(shè)計的GF100核心:

GF100可以看作是四核心設(shè)計
如果說Cypress是雙核心設(shè)計的話,那么GF100的流處理器部分就是“四核心”設(shè)計,因為GF100擁有四個GPC(圖形處理器集群)模塊,每個GPC內(nèi)部包含一個獨立的Raster Engine(光柵化引擎),而在以往都是整顆GPU共享一個Raster Engine。
我們知道RV870的Rasterizer和Hierarchial-Z雙份的,而GF100則是四份的,雖然命名有所不同但功能是相同的。
GF100的每個GPC都可以看作是一個自給自足的GPU
GF100的四個GPC是完全相同的,每個GPC內(nèi)部囊括了所有主要的圖形處理單元。它代表了頂點、幾何、光柵、紋理以及像素處理資源的均衡集合。除了ROP功能以外,GPC可以被看作是一個自給自足的GPU,所以說GF100就是一顆四核心的GPU。
★ 為什么GPU也會設(shè)計成多核心?
GPU本身就是一顆并行處理器,每一個流處理器都是一個獨立的運算單元,ATI和NVIDIA雙方第一次將GPU設(shè)計成為多核心方案,并不是為了提升其運算能力和流處理器資源,而是為了更好的管理和控制龐大規(guī)模的流處理器,更充分的利用它們的處理能力,以便在不同的應(yīng)用環(huán)境下發(fā)揮出最強效能。
雖說流處理器數(shù)量決定著GPU的浮點運算能力,但GPU除了單純的數(shù)學運算外,還要處理諸多不同類型的任務(wù),將龐大的流處理器劃分為多個獨立的區(qū)塊,每個區(qū)塊都設(shè)計專用的控制引擎和特殊功能模塊,這將會有效的平衡各個功能模塊的資源利用率。
關(guān)注我們


