續(xù)寫“逢6必火”傳奇 GTX 1060首發(fā)評測
NVIDIA在經歷了四年基于28nm FinFET制造工藝制造GPU的漫長歷史以后,基于Pascal GP104的GeForce GTX 1080首次迎來了16nm FinFET制造工藝升級。更高精度的“光刻”工藝允許GPU在單位面積的芯片上集成更多數量的晶體管,在同樣的核心架構中,更加龐大的核心規(guī)模就意味著更強大的處理性能。所以16nm FinFET制造工藝能夠給NVIDIA新顯卡帶來的能效提升是可以預見的,但是一直在超越自己的NVIDIA并沒有被動享受制程進步的紅利,反而在新一代的顯卡中使用了更為先進的技術。這其中就包括GTX 1060使用的GP106核心。
GP106核心邏輯架構圖
GTX 1060的GP106核心內建2組GPC和6個顯存控制器,每個GPC包含5個SM,1個SM中集成了128個CUDA單元、8個紋理單元、256KB的二級緩存、96KB的共享儲存空間以及48KB的一級緩存。從規(guī)格上來看,GP106更像是GTX 1080所使用的GP104核心在除顯存控制器之外其它多數規(guī)格砍掉一半而成的。
SM流式多處理器能夠高度協調其中的CUDA核心以及其他功能元件的工作,這20個SM會參與到幾乎所有GPU執(zhí)行的所有命令中。GeForce GTX 1080擁有8個位寬為32bit的顯存控制器,每一個顯存控制器配有八個ROP單元和256 KB二級緩存。所以,完整GTX 1080的GP104核心共有2560個CUDA單元、256bit顯存位寬、64個ROP、160個TMU以及2MB二級緩存。
GP106的核心晶體管數量為44億,核心面積為200 mm2,略小于麥克斯韋家族GM206的227mm2,得益于16nm FinFET工藝的應用,每平方毫米的晶體管數量達到了22.9m,遠遠高于GM200。這也是GP106以及其它Pascal架構顯卡能耗比如此高效的主要原因之一。此外,CUDA數量1280個,ROPs數量48個,TMUs數量80個。
NVIDIA將GPU開發(fā)工作的重點放在了設計Pascal核心架構的每一個細節(jié)中。Pascal之所有能夠成為有史以來能效最高的GPU,原因不僅僅是16nm FinFET帶來的制造工藝精進,更得益于持續(xù)提高的核心效率。NVIDIA工程團隊的一大精力投入重點是GPU核心運行頻率,橡木桶定律那樣,GPU核心運行頻率是由數以百萬計的設計電路中速度最慢的那一路徑決定的,所以這一最慢路徑的優(yōu)化對于GPU核心運行頻率的提高是至關重要的。經過NVIDIA工程團隊在這一領域的不斷鉆研,Pascal架構GPU相比前代有著40% 的運行效率提升。單靠16nm FinFET的制造工藝,是不能夠帶來如此高比例的核心頻率提升的。
關注我們



