GF9300秒殺E7400! 整合主板也玩CUDA
780G芯片組的推出可以說是整合芯片組的一次大革命,整合的顯示核心終于不再是性能低下的代表,而硬解高清視頻等功能的實(shí)現(xiàn)也滿足了大部分用戶對(duì)顯示核心的要求。板載顯存后也可以在中低畫質(zhì)下玩轉(zhuǎn)流行游戲。不過硬件發(fā)展速度非???,聽著使用獨(dú)立顯卡的用戶討論什么CUDA、并行計(jì)算,還用著整合主板的用戶不免有些不平衡,其實(shí)大可不必如此,因?yàn)?,整合主板也可以支持CUDA技術(shù)。

在看過很多介紹CUDA的文章后,很多用戶應(yīng)該都會(huì)有這個(gè)問題,整合芯片組是否支持這項(xiàng)技術(shù),如果支持其性能表現(xiàn)又如何?筆者這次就對(duì)整合主板的CUDA性能進(jìn)行了一次測試。測試之前,先來一起了解一下什么是CUDA技術(shù)。
最初的GPU只是在進(jìn)行3D渲染時(shí)才會(huì)起作用,大部分時(shí)間我們其實(shí)都浪費(fèi)了這部分性能資源。盡管很早就有人想到利用顯卡這強(qiáng)大的硬件規(guī)模實(shí)現(xiàn)其他方面的計(jì)算,但是一直沒有大規(guī)模的實(shí)現(xiàn)。而現(xiàn)在NVIDIA開發(fā)了CUDA編程環(huán)境,任何用戶都可以通過CUDA開發(fā)包,開發(fā)出利用顯卡來計(jì)算的程序。簡單的說,CUDA就是顯卡處理通用計(jì)算的一個(gè)接口,曾經(jīng)只能執(zhí)行圖形渲染的GPU終于可以處理其他方面的計(jì)算。并且,顯卡進(jìn)行通用計(jì)算還有一個(gè)最大的優(yōu)勢,那就是并行計(jì)算。我們先來看看什么是串行計(jì)算,什么又是并行計(jì)算:
串行計(jì)算是指在單個(gè)中央處理器單元上對(duì)數(shù)據(jù)進(jìn)行處理,并行計(jì)算是相對(duì)于串行計(jì)算來說的,其在時(shí)間和空間上都比串行計(jì)算效率更高,時(shí)間上的并行就是指流水線技術(shù),而空間上的并行則是指用多個(gè)處理器并發(fā)的執(zhí)行計(jì)算。

CPU就是串行計(jì)算的代表,當(dāng)然我們也看到其向并行計(jì)算發(fā)展的趨勢,比如目前的雙核、四核CPU。但是,CPU永遠(yuǎn)也無法跟上顯卡的發(fā)展速度,比如NVIDIA前一段時(shí)間發(fā)布的9800GTX Plus擁有128個(gè)流處理器,也就是相當(dāng)于128核同時(shí)并發(fā)性的計(jì)算,可以想象其計(jì)算能力有多強(qiáng)大。
當(dāng)然,并不是說CPU就完全沒用,今后的PC主要還是CPU與GPU搭配使用,CPU+GPU的計(jì)算就是我們所謂的異構(gòu)計(jì)算。
CUDA的應(yīng)用涉及到各行各業(yè)
實(shí)際上,NVIDIA PhysX也是NVIDIA CUDA的一次應(yīng)用,利用CUDA,NVIDIA將本來只能在CPU或者是專門的PPU上才能計(jì)算的物理加速移植到了GPU上來計(jì)算,讓計(jì)算性能有了大幅度的提升。很顯然,CUDA是GPU歷史上一次偉大的變革。
2007年6月20日,NVIDIA發(fā)布了專為科學(xué)計(jì)算而生的Tesla,用GPU展現(xiàn)了個(gè)人超級(jí)計(jì)算的新紀(jì)元,實(shí)際上這同樣是CUDA的功勞。NVIDIA將強(qiáng)大的GPU應(yīng)用于地球科學(xué)、分子生物學(xué)和醫(yī)學(xué)診斷領(lǐng)域的高性能計(jì)算為實(shí)現(xiàn)重大的發(fā)現(xiàn)提供了可能,這些發(fā)現(xiàn)可能會(huì)改變數(shù)十億人的生活。
Tesla只是NVIDIA的觸角伸出傳統(tǒng)GPU應(yīng)用領(lǐng)域的開始,NVIDIA的野心是要打造一個(gè)以GPU為中心的運(yùn)算平臺(tái)——CUDA!這是Compute Unified Device Architecture的簡稱,也是NVIDIA樹立的一個(gè)新的行業(yè)標(biāo)準(zhǔn)和未來趨勢。
實(shí)際上,早在兩年前發(fā)布G80系列顯卡時(shí),NVIDIA就已經(jīng)預(yù)告了CUDA的到來。CUDA是世界上第一個(gè)針對(duì)GPU的C語言開發(fā)環(huán)境,可以充分應(yīng)用GPU上眾多流處理單元強(qiáng)大的浮點(diǎn)運(yùn)算能力,解決復(fù)雜的科學(xué)運(yùn)算問題。該環(huán)境目前僅支持NVIDIA GeForce 8/9系列顯卡以及相應(yīng)的Quadro專業(yè)顯卡。根據(jù)NVIDIA的測試,GeForce 8800顯卡在CUDA架構(gòu)中的峰值運(yùn)算能力可達(dá)520GFlops,因此如果構(gòu)建SLI雙卡系統(tǒng),可以達(dá)到1TFlops,即每秒運(yùn)算1萬億次的強(qiáng)大運(yùn)算能力。
CUDA要承擔(dān)的任務(wù)是讓顯卡可以用于圖像計(jì)算以外的目的,它是一個(gè)完整的GPGPU解決方案,采用C語言作為編程語言來使用GPU強(qiáng)大的硬件資源。C語言目前是大學(xué)的必修課程,已經(jīng)國際上普及程度最高的計(jì)算機(jī)編程語言,所以CUDA大大降低了GPU應(yīng)用的門檻,大家都可以用C語言寫出在顯示芯片上執(zhí)行的程序,而不需要去學(xué)習(xí)特定的顯示芯片的指令或是特殊的結(jié)構(gòu)。
使用GPU而不使用CPU從事科學(xué)計(jì)算的原因除了GPU在性能表現(xiàn)上更有優(yōu)勢外,還不能忽略GPU相對(duì)CPU低廉的價(jià)格。和高端的CPU售價(jià)比起來,GPU簡直太便宜了,目前9600GT只要八百元,更高的8800GT也才一千元出頭,而一顆入門的四核CPU就要上千元。
目前GPU已經(jīng)是足夠強(qiáng)大的可編程處理器,非常適合大運(yùn)算量的科學(xué)應(yīng)用,諸如地質(zhì)勘探,生物學(xué),流體力學(xué),金融建模等等。通過CUDA技術(shù),所有開發(fā)人員都能夠使用標(biāo)準(zhǔn)的C語言,挖掘NVIDIA GPU中多個(gè)處理單元強(qiáng)大的并行計(jì)算能力。
說了這么多,好像CUDA只適合科學(xué)計(jì)算等領(lǐng)域,和普通用戶似乎沒什么太大關(guān)系。事實(shí)當(dāng)然不是這樣,CUDA在民用領(lǐng)域也已經(jīng)有了很廣泛的應(yīng)用。其中最受關(guān)注的就是視頻編碼應(yīng)用,由于GPU目前強(qiáng)大的運(yùn)算能力,比CPU性能提升最高可達(dá)18倍。
如今手持?jǐn)?shù)碼設(shè)備已經(jīng)非常普及,手機(jī)、PSP等普遍支持視頻播放,但是視頻卻需要從電腦上進(jìn)行重新編碼以便讓視頻的分辨率和碼率達(dá)到手機(jī)或移動(dòng)播放設(shè)備的要求。高端用戶也面臨類似的問題,許多高清視頻也需要經(jīng)過壓制成為DVDrip或則Rmvb以適合不同需要的人群。
傳統(tǒng)的視頻編碼軟件完全依賴CPU的計(jì)算能力,即便換上相當(dāng)不錯(cuò)的高端CPU,一部高清視頻重新編碼所需要的時(shí)間往往數(shù)倍于視頻本身的播放時(shí)間,這讓用戶苦不堪言?,F(xiàn)在基于CUDA開發(fā)出的GPU視頻編碼工具卻能將“壓片”效率提升接近20倍!

使用主頻1.6GHz的雙核CPU壓制一部兩小時(shí)長的高清視頻需要10小時(shí)22分,如果換用主頻高達(dá)3GHz四核CPU可以將時(shí)間縮短到5小時(shí)33分。而有了基于CUDA開發(fā)的GPU編碼程序,1.6GHz的雙核CPU配合9600GT顯卡只需要49分鐘即可完成編碼,搭配上高端的GTX280則僅需要35分鐘。

NVIDIA聯(lián)合Elemetal制作了名為BadaBOOM Media Converter的視頻轉(zhuǎn)換工具,可以將眾多的視頻格式轉(zhuǎn)換成直接能在PSP、iPhone等流行手持?jǐn)?shù)碼設(shè)備上播放的視頻格式。軟件基于CUDA開發(fā),最大限度的利用GPU加速。稍后我們的測試也會(huì)涉及到這款軟件。
而在Badaboom之后,免費(fèi)的Mediacoder也應(yīng)用了CUDA技術(shù),而且Mediacoder有著完全支持中文,支持文件格式豐富等Badaboom沒有的優(yōu)勢。在我們對(duì)獨(dú)立顯卡的CUDA測試中,這兩款軟件已經(jīng)是常客了。不過今天,它們的任務(wù)是驗(yàn)證芯片組集成顯示核心的CUDA性能。
|
硬件系統(tǒng)配置 | |
|
Intel E5300 (45nm 2.6GHz/2MB/LGA775) | |
|
昂達(dá) N7AS(MCP7A芯片組) | |
|
希捷 7200.7 80GB | |
|
三星 DDR2-800 1 | |
|
電源 |
ENERMAX ELT620AWT-ECO |
|
顯卡 |
集成(Geforce 9300) |
|
顯示器 |
AOC 177Si |
|
軟件系統(tǒng)配置 | |
|
Windows 7 RTM 7600 32BIT | |
集成GPU設(shè)置:由于CUDA要求至少256MB顯存,筆者在BIOS里設(shè)置共享顯存為最大的512MB,以減少可能出現(xiàn)的瓶頸。
測試軟件:視頻轉(zhuǎn)碼是目前CUDA在民用領(lǐng)域最為熱門的應(yīng)用,筆者這次也是基于此來測試整合芯片組的CUDA性能。所用的軟件為Badaboom和Mediacoder,兩者均是從網(wǎng)上下載的最新版本。
測試方法:Mediacoder支持CPU單獨(dú)轉(zhuǎn)碼和CPU+GPU聯(lián)合轉(zhuǎn)碼,而Badaboom則是純GPU轉(zhuǎn)碼。測試時(shí)用Mediacoder分別測試E7400軟解、E5300軟解和E5300+GF9300聯(lián)合轉(zhuǎn)碼的性能。Badaboom則只進(jìn)行了CPU占有率的測試。
測試視頻:兩段視頻,一部為MPEG格式,分辨率704 X 480,另一部為720P的MKV封閉視頻,分辨率1280 X 720。兩部視頻均轉(zhuǎn)換為iPod和iPhone支持的MP4 X.264編碼文件,分辨率為480 X 272,碼率1500Kbps。
主板采用了NVIDIA的MCP7A芯片組設(shè)計(jì),內(nèi)置GF9300顯示核心,支持LGA 775接口45nm雙核/四核處理器,支持800/1066/1333MHz前端總線,支持DX10特效并且支持NVIDIA的CUDA技術(shù)。
供電系統(tǒng)方面,主板CPU供電部分采用了4相供電設(shè)計(jì),搭配固態(tài)電容和全封閉式電感,能夠有效地保障處理器的穩(wěn)定供電。內(nèi)存插槽方面,主板提供了4條DDR2內(nèi)存插槽,支持雙通道DDR2 667/800內(nèi)存。最大支持8GB容量。
擴(kuò)展插槽方面,主板提供了1個(gè)PCI-E x16插槽,支持Hybrid Power和Hybrid SLI功能,還提供了1個(gè)PCI-E x1插槽和2個(gè)PCI插槽。硬盤接口方面,主板配備了6個(gè)SATA II接口和1個(gè)IDE接口。
背板接口的設(shè)計(jì),主板提供了齊全的顯示接口設(shè)計(jì),包括HDMI、VGA和DVI接口。同時(shí)主板還提供了光纖接口和同軸接口,用戶可以鏈接更豐富的多媒體設(shè)備。此外還提供了PS/2鼠標(biāo)鍵盤接口,4個(gè)USB接口和1個(gè)RJ45接口。
了解了這次測試的主角,PK正式開始!
現(xiàn)在諸如iPhone、iPod這類手持設(shè)備非常流行,在地鐵上也經(jīng)常能看到用此類設(shè)備看視頻的用戶,所以這次筆者也選擇將視頻轉(zhuǎn)換成流行的iPod格式。轉(zhuǎn)碼速度對(duì)比:下面就來看看三種測試方法下的速度對(duì)比。首先是視頻一的成績。依次是E7400軟解,E5300軟解,E5300+GF9300轉(zhuǎn)碼。
轉(zhuǎn)碼所用時(shí)間:139秒
轉(zhuǎn)碼所用時(shí)間:156秒
轉(zhuǎn)碼所用時(shí)間:90秒
可以看到,CUDA技術(shù)展現(xiàn)出強(qiáng)大的實(shí)力,本來單純以CPU能力轉(zhuǎn)換,E5300比E7400慢17秒,而在加入GF9300的幫助后,時(shí)間驟減到90秒,比E7400快了49秒,將近一分鐘。要知道這僅僅是一個(gè)長度不到5分鐘的視頻,對(duì)于那些經(jīng)常需要轉(zhuǎn)換長視頻的用戶來說,CUDA又能幫助節(jié)省多少時(shí)間?
再來看看720P轉(zhuǎn)iPhone視頻的表現(xiàn),這部分筆者只進(jìn)行了E7400軟解和E5300+GF9300轉(zhuǎn)換的對(duì)比。
E7400轉(zhuǎn)換時(shí)間:260秒
E5300+GF9300轉(zhuǎn)換時(shí)間:127秒
127秒對(duì)比260秒,GF9300的加入使得整個(gè)平臺(tái)提升了一倍性能,直接秒殺了E7400。CUDA技術(shù)讓GPU的強(qiáng)大性能可以利用在日常應(yīng)用中,讓資源不再閑置。
看來整合芯片組集成的顯示核心也可以支持CUDA技術(shù),并且有效地提高轉(zhuǎn)換速度。我們再來看看轉(zhuǎn)換視頻時(shí)CPU的占有率,這次測試加入Badaboom。
Mediacoder只使用CPU轉(zhuǎn)碼:CPU占有率基本為100%
Mediacoder使用CPU+GPU轉(zhuǎn)碼:CPU占有率在80%左右
Badaboom使用GPU轉(zhuǎn)碼:CPU占有率在10%以下
根據(jù)我們的測試,Badaboom在視頻轉(zhuǎn)換的速度上要比Mediacoder慢,這主要是因?yàn)閮烧咴谵D(zhuǎn)換時(shí)走的是不同路線。Badaboom幾乎是純利用GPU轉(zhuǎn)碼,CPU閑置,這么做的優(yōu)勢在于可以一邊轉(zhuǎn)換一邊做其它工作。而Mediacoder則會(huì)把能利用到的資源都利用上,CPU+GPU都處于很高的負(fù)載下,以達(dá)到最快的轉(zhuǎn)換速度。
盡管GF9300顯示核心的流處理器只有16個(gè),但這次測試表明,借助CUDA,即使是整合主板也能發(fā)揮出強(qiáng)大的威力。而使用NV整合主板的用戶也不用再羨慕那些拿著獨(dú)立顯卡的用戶,他們能玩的CUDA整合主板也能玩。隨著CUDA技術(shù)的成熟和支持軟件的增多,CUDA技術(shù)的應(yīng)用必定不會(huì)僅僅局限在視頻轉(zhuǎn)碼方面,像視頻解碼,視頻處理等以往需要高性能CPU才能運(yùn)行流暢的應(yīng)用也開始支持CUDA,帶來的好處就是我們不必再使用昂貴的CPU同時(shí)忍受著緩慢的速度,CUDA可以用更低的成本帶來更好的體驗(yàn)。

支持CUDA的軟件越來越豐富

這塊支持CUDA的集成主板報(bào)價(jià)只有599元
隨著支持CUDA軟件的增多,未來我們可以在各個(gè)領(lǐng)域享受到CUDA帶來的好處。而所有這些,并不需要你付出太多成本,以本次測試為例,400多元的E5300加一塊599元的主板就完全可以體驗(yàn)到這一先進(jìn)技術(shù),同時(shí)速度的提升也是非常明顯的。

可以想像在不遠(yuǎn)的將來,CPU和GPU可以更好地協(xié)同工作,各自在擅長的領(lǐng)域發(fā)揮最大效能。而據(jù)消息透露,NVIDIA還會(huì)繼續(xù)推出Intel和AMD平臺(tái)的芯片組,這也意味著用戶仍可以使用整合主板來體驗(yàn)這一先進(jìn)技術(shù)?!?
關(guān)注我們


