国产成人久久精品二区三区,巨大欧美黑人xxxxbbbb,av在线观看网站

泡泡網(wǎng)CPU頻道 PCPOP首頁(yè) / CPU / 評(píng)測(cè) / 正文

輕松讀懂移動(dòng)處理器 CPU微架構(gòu)全解析

2013年01月26日 07:50作者：陳寅初編輯：孫敏杰

泡泡網(wǎng)CPU頻道1月26日原文標(biāo)題為《輕松讀懂“應(yīng)用處理器”微架構(gòu) 2013 版》，對(duì)不起，你被標(biāo)題欺騙了，實(shí)際上對(duì)許多讀者來說要讀懂本文并不是那么輕松:p

隨著半導(dǎo)體工藝的日趨先進(jìn)，智能手機(jī)（Smartphone 或者 Superphone）、平板電腦（Tablet 或者 Pad）已經(jīng)成為許多網(wǎng)友最常使用、最多關(guān)注、更新最快的電子消費(fèi)產(chǎn)品，高度便攜性是這類產(chǎn)品的最關(guān)鍵成功原因。

所謂便攜性自然是指產(chǎn)品必須足夠輕便而且需要有足夠的續(xù)航能力，因此這就要求產(chǎn)品的原件必須足夠省電，只有這樣才能減少散熱和電池體積這兩個(gè)最占體積和重量的問題。

要達(dá)到這個(gè)目標(biāo)，肯定要做功能和性能上的妥協(xié)，至少相對(duì)個(gè)頭更大的筆記本電腦、臺(tái)式機(jī)而言，像降低吞吐率或者增加時(shí)延，從實(shí)測(cè)性能而言，目前智能手機(jī)或者平板電腦的 CPU、圖形處理器性能基本上相當(dāng)于 6 到 10 年前臺(tái)式電腦的水準(zhǔn)。

舉個(gè)簡(jiǎn)單的例子，在俄羅斯網(wǎng)站 ixbt 的討論區(qū)上，有這樣的一條帖子，一位名為 ssvb 的網(wǎng)友采用 origenboard.org 的一片 Samsung Exynos 4210 開發(fā)板（配有 Exynos 4210 處理器具備兩個(gè) ARM Cortex-A9 處理器內(nèi)核）跑出來的 High Performance Linpack （HPL）性能是 1.307 GFLOPS，同貼中還有 Intel Atom N450（Pineview 架構(gòu)，45nm，單核） 1.66GHz 的測(cè)試結(jié)果——0.944 GFLOPS 以及 Cortex-A15 1.7GHz 雙核 HPL 為 4.3 GFLOPS。

NVIDIA 官網(wǎng)上的一份 SC011 文件也表明 Tegra 2（ARM Cortex-A9 雙核 1GHz，理論雙精度浮點(diǎn)性能 2GFLOPS）的 HPL 性能為 1.15GFLOPS（ 57% 效率，200MFLOPS/瓦）。

這都是一個(gè)什么概念？我曾經(jīng)在 06 年的時(shí)候用 Pentium D 820 2.8GHz 跑出來的 HPL 性能為 10.12 GFLOPS，Athlon64X2 2.6GHz 為 9.158 GFLOPS。

那么現(xiàn)在臺(tái)式機(jī)的 HPL 性能狀況如何？

在去年我用 Core i7 2600K 3.4GHz 配合未支持 AVX 指令的 GotoBLAS（數(shù)學(xué)庫(kù)）上得到的 HPL 性能為 51.18 GFLOPS 左右，后來又用支持 AVX 的 OpenBLAS（原 GotoBLAS 開發(fā)者停止更新后的其中一個(gè)后續(xù)開源社區(qū)版）得出的 HPL 性能為 99.38 GFLOPS，到 2013 年支持 AVX2 指令集的 Haswell 架構(gòu)出來后，這個(gè)測(cè)試結(jié)果應(yīng)該還能接近再翻番，達(dá)到 200 GFLOPS 級(jí)別。

也許你會(huì)說手機(jī)、平板要雙精度干啥呢？請(qǐng)不要忘記在 30 年前的 x86 處理器根本沒有集成任何硬件浮點(diǎn)單元，現(xiàn)在的情況又如何？曾經(jīng)做出號(hào)稱最強(qiáng) x87 協(xié)處理器的 Cyrix 后來一頭扎進(jìn)整數(shù)為王的產(chǎn)品策略后現(xiàn)在影都沒了。

“干啥”這個(gè)問題往往是硬件具備并達(dá)到一定性能條件后就會(huì)有答案的，臺(tái)式機(jī)上的性能測(cè)試軟件和方案會(huì)隨著手機(jī)、平板性能日益強(qiáng)大而變得在這類設(shè)備上運(yùn)行也理所應(yīng)當(dāng)，除了上面說的 HPL 外，各類 PC 上流行的測(cè)試工具例如 SPEC CPU20xx、3DMark 等也會(huì)是如此。

傳統(tǒng)的 CPU 性能測(cè)試的確不能完全適用于手機(jī)、平板的 SoC 芯片（人們把可以在移動(dòng)操作系統(tǒng)上跑應(yīng)用軟件的 SOC 稱作應(yīng)用處理器，簡(jiǎn)稱 AP），但是請(qǐng)注意我說這句話是因?yàn)?SoC 并不僅僅有 CPU，還有 GPU、音視頻編解碼器、存儲(chǔ)控制器、非易失性存儲(chǔ)單元、數(shù)模/模數(shù)轉(zhuǎn)換器以及各種輸入輸出周邊等，這使得我們要單純?cè)u(píng)價(jià)一款 SoC 是否非常好的的時(shí)候可能會(huì)感到頗為傷神。

話雖如此，不過總的來說，SoC 中和性能最密切相關(guān)的依然是 CPU、GPU，因?yàn)橹悄茉O(shè)備里幾乎所有程序的運(yùn)行都必須依仗兩者來執(zhí)行，與用戶的使用感受有直接關(guān)系（請(qǐng)注意，我們這里說的只是指 SoC 芯片中，而非手機(jī)或者平板電腦整體）。因此，縱然手機(jī)、平板處理器型號(hào)各異并且內(nèi)中千頭萬緒，我們還是應(yīng)該從大家最關(guān)心的 CPU、GPU 著手來了解。

現(xiàn)在情況簡(jiǎn)單多了，按照 ISA（指令集架構(gòu)）劃分，因?yàn)槟壳暗氖謾C(jī)、平板 CPU 無非是 ARM、Intel/AMD 兩大陣營(yíng)，潛在的還有 MIPS，不過目前 MIPS 似乎在這個(gè)領(lǐng)域還成不了氣候，更像是一個(gè)備胎。

如果你對(duì)計(jì)算機(jī)科學(xué)還不是很了解的話，對(duì) ISA 這個(gè)詞可能也不會(huì)很了解，雖然它經(jīng)常出現(xiàn)在一些時(shí)髦的技術(shù)文章中。

電腦顯然并不能直接明白 C、Java、Basic 這樣的高級(jí)語言（雖然有人嘗試過開發(fā)高級(jí)語言處理器，但是無不失敗告終），搭建在高級(jí)語言和 CPU 本機(jī)代碼之間的就是 ISA。

ISA 的全稱是 instruction set architecture，中文就是指令集架構(gòu)，有時(shí)候直接稱呼為架構(gòu)（architecture），是指程序員實(shí)際“可見”的指令集，包含了程序員編寫一個(gè)能正確運(yùn)行的二進(jìn)制機(jī)器語言程序的所有信息，涉及到指令、 I/O 設(shè)備等。例如 Intel 的 IA-32、Intel 64（曾經(jīng)名為 IA32e、EM64T 等）；ARM 的 ARMv7、ARMv8 等等。

這里的 IA32、Intel 64 或者 ARMv7、ARMv8 其實(shí)是指各自指令集架構(gòu)的不同版本，有時(shí)候我們嫌啰嗦，所以把前兩者統(tǒng)稱 x86，后兩者統(tǒng)稱 ARM。

將 ISA 變成真正可以使用的實(shí)物需要經(jīng)過“實(shí)現(xiàn)”，它包括兩個(gè)層面：組成和硬件。

組成是從計(jì)算機(jī)設(shè)計(jì)的高階層面而言，例如：存儲(chǔ)系統(tǒng)、存儲(chǔ)互連接、CPU（包括算術(shù)、邏輯分支、數(shù)據(jù)傳輸?shù)膶?shí)現(xiàn)）設(shè)計(jì)，有時(shí)候“組成”又被稱作微架構(gòu)（microarchitecture），英特爾 Nehalem、NVIDIA Kepler、ARM Cotrex-A57 都可以屬于各自某系列芯片的微架構(gòu)，其中 Kepler 的 ISA 是 CUDA PTX 和 Cortex-A57 的 ISA 屬于 ARMv8。

硬件通常是指電腦的規(guī)格，包括具體的邏輯設(shè)計(jì)、封裝技術(shù)，同一系列的產(chǎn)品可能有相同的 ISA、近乎一樣的微架構(gòu)，但是存在某些具體規(guī)格的差別，例如 NVIDIA Tegra 3，有 AP30、AP33、T30、T33、T30S、T33S、T30SL 等具體的型號(hào)，它們都屬于 Tegra 3 微架構(gòu)，但是頻率規(guī)格、內(nèi)存規(guī)格等地方都有差別。

而 GPU 方面則復(fù)雜一些，有 PowerVR、高通、NVIDIA、ARM、Intel 等等，其中使用最廣泛的就是 PowerVR，這得益于 PowerVR 10年前就決定全面切換到移動(dòng)設(shè)備上，鋪橋搭路的功夫很扎實(shí)，而 NVIDIA 和 Intel 的商業(yè)模型都是只用于自家產(chǎn)品（當(dāng)然 NVIDIA 也曾經(jīng)在游戲機(jī)領(lǐng)域做過 RSX 這樣的 IP core 授權(quán)）的，所以目前未能在其他 SoC 上看到。

下面的表格給出了這兩年來比較熱門的手機(jī)或者平板電腦 ARM 處理器，它們基本上都被應(yīng)用于各公司的旗艦級(jí)產(chǎn)品中。

2011/2013 SoC 對(duì)比表
SoC	制程	CPU	GPU	內(nèi)存總線	發(fā)布時(shí)間
Apple A5	45nm/32nm	2 x ARM Cortex A9 w/ MPE @ 1GHz	PowerVR SGX 543MP2	2 x 32-bit LPDDR2	2011-10-4
Apple A5X	45nm	2 x ARM Cortex A9 w/ MPE @ 1GHz	PowerVR SGX 543MP4	4 x 32-bit LPDDR2	2012-3-16
Apple A6	32nm	2 x Apple Swift @ 1.3GHz	PowerVR SGX 543MP3	2 x 32-bit LPDDR2	2012-9-12
Apple A6X	32nm	2 x Apple Swift @ 1.4GHz	PowerVR SGX 554MP4	4 x 32-bit LPDDR2	2012-10-23
NVIDIA Tegra 2	40nm	2 x ARM Cortex A9 @ 1GHz	ULV GeForce T2	1 x 32-bit LPDDR2	2010-1-8
NVIDIA Tegra 3/Kal-El	40nm	4 x ARM Cortex A9 w/ MPE @ ~1.3GHz	ULV GeForce T3	1 x 32-bit LPDDR2	2011-11-8
NVIDIA Tegra 4/Wayne	28nm	4 x ARM Cortex A15MPCore w/MPE	ULV GeForce T4	2 x 32-bit LPDDR2	2012-1
Samsung Exynos 4210	45nm	2 x ARM Cortex A9 w/ MPE @ 1.2GHz	ARM Mali-400 MP4	2 x 32-bit LPDDR2	2011-2-10
Samsung Exynos 4212	32nm	2 x ARM Cortex A9 w/ MPE @ 1.5GHz	ARM Mali-400 MP4	2 x 32-bit LPDDR2	2011-10-1
Samsung Exynos 5250	32nm	2 x ARM Cortex A15MPcore w/ MPE @ 1.7GHz	ARM Mali-604	2 x 32-bit LPDDR2	2011-11-30
Qualcomm MSM8060/8260/8660	45nm	2 x Scorpion @ 1.5GHz	Adreno 220	1 x 32-bit LPDDR2*	2011-2-10
Qualcomm MSM8960	28nm	2 x Krait @ 1.5GHz	Adreno 225	2 x 32-bit LPDDR2	2011-2-14
Qualcomm MSM8960T	28nm	2 x Krait @ 1.7GHz	Adreno 320	2 x 32-bit LPDDR2	2012-2-27
Qualcomm APQ8064	28nm	4 x Krait @ 1.7GHz	Adreno 320	2 x 32-bit LPDDR2	2011-2-14

它們都屬于 ARMv7 架構(gòu)，架構(gòu)寄存器數(shù)量為 16 個(gè)，其中 Tegra 2/3、Exynos、A5/A5X 的 CPU 核心是 Cortex A9 或者 Coretx A15，都是來自于 ARM 的 IP core 授權(quán)，而 A6/A6X 的 Swift 和高通的 Scorpion/Krait 則分別是蘋果和高通獲得 ARM 架構(gòu)授權(quán)后而各自自行開發(fā)的。

眾所周知，IP core 的全稱是 Intellectual Proerty core，意即知識(shí)產(chǎn)權(quán)內(nèi)核，是目前各種嵌入式應(yīng)用、個(gè)人智能消費(fèi)類設(shè)備中最為常見技術(shù)類型，數(shù)十億計(jì)的產(chǎn)品都采用了來自 ARM、MIPS 的 IP core。IP core 被設(shè)計(jì)成可以和芯片中其他邏輯單元（例如視頻編解碼器、I/O 界面、內(nèi)存界面）協(xié)同運(yùn)作形成一枚可以支持特定應(yīng)用的處理器。

IP core 分為兩類：硬核（hard core......不要會(huì)錯(cuò)意了）和軟核（soft core）。硬核是針對(duì)特定半導(dǎo)體廠商而優(yōu)化的，對(duì)外人來說是一個(gè)提供了外部界面、不修改的“黑盒子”，獲得授權(quán)的廠商通常只能對(duì)核外的邏輯參數(shù)進(jìn)行修改，例如 L2 cache 大小，但是 IP core 本身不可修改。而軟核的設(shè)計(jì)代碼則是可以針對(duì)不同半導(dǎo)體廠商做編譯和修改，當(dāng)然這要求設(shè)計(jì)廠商具備強(qiáng)大的研發(fā)實(shí)力和經(jīng)驗(yàn)，因?yàn)楝F(xiàn)在的 IP core 相當(dāng)復(fù)雜。

簡(jiǎn)而言之而言，硬核的性能更高、占用管芯面積更小，而軟核則可以讓不同廠商作進(jìn)一步的修改。

2人已贊

第1頁(yè)：什么是應(yīng)用處理器？第2頁(yè)：長(zhǎng)話短說“微架構(gòu)”——流水線第3頁(yè)：長(zhǎng)話短說“微架構(gòu)”——超標(biāo)量第4頁(yè)：長(zhǎng)話短說“微架構(gòu)”——分支（轉(zhuǎn)移）預(yù)測(cè)第5頁(yè)：長(zhǎng)話短說“微架構(gòu)”——?jiǎng)討B(tài)調(diào)度第6頁(yè)：長(zhǎng)話短說“微架構(gòu)”——線程級(jí)并行化第7頁(yè)：長(zhǎng)話短說“微架構(gòu)”——數(shù)據(jù)級(jí)并行（SIMD）第8頁(yè)：長(zhǎng)話短說“微架構(gòu)”——存儲(chǔ)系統(tǒng)分層結(jié)構(gòu)第9頁(yè)：ARM 指令集架構(gòu)的由來第10頁(yè)：ARM Cortex-A9 內(nèi)核微架構(gòu)特點(diǎn)第11頁(yè)：ARM Cortex-A15 內(nèi)核微架構(gòu)特點(diǎn)第12頁(yè)：高通 Krait 內(nèi)核微架構(gòu)特點(diǎn)第13頁(yè)：蘋果 Swift 內(nèi)核微架構(gòu)特點(diǎn)第14頁(yè)：英特爾 Bonnell/Saltwell 內(nèi)核微架構(gòu)特點(diǎn)第15頁(yè)：ARM Cortex-A5/Cortex-A7 微架構(gòu)的特點(diǎn)第16頁(yè)：移動(dòng)圖形處理器形勢(shì)簡(jiǎn)話第17頁(yè)：PowerVR SGX 54x MP4 GPU 微架構(gòu)第18頁(yè)：全文總結(jié)

av免费福利片在线播放,99热精品久久只有精品,18video性欧美19sex,ysl蜜桃色www,国产精品一区二区久久国产

輕松讀懂移動(dòng)處理器 CPU微架構(gòu)全解析

關(guān)注我們