全新酷睿2架構(gòu)!Merom vs. Yonah對比
Intel新一代Core微架構(gòu)移動(dòng)處理器Merom正式登場,將移動(dòng)計(jì)算機(jī)性能推升至新紀(jì)元,究竟Merom和Yonah在微架構(gòu)上有何不同、Centrino平臺(tái)Napa Refresh與即將在2007年Q2面市的Santa Rosa之間差異何在!?HKEPC編輯部找來Intel Core 2 Duo T7600與上代Core Duo T2700,作性能對比測試。
● 全新Core微架構(gòu)-- Intel Merom移動(dòng)處理器

盡管Intel Core微架構(gòu)是基于Mobile平臺(tái)的Yonah核心所設(shè)計(jì),但卻有超過7成的架構(gòu)和線路被重新改良,并加入5項(xiàng)主要的改革,包括Intel Wide Dynmaic Execution、Intel Intelligent Power Capability、Intel Advanced Smart Cache、Intel Smart Memory Access及Intel Advanced Digital Media Boost。
Core | Mobile Dual Core | NetBurst | AMD | |
L2 Cache | Shared L2 & Higher BW | Shared L2 | Independent L2 | Independent L2 |
L2 Cache Size | 4MB | 2MB | 2MB x 2 | 512KB x 2 |
SSE Throughput | 128Bit/Cycle | 64Bits/Cycle | 64Bits/Cycle | 64Bit/Cycle |
Issue Width | 4 Issue | 3 Issue | 3 Issue | 3 Issue |
Pipeline Stage | 14 Stage | 13 Stage | 31 Stage | 12 Stage |
System Bus | Up to 800MHz for | Up to 667MHz | Up to 1066MHz | 800MHz HT |
Power Efficiency | Ultra Fine Power Gating | Aggressive Power Gating | Power Gating | Power Gating |
Memory Access | Improved Prefetch | Baseline Prefetch | Baserline Prefetch | Integrated Memory Controller |
Intel Wide Dynamic Execution -- Merom處理器擁有4組Decoder (3 Simple decoders + 1 Complex Decoders),比上代Yonah核心多出1組(2 Simple Decoders + 1 Complex Decoders) 可多處理1組Simple Coder指令, 進(jìn)一步提升每周期的執(zhí)行效率及提升處理器的能源效益。
雖然Merom的Pipeline Stage由Yonah的13 Stage輕微上升至14 Stage,但Merom的Branch Predictor Bandwitdh提升20Bytes(Yonah為16Bytes), 因此其分支預(yù)測的能力及準(zhǔn)確性效率保持相若。
此外,Merom處理器不單保留了Micro-op Fusion技術(shù),并同時(shí)追加全新的 Macro-Fusion 技術(shù),在舊世代的微架構(gòu)中,每個(gè)指令被送來時(shí)其譯碼及執(zhí)移動(dòng)作是完全獨(dú)立的,但I(xiàn)ntel Core微架構(gòu)可以讓常見的指令組,例如1個(gè)Compare指令配隨后擁有1個(gè)Jump指令,組合成單一的Micro-Op指令,這令Merom處理器在特定情況下每個(gè)周期有運(yùn)算5組指令,據(jù)Intel表示,大部份x86程序,約每10至15個(gè)指令就會(huì)出現(xiàn)1組可透過Macro -Fusion被組合,因此減少了程序執(zhí)行所需運(yùn)算時(shí)間、提升性能卻不會(huì)增加處理器的功耗,為此Intel亦改良ALU(Arithmetic Logic Unit)部份以支持Macro-Fusion技術(shù)。
Intel Intelligent Power Capability -- Merom處理器的晶體管數(shù)目對比Yonah大幅提升,功耗消耗亦會(huì)相對增加,而為令Merom處理器的功耗表現(xiàn)保持于合理水平,Merom加入U(xiǎn)ltra Fine Grained省電設(shè)計(jì),細(xì)微的邏輯控制機(jī)能獨(dú)立開關(guān)各運(yùn)算單元,只有需要時(shí)才會(huì)被開啟,避免閑置時(shí)出現(xiàn)不必要的功耗浪費(fèi),稱為 Sleep Transistors技術(shù),此外,把核心各個(gè)Buses及Array采用獨(dú)立控制其VCC電壓,當(dāng)此部份被閑置時(shí),將會(huì)被運(yùn)作于低功耗模式中,因此Merom處理器在功耗表現(xiàn)可保持和Yonah處理器相約。
Intel Adcanced Smart Cache -- 早在Yonah處理器中,Intel已加入了Smart Cache架構(gòu),通過核心內(nèi)部的Shared Bus Router共享相同的L2 Cache,而Merom進(jìn)一步加強(qiáng)Prefetch能力,每顆核心均擁有3個(gè)獨(dú)立Prefetchers (2 Data and & 1 Instruction) 及2個(gè)L2 Prefetchers,能同時(shí)地偵出Multiple Streaming及Strided Acess Patterns,L2 Cache方面比Yonah倍增至 16-Way 256Bit 4MB容量,但Latechy卻保持在12-14ns之間,令Merom處理的Cache架構(gòu)性能進(jìn)一步提升。
Intel Smart Memory Access -- 為了提升內(nèi)存讀取效率, Merom處理器加入全新的內(nèi)存讀取技術(shù)稱為Memory Disambiguation,透過Out of Order過程把內(nèi)存讀取次序作出分析,當(dāng)發(fā)現(xiàn)某數(shù)據(jù)是完全獨(dú)立,則可讓它提早執(zhí)行以減少處理器的等候時(shí)間減少閑置,同時(shí)減低內(nèi)存讀取的延遲值。
Intel Adavanced Digital Media Boost -- Merom處理器擁有128Bit-SIMD interger arithmetic及128bit SIMD雙倍精準(zhǔn)度Floating-Point Operations。傳統(tǒng)的處理器設(shè)計(jì)只有64Bit的SIMD interger arithmetic及Floating-Point Operations,因此在執(zhí)行 128Bit的SSE、SSE2及SSE3指令時(shí),需要把指令分拆為2個(gè)64Bit指令,并需要2個(gè)頻率周期完成,但Core微架構(gòu)則只需要1個(gè)頻率調(diào)期便能完成,執(zhí)成效率提升達(dá)1倍,現(xiàn)時(shí)SSE指令集已經(jīng)十分普遍地用于主流的軟件中,包括繪圖、影像、音像、加密及數(shù)學(xué)運(yùn)算等用途,單周期128Bit處理器能力以頻率以外的方法提升性能,令處理器擁有高能源效益表現(xiàn)。
關(guān)注我們


