綜述
原生四核處理器不同於普通的四核處理器,具有更為強大的運算速度和性能
普通的四核處理器僅僅是將兩個
雙核處理器封裝在一起的所謂“粘合”,戲稱“膠水四核”
而原生四核處理器是純粹的單片電路
四核處理器,意味著每顆處理器中包含4顆單獨的微處理器核心,使得整個處理器能更有效率的運行
由於不同公司之間架構的不相同,原理也不同程度的差異
以下,我將分Intel和AMD兩家公司所推出的原生四核處理器做一個詳細的解釋與闡釋
Intel
Intel的第一款原生四核處理器是於2008年推出的64位四核心CPU——Core i7(中文:
酷睿i7,核心代號:Bloomfield),沿用I7 920x86-64
指令集,並以Intel Nehalem微架構為基礎,取代Intel Core 2系列處理器。
參數
1. 基於Nehalem微架構
2. 2-8顆核心。
4. 每顆核心獨享256KB二級快取。
9. 微架構最佳化(支持64-bit模式的宏融合,提高環形數據流監測器性能,六個數據發射連線埠等等)
10. 提升預判單元性能,增加第二組分支照準
快取。
11. 第二組512路的TLB。
12. 對於非整的SSE指令提升性能。
13. 提升
虛擬機性能(根據Intel官方數據顯示,Nehalem相對65nm Core 2在雙程虛擬潛伏上有60%的提升,而相對45nm Core 2產品提升了20%)
15. 新的能源管理單元。
16. 45nm製程,32nm製程產品隨後上線,代號Westmere。
新增功能
Nehalem相當於65nm產品有著如下幾個最重要的新增功能
2. 深層休眠技術(C6級休眠,只在移動晶片上使用)。
4. 快速Radix-16分頻器和Super Shuffle engine,加強FPU性能
Core i7的改進
我們知道,Core 2 Quad系列四核處理器其實是把兩個Core 2 Duo處理器封裝在一起,並非原生的四核設計,通過狹窄的
前端匯流排FSB來通信,這樣的缺點是數據延遲問題比較嚴重,性能並不盡如人意。Core i7則採用了原生四核設計,採用先進的QPI(QuickPath Interconnect,下面將進行介紹)匯流排進行通訊,傳輸速度是FSB的5倍。
快取方面也採用了三級內含式Cache設計,L1的設計和
Core微架構一樣;L2採用超低延遲的設計,每個核心256KB(256x4 KB);L3採用共享式設計,被片上所有核心共享,容量為8MB。
Core i7的Nehalem架構最大的改進在
前端匯流排(FSB)上,傳統的並行傳輸方式被徹底廢棄,轉而採用基於PCI Express串列
點對點傳輸技術的
通用系統接口(CSI),被Intel稱為QuickPath。QuickPath的傳輸速率為6.4GT/S,這樣一條32bit的QuickPath頻寬就能達到25.6GB/sec。QuickPath的傳輸速率是FSB 1333MHz的5倍,前者雖然數據
位寬較窄,但傳輸頻寬仍然是後者的2.5倍。由於分別用於雙處理器和單處理平台,Gainestown有兩條QuickPath,而Bloomfield僅有一條。不難看出,在AMD推出HyperTransport高速串列
匯流排,並逐漸在高性能運算領域建立優勢之後,Intel也迎頭趕上。若干年前,關於串列傳輸將一統天下的預言已經變成了現實,我們所要等待的是串列記憶體何時重返市場。
記憶體控制器相信大家不會感到陌生,競爭對手AMD早在K8時代CPU已經集成了記憶體控制器,能大幅提升記憶體性能,而Intel方面則表示由於時機還不合適,因此沒有在Core2中使用,現在最新的Core i7終於擁有集成記憶體控制器IMC(Integrated Memory Controller),可以支持
三通道的
DDR3記憶體,運行在DDR3-1333,
記憶體位寬從128位提升到192位,這樣總共的
峰值頻寬就可以達到32GB/s,達到了Core 2的2-4倍。處理器採用了集成
記憶體控制器後,它就能直接與物理存儲器陣列相連線,從而極大程度上減少了
記憶體延遲的現象。
超執行緒技術(
Hyper-Threading),最早出現在130nm的Pentium 4上,超執行緒技術就是利用特殊的硬體指令,把兩個邏輯核心模擬成兩個物理晶片,讓單個處理器都能使用執行緒級
並行計算,進而兼容多執行緒
作業系統和
軟體,減少了CPU的閒置時間,提高的CPU的運行效率。
超執行緒技術使得Pentium 4單核CPU也擁有較出色的多任務性能,現在通過改進後的超執行緒技術再次回歸到Core i7處理器上,新命名為
同步多執行緒技術(Simultaneous Multi-Threading,SMT)。
同步多執行緒(Simultaneous Multi-Threading,SMT)是2-way的,每核心可以同時執行2個執行緒。對於執行引擎來說,在多執行緒任務的情況下,就可以掩蓋單個執行緒的延遲。SMT功能的好處是只需要消耗很小的核心面積代價,就可以在多任務的情況下提供顯著的性能提升,比起完全再添加一個物理核心來說要划算得多。比起Pentium 4的
超執行緒技術(Hyper-Threading),Core i7的優勢是有更大的
快取和更大的
記憶體頻寬,這樣就更能夠有效的發揮多執行緒的作用。按照INTEL的說法,Nehalem的SMT可以在增加很少能耗的情況下,讓性能提升20-30%。
為什麼Core 2沒有使用SMT?很顯然,它是可以做到的。SMT是在節省電力的基礎上增加了性能,而且
軟體支持的基礎建設也早就有了。有2個可能的原因:一是Core 2可能沒有足夠的
記憶體頻寬和CPU內部頻寬來利用SMT獲得優勢。通常,SMT能夠提升記憶體級並行(memory level parallelism,MLP),但是對於
記憶體頻寬已經成為瓶頸的系統則是個麻煩。而更有可能的原因則是SMT的設計、生效等是很麻煩的,而當初設計SMT是由INTEL的Hillsboro小組主持,而並非是Haifa小組(Core 2是由這個小組負責的)。這樣Core 2不使用SMT就避免了冒險。
Turbo Mode,顧名思義,就是加速模式,它是基於Nehalem架構的
電源管理技術,通過分析當前CPU的負載情況,智慧型地完全關閉一些用不上的核心,把能源留給正在使用的核心,並使它們運行在更高的頻率,進一步提升性能;相反,需要多個核心時,動態開啟相應的核心,智慧型調整頻率。這樣,在不影響CPU的TDP情況下,能把核心
工作頻率調得更高。
舉個簡單的例子,如果遊戲只用到一個核心,Turbo Mode就會把其他三個核心自動關閉,把正在運行遊戲的那個核心的頻率提高,也就是
自動超頻,在不浪費能源的情況下獲得更好的性能。Core 2時代,即使是運行只支持單核的程式,其他核心仍會全速運行,得不到性能提升的同時,也造成了能源的浪費。
Turbo Boost默認是開啟的,通過自動調高CPU的
倍頻提高性能。在Intel原廠X58
主機板上,低負載時默認調高1-2個
倍頻。例如Core i7 920默認頻率為2.66G,在Turbo Boost默認是開啟的情況下,運行Super PI是以單核2.8G來跑,這樣
單執行緒性能也就得到提升。
超頻愛好者也許會想到,Turbo Mode自動提升的那個頻率可以手動調整嗎?如果可以,不就能利用它進行超頻嗎?答案是可以的,只要是Exterme Edition CPU,就可以手動調整,好好利用,新的超頻方式從此誕生。
文本處理再提速!完整SSE4指令支持
完整的SSE 4(Streaming SIMD Extensions 4,流式單指令多數據流擴張)
指令集共包含54條指令,其中的47條指令已在45nm的Core 2上實現,稱為
SSE 4.1。SSE 4.1指令的引入,進一步增強了CPU在
視頻編碼/解碼、圖形處理以及遊戲等多媒體套用上的性能。其餘的7條指令在Core i7中也得以實現了,稱為SSE 4.2。SSE 4.2是對SSE 4.1的補充,主要針對的是對XML文本的字元串操作、存儲校驗CRC32的處理等。
AMD
特性
真多核處理
支持更好的
多任務處理性能,用戶可以運行更多套用和在更短時間內處理更多任務
提供領先的PC系統性能
支持DDR2-1066的集成雙通道記憶體控制器
使套用性能得到極大的改進,提高了系統吞吐能力,降低了延遲,使用戶得到更佳的PC體驗
HyperTransport ? 3.0技術
4000MHz
匯流排頻率提供了驚人的系統敏捷性,以實現更高的3D圖形處理性能
AMD寬浮點加速器技術
AMD Digital Media Xpress ? 2.0
提供更銳麗、更逼真的3D圖形
具有快速虛擬化索引功能的AMD Virtualization ? 技術
Cool ‘n’ Quiet ? 2.0涼又靜技術和多點熱量監控 極為高效的性能和
電源管理,支持更安靜低溫的平台設計和並為系統投資提供保護