快取介紹 電腦快取是當cpu在讀取數據的時候,先是從快取檔案中查找,然後找到之後會自動讀取,再輸入到cpu進行處理,當然如果沒有在快取中找到對應的快取檔案的話,那么就會從記憶體中讀取並且傳輸給cpu來處理。當然這樣的話需要一定的時間所以會很慢。等cpu處理之後,就很快把這個數據所在的數據塊保存在快取檔案中,這樣的話在以後讀取這項數據的時候就直接在快取中進行,不要重複在記憶體中調用並讀取數據了。
快取大小也是CPU的重要指標之一,而且快取的結構和大小對CPU速度的影響非常大,CPU內快取的運行頻率極高,一般是和處理器同頻運作,工作效率遠遠大於系統記憶體和硬碟。實際工作時,CPU往往需要重複讀取同樣的數據塊,而快取容量的增大,可以大幅度提升CPU內部讀取數據的命中率,而不用再到記憶體或者硬碟上尋找,以此提高系統性能。但是出於CPU晶片面積和成本的因素來考慮,快取都很小。
快取分類 一級快取都內置在CPU內部並與CPU同速運行,可以有效的提高CPU的運行效率。一級快取越大,CPU的運行效率越高,但受到CPU內部結構的限制,一級快取的容量都很小。
二級快取,它是為了協調一級快取和記憶體之間的速度。cpu調用快取首先是一級快取,當處理器的速度逐漸提升,會導致一級快取就供不應求,這樣就得提升到二級快取了。二級快取它比一級快取的速度相對來說會慢,但是它比一級快取的空間容量要大。主要就是做一級快取和記憶體之間數據臨時交換的地方用。
三級快取是為讀取二級快取後未命中的數據設計的—種快取,在擁有三級快取的CPU中,只有約5%的數據需要從記憶體中調用,這進一步提高了CPU的效率。其運作原理在於使用較快速的儲存裝置保留一份從慢速儲存裝置中所讀取數據並進行拷貝,當有需要再從較慢的儲存體中讀寫數據時,快取(cache)能夠使得讀寫的動作先在快速的裝置上完成,如此會使系統的回響較為快速。
三級快取分類 Cache(三級快取),分為兩種,早期的是外置,以後的升級產品都是內置的。而它的實際作用即是,L3快取的套用可以進一步降低
記憶體延遲 ,同時提升大數據量計算時
處理器 的性能。降低記憶體延遲和提升大數據量計算能力對遊戲軟體都很有幫助。而在伺服器領域增加L3快取在性能方面仍然有顯著的提升。如具有較大L3快取的配置利用
物理記憶體 會更有效,故它比較慢的磁碟I/O子系統可以處理更多的數據請求。具有較大L3快取的處理器提供更有效的檔案系統快取行為及較短訊息和處理器佇列長度。
AMD FX 8150CPU擁有8M三級快取
其實最早的L3快取被套用在
AMD 發布的K6-III
處理器 上,當時的L3快取受限於製造工藝,並沒有被集成進晶片內部,而是集成在主機板上。在只能夠和
系統匯流排頻率 同步的L3快取同主記憶體其實差不了多少。後來使用L3快取的是
英特爾 為伺服器市場所推出的
Itanium 處理器。接著就是P4EE和
至強 MP。Intel還打算推出一款9MB L3快取的Itanium2處理器,和以後24MB L3快取的雙核心Itanium2處理器。
但基本上L3快取對
處理器 的性能提高顯得不是很重要,如配備1MB L3快取的Xeon MP處理器卻仍然不是Opteron的對手,由此可見前端匯流排的增加,要比快取增加帶來更有效的性能提升。
二級快取價格 首先來算一筆小賬(2009年02月),關於Intel處理器的二級快取:
二級快取512K的賽揚雙核E1200隻要270元,二級快取1M的
奔騰雙核 E2140售價為370元,需要花費100元來購買這額外的512K快取;二級快取2M的酷睿2 E4300或者奔騰雙核E5200的售價在550元以上,這就意味著得再出200元來購買這額外的1M二級快取;二級快取3M的酷睿2E7200售價750元,又得掏出200元來購買這額外的1M二級快取;二級快取4M/6M的酷睿2系列處理器依次類推……
不管酷睿2、奔騰雙核還是賽揚雙核,它們的核心架構其實是完全相同的,頻率可以隨意更改,唯一不同的就是二級快取。可以毫不誇張地說,Intel就是在賣二級快取,200塊錢1M。
事實上歷年來Intel都是通過二級快取的大小來劃分產品線,初期只有奔騰和賽揚兩種規格,到了酷睿2時代Intel達到了登峰造極的境界:僅僅是雙核產品就擁有512K、1M、2M、3M、4M、6M多達六個版本,四核產品也有4M、6M、8M、12M四個版本,令人眼花繚亂!Intel細分產品線的策略在每個價位都提供了優秀的產品,但也給廣大用戶製造了前所未有的困惑:到底多大二級快取才夠用?
二級快取發展 縱觀英特爾處理器的發展,且不論核心架構如何改變,以級數增長的二級快取是最直觀的。奔騰4時代0.18微米工藝的Willamette擁有256K二級快取,0.13微米的
Northwood核心 擁有512K,後期0.09微米的Prescott一度增大到1M。到了酷睿時代,在架構發生了翻天覆地的變化的同時,65納米工藝讓二級快取再次翻倍,即便是剛推出時低端酷睿的代表Allendale核心,二級快取也達到了2M,高端酷睿更是擁有4M的二級快取。進入45nm工藝後,二級快取的容量進一步加大,高端E8X00系列二級快取達到了驚人的6M,低端E7X00也達到了3M之多,至此Intel從512K到6M甚至12M實現了二級快取的“無縫銜接”。
市場中沒有永遠的落後者,當AMD進入45nm時代,Phenom II的到來,AMD也能通過核心數量和快取的搭配,設計出定位不同市場的CPU。
對性能的影響 而三級快取對性能影響時高時低。在遊戲方面,提升三級快取的容量對遊戲的性能影響很大,雖然對一般家用機沒有什麼用,但是如果是網咖機或者是發燒機提升三級快取的容量還是會有顯著的性能提升的。雖然三級快取也能為PC帶來顯著的性能提升,但畢竟三級快取是作用於伺服器的,對PC來說,三級快取還是只能做個輔助作用,在其他參數相同的情況下,三級快取容量越大,則性能更好,如果其他參數不相同的話,這時三級快取的作用就不明顯了。
不管三級快取的作用大不大,它畢竟也是為電腦發展作出貢獻的參數之一。
發展歷程 最早的L3快取被套用在AMD發布的K6-III處理器上,當時的L3快取受限於製造工藝,並沒有被集成進晶片內部,而是集成在主機板上。在只能夠和系統匯流排頻率同步的L3快取同主記憶體其實差不了多少。後來使用L3快取的是英特爾為伺服器市場所推出的Itanium處理器。接著就是P4EE和至強MP。Intel還打算推出一款9MBL3快取的Itanium2處理器,和以後24MBL3快取的雙核心Itanium2處理器。
但基本上L3快取對處理器的性能提高顯得不是很重要,比方配備1MBL3快取的XeonMP處理器卻仍然不是Opteron的對手,由此可見前端匯流排的增加,要比單純增加快取帶來更有效的性能提升。
縱觀AMD
Phenom 處理器 的發展,核心架構的改進相對有限,而三級快取的變化是最直觀的。從早期Phenom的2MB三級快取,猛增至Phenom II的6MB三級快取,而為了市場的需要,又推出了採用Phenom II架構但沒有三級快取的Athlon X4。而
AMD 處理器獨有的雙核、
三核 、
四核 架構,加上快取的不同搭配,一時間,
AMD處理器 呈現出門丁興旺的景象。
從硬體系統配置看三級快取
對於AMD的用戶來說,多是追求性價比的用戶,而AMD
處理器 這樣的現象,對用戶既是好事也是壞事,好是用戶的選擇更多了,壞的是用戶對CPU的選擇無所適從。而細細觀察,AMD處理器百龍爭寵的現象,無外乎是核心與快取搭配的結果。
與65nm Phenom相比,新一代
45nm Phenom II最大的變化就是升級到了45nm SOI沉浸式光刻生產工藝,好處就是主頻更高、功耗更低、
集成度 更高,特別是三級快取從2MB猛增到了6MB!
三級快取翻了三倍,自然需要付出一定的代價,通過Phenom和Phenom II晶片示意圖的對比,就能略知一二了:
Brcelona/Agena集成了4.68億個電晶體,核心(Die)面積大約285平方毫米,Shanghai/Deneb的電晶體增加了62%,多達7.58億個,但核心面積卻減小了9.5%,只有258平方毫米,新工藝的好處可見一斑。
電晶體數量增加如此之多主要就是因為三級快取的大幅
擴容 ,這部分在整個核心裡的面積比例也從大約六分之一提高到了足有三分之一。
其它 AMD關於三級快取的態度
第一 ,三級快取容量在
伺服器 領域的作用更明顯,不過如果伺服器和桌面
處理器 採用不同的架構,必然會提高生產難度和成本,故而帶到了桌面上;
第二 ,在桌面上,三級快取從2MB增加到6MB可以帶來大約5%的性能提升,實際測試也證明了這一點;
第三 ,從前邊的數據看出,三級快取增加了兩倍,但得益於生產工藝的改進,核心面積反而更小了,成本也更低。
熟悉Intel
Nehalem Core i7(
酷睿i7 )處理器的人一定想到了,Intel也使用了同樣的大容量共享三級快取設計,且容量多達8MB,也占據了整個核心面積的
三分之一 左右,不同之處在於Core i7每核心
一級快取 和
二級快取 只有64KB和256KB,都比Phenom/Phenom II少一半。
有趣的是,同樣基於
45nm 工藝的Core i7集成了7.31億個電晶體,比Phenom II略少,但核心面積卻稍大一些,為263平方毫米。
從成本的角度來算一筆帳,通過Phenom II X4的晶片結構示意圖可以看出,三級快取所占晶片面積比兩顆核心以及L1L2加起來還要多,如此一來即便是
禁止 了一顆核心的Phenom II X3,其成本也並不低,這對於主打性價比路線的AMD來說,利潤損失會比較大。
於是,AMD在發布Phenom II X4、X3
處理器 之後,也在積極準備定位主流中低端的產品,用以取代征戰多年的Athlon 64 X2系列。由於L3成本較高,因此AMD把Phenom II X4的三級快取徹底刪去(注意不是禁止),Athlon X4便與大家見面了。
如此一來,人們就可以通過對比評測,輕鬆了解到AMD的Phenom II架構處理器中,6M L3對性能的貢獻有多大,也能提前了解擁有完整L3但卻少一顆核心的Phenom II X3強呢,還是沒有L3的但卻有四顆核心的Athlon X4強?相信很多朋友都會挺感興趣的。
AMD已上市的Phenom II 920(6M L3)和Phenom 9850(2M L3),還有一顆神秘的沒有L3的Athlon X4工程樣品,讓他們都工作在200*14=2.8GHz頻率下,這樣就能直觀的對比6M/2M/0M三級快取所造成的性能差異。
另外還加入了剛剛發布的Phenom II X3 720
處理器 ,它擁有完整的6M三級快取,但少一顆核心,這樣可以反映出多一顆核心的貢獻大還是6M L3的貢獻更大?測試結果表明,從CPU架構上看,快取對性能的影響很大,但Athlon X4的表現,尤其是在大量運算過程中,力壓上代擁有完整3級快取的9850,
記憶體頻寬 的優勢不言而喻。
Intel6(16MB三級快取)核處理器
首先推向市場的是高端桌面PC處理器品牌酷睿i7和針對高能效伺服器市場的Nehalem-EP,預計2009年第四季度即可上市。隨後,新架構產品會陸續推出,包括針對可擴展伺服器市場的Nehalem-EX,桌面市場的Havendale和Lynnfield,移動市場的Auburndale和Clarksfield,預計都在2009年下半年登場。
下一代
Core微架構 (Nehalem)處理器均從4核起跳,但同時採用了Hyper-Threading技術,可同時處理8個執行緒。Core i7支持Turbo Mode和Power Gates技術,在不需要多執行緒運算時,可令閒置核心完全關閉。各個核心可以工作在不同的電壓/頻率下,單獨提高某一核心頻率的Turbo Mode模式可顯著提升單執行緒套用性能。
Intel還同時發布了首款6核心處理器,針對多路伺服器市場的“Dunnington”Xeon X7460,內建16MB L3快取,在2008年9月上市,是Intel在轉向Nehalem微架構之前的最後一顆45nm酷睿2微架構處理器。採用該處理器的伺服器機型已經打破了多項世界紀錄,包括8路48核的IBM System x3950 M2伺服器在TPC Benchmark C資料庫測試中首次突破100萬tpmC,4路系統惠普Proliant DL580 G5打破TPC-C紀錄,戴爾PowerEdge R900打破TPC-E紀錄,Sun Fire X4450打破SPECjbb 2005紀錄,富士通西門子PRIMERGY RX600 S4打破SPECint_rate2006紀錄。[1]
無三級快取AMD 45nm處理器
在工藝進步、技術完善後,AMD的45nm新桌面處理器將擁有齊全的五個子系列,其中擁有三級快取的屬於Phenom II品牌,精簡掉三級快取的則仍沿用Athlon(不知道為何不是Athlon II)。至於Sempron,很快就會淘汰了。
最高端的“Phenom II X4 900/800”系列四核心代號Deneb,二級快取4×512KB,三級快取前者6MB、後者精簡到4MB。這兩個系列都將於明年1月份率先發布,其中首批兩款AM2+接口的Phenom II X4 940/920會在1月8日的CES 2009大展上首發,之後的全部改用AM3接口。
三核心繫列“Phenom II X3 700”代號Heka,二級快取3×512KB,三級快取為完整的6MB,將在明年2月份跟進。
除了這兩個系列,AMD還準備了沒有三級快取的版本,而且在設計之初就沒有加入三級快取,而不是簡單的禁止版本,不會造成浪費。
其中四核心將是“Athlon X4 600”系列,代號Propus,二級快取4×512KB,三核心是“Athlon X3 400”系列,代號Rana,二級快取3×512KB,二者都會在明年4月份登場。
最後是代號Regor的“Athlon X2 200”系列雙核心,二級快取2×1MB,比其它系列多出一倍,不過發布時間也最晚,要到明年6月才會推出,目的是避免和現有的舊架構型號產生衝突。
晶片組方面,現在的AMD 7系列主機板在更新BIOS就能支持新處理器,具體視主機板廠商的技術支持而定。另外AMD將在2009年上半年推出新的8系列
整合晶片組 ,其中RS880和RS880C搭配SB750南橋,RS880D和RS890搭配下一代SB800。[2]
一級、二級和三級快取誰更重要
一級最重要,但是現在CPU的
一級快取 幾乎都一樣,所以忽略。
二級快取 的話對於Intel的CPU是很重要的,Intel的CPU的二級快取越大性能提升非常明顯,而AMD的CPU雖然二級快取也很重要,但是二級快取大小對AMD的CPU的性能提升不是很明顯。
三級快取其實只是做了個輔助的作用,除了伺服器,其實對大多數家庭機沒什麼用的,記憶體還是很重要的,但如果運行大型程式或遊戲來說三級快取就顯得重要了,目前新型CPU已經有三級快取了。
所以說現在衡量CPU性能除了頻率外,還有一個核心數量,再到快取的大小, 從理論上講,二級快取越大
處理器 的性能越好,但這並不是說
二級快取容量 加倍就能夠處理器帶來成倍的性能增長。2006年,CPU處理的絕大部分數據的大小都在0-256KB之間,小部分數據的大小在256KB-512KB之間,只有極少數數據的大小超過512KB。到2009年已經有1M,2M的了。所以只要處理器可用的一級、
二級快取 容量達到256KB以上,那就能夠應付正常的套用;512KB容量的二級快取已經足夠滿足絕大多數套用的需求。
主頻、二級快取和三級快取哪個更重要
快取的工作原理是當CPU要讀取一個數據時,首先從快取中查找,如果找到就立即讀取並送給CPU處理;如果沒有找到,就用相對慢的速度從記憶體中讀取並送給CPU處理,同時把這個數據所在的數據塊調入快取中,可以使得以後對整塊數據的讀取都從快取中進行,不必再調用記憶體。
正是這樣的讀取機制使CPU讀取快取的命中率非常高(大多數CPU可達90%左右),也就是說CPU下一次要讀取的數據90%都在快取中,只有大約10%需要從記憶體讀取。這大大節省了CPU直接讀取記憶體的時間,也使CPU讀取數據時基本無需等待。總的來說,CPU讀取數據的順序是先快取後記憶體。
cpu的二級快取和三級快取的大小,並不是衡量cpu的性能的唯一標準,還得看cpu的主頻,製做流程,比如說45納米的就比65納米的好,還要稍微注意一下它支持的指令集,還得看是誰的產品,二級快取對於intel的產品來說很重要但二級快取對於AMD來說就不像intel那么重要,因為AMD除了有二級快取之外還有三級快取。
要說主頻、二級快取和三級快取哪個更重要,這個問題完全還要看你使用電腦追求什麼了,主要執行什麼任務。主頻高運算速度快,二級快取(L2)和三級快取(L3)起到記憶體和CPU之間的緩衝作用,緩解記憶體和CPU速度不匹配問題會影響到CPU執行的效率。所以大的L2、L3在CPU長時間大量數據處理的時候效率會比較高。高主頻在短時間內少量數據的處理上會比較快,其實3項這都很重要 ,哪一項達不到一定標準都會出現瓶頸效應。
IntelXeon 7100系列CPU(16MB三級快取)
Intel正式發布了針對高端伺服器的最新雙核
Xeon處理器 ,代號Tulsa的Xeon 7100系列。該處理器依然基於上一代NetBurst架構,但在性能和功耗表現方面都有不小的改進。
Xeon 7100系列CPU配置
Xeon 7100系列CPU核心代號為Tulsa,雙核心設計,每個核心配備了1MB L2(二級)快取,16MB L3(三級)快取。該處理器還支持超執行緒(HT : Hyper-Threading)、虛擬化(Intel Virtualization Technology)以及Intel快取安全技術(Cache Safe Technology),3.0GHz主頻以上的Xeon 7100系列處理器TDP功耗為150W,3.0GHz以下的TDP為95W。
Xeon 7100系列CPU規格
CPU編號主頻FSBL2快取L3快取 千顆價格
7140M 3.40GHz 800MHz 2×1MB 16MB 1980
7140N 3.33GHz 667MHz 2×1MB 16MB 1980
7130M 3.20GHz 800MHz 2×1MB 8MB 1391
7130N 3.16GHz 667MHz 2×1MB 8MB 1391
7120M 3.00GHz 800MHz 2×1MB 4MB 1177
7120N 3.00GHz 667MHz 2×1MB 4MB 1177
7110M 2.60GHz 800MHz 2×1MB 4MB 856
7110N 2.60GHz 667MHz 2×1MB 4MB 856
Xeon 7100系列處理器支持667和800MHz PSB匯流排,與8501晶片組兼容,現有的伺服器平台可以很輕鬆的升級到新處理器。此外Intel公司表示,65nm工藝發展的十分順利,目前65nm產品的出貨比例已經超越90nm