基本介紹
- 中文名:伊斯坦堡
- 外文名:AMD Opteron Istanbul
- 屬性:六核心處理器
- 類型:處理器
- 生產廠商:AMD
AMD 皓龍-伊斯坦堡 六核處理器,名稱,現有產品,虛擬化與節能,更多的新技術,更高速的HT匯流排,“APML”遠程電源管理界面,正式支持x8 ECC,“HT Assist”探測過濾器,核心數量優勢,
AMD 皓龍-伊斯坦堡 六核處理器
名稱
伊斯坦堡”處理器依舊基於AMD45nm SOI 技術製造。首發版本“伊斯坦堡”處理器頻率最高達到了2.6GHz,並且ACP(平均CPU功耗)和四核心版本的“上海”相同。
“伊斯坦堡”集成了多達9.04億個電晶體。相比之下英特爾的Xeon5500系列處理器只有7.3億電晶體,之前的“上海”處理器也只有7.05億電晶體數量。在沒有增加L3快取的情況下,我們可以大概估算出“伊斯坦堡”核心的電晶體數量約為1億個(其中包括了64KB的L1快取和512KB的L2快取),而整個6MB L3快取則耗費了3億個電晶體。
現有產品
AMD目前發布了5款“伊斯坦堡”處理器。其中兩款面向8路用戶,型號為8435和8531,頻率分別為2.6GHz和2.4GHz;三款面向雙路用戶,分別是2435、2431和入門級的2427,頻率分別為2.6GHz、2.4GHz和2.2GHz。所有“伊斯坦堡”核心的Operton的ACP都為75W。
虛擬化與節能
“伊斯坦堡”保留了“上海”核心的幾乎所有的功能,比如虛擬化功能和節能設計等。虛擬化技術可以利用一台電腦虛擬出不同的主機來各自完成不同的任務,提高系統的利用率並擴展系統的功能,充分挖掘系統的性能潛力。Opteron處理器所採用的AMD-V虛擬化技術擁有增強的快速虛擬化索引,提高虛擬化套用的性能以及允許虛擬機直接管理的記憶體。除此之外,AMD還開發出一系列特色套用的性能來提升虛擬化的套用水平。比如Tagged TLB技術就能夠在記憶體地址切換時知道TLB與虛擬機的對應關係,提升虛擬機與物理機之間的數據傳送及翻譯轉換效率。除此之外,AMD還提供了如架構遷移、快速虛擬化索引等專門針對虛擬機套用的技術。
在能源管理方面,AMD也有自己一套拿手的方法。比如傳統的PowerNow!技術,通過不同的頻率切換獲得節能效果,並平衡能耗性能的關係;Dual Dynamic Power Management技術則是將CPU電源管理和記憶體控制器電源管理分開,兩者互不干擾,並且可以分別省電;Smart Fetch Technology技術可以暫停處理器中某個閒置核心;CoolCore技術可以關閉處理器不工作的部分,起到節能降溫的作用。
這些節能技術被進一步套用在“伊斯坦堡”處理器上,以提升處理器的性能/功耗比(簡稱能耗比)。根據AMD的數據,雖然“伊斯坦堡”處理器的核心數量增加了,但能耗相比“上海”幾乎沒有變化,用戶不需要更換散熱設備就可以平滑升級至最新的“伊斯坦堡”處理器。在AMD針對未來的另一個演示PPT中,12核心的Magny-Cours相比“伊斯坦堡”的能耗的變化也不大。總的來說,各種能源管理技術為AMD立下的汗馬功勞,如果不是這些出色的節能設計,AMD就不可能在更多核心、更高頻率的設計上繼續邁進。
更多的新技術
除了繼承自“上海”核心的功能外,“伊斯坦堡”也擁有不少屬於自己的獨特改進,提升處理器在更多核心情況下的性能表現。其中比較重要的是以下四項:更高速的HyperTransport(以下簡稱HT)匯流排、APML遠程電源管理界面、X8 ECC和HT Assist探測過濾器。
更高速的HT匯流排
在AMD改用HT匯流排連線多個處理器以及處理器和北橋之後,相比競爭對手之前的前端匯流排架構,明顯獲得了更大的數據頻寬和更低的延遲。不過隨著核心數目的增加,處理器之間的數據交換也越來越頻繁了。這就要求更高速的傳輸匯流排。AMD在“上海”處理器上升級HT匯流排至HT 3.0之後,再次提升了“伊斯坦堡”的匯流排速度。
相比“上海”處理器的HT匯流排頻寬,“伊斯坦堡”核心Opteron處理器升級至最高雙向57.6GB/s頻寬。目前AMD為“伊斯坦堡”配備的HT 3.0匯流排頻率為2.4Ghz,每條頻寬為32bit,因此每條匯流排可以提供2.4x32/8=9.6GB/s的單向頻寬。由於HT 3.0匯流排的雙向傳輸特性,因此單根HT 3.0匯流排可以提供19.2GB/s的雙向頻寬,三根HT 3.0匯流排合計57.6GB/s。
想要發揮“伊斯坦堡”的高速HT匯流排性能,必需要有合適的晶片組來配合。目前速度最快的NVIDIA MCP55晶片組只能提供2.2GHz的HT 3.0匯流排頻率,換算下來匯流排頻寬為52.8GB/s,暫時無法發揮“伊斯坦堡”的最高速度,而AMD針對“伊斯坦堡”設計的沒有瓶頸的“Fiorano”平台會在8月正式發布。
“APML”遠程電源管理界面
對大型伺服器來說,如果需要系統管理員進入每個機器的BIOS或者系統區設定CPU的能耗和節能狀態,無疑是非常複雜和浪費人力的事情。但如果有了“APML”技術,管理員能夠設定CPU主頻的界限、監視系統功耗、修改電源參數等等。對大型數據中心來說,監控設備的功耗對綜合節能來說是有意義的。
相比強大的功能,部署“APML”只需要一顆與處理器相配的BMC(管理處理器),再加上軟體配合,使用起來比較輕鬆,所需費用也很低廉。雖然目前支持“APML”的設備還沒有大量上市,但是它已經得到了大量企業級用戶的歡迎和關注。
正式支持x8 ECC
對於伺服器來說,使用ECC校驗記憶體避免記憶體存取錯誤是理所應當的。不過這種記憶體的顆粒有兩種規格,4bit位寬的為x4顆粒和8bit位寬的為x8顆粒。8bit位寬晶片的好處是能夠用更少的晶片達到更高的位寬。比如同位64bit,x4晶片需要16顆,而x8隻需要8顆。
之前的一些伺服器處理器在支持x8規格的ECC記憶體方面有一些限制,使得用戶在伺服器部署和採購時有所不便。而“伊斯坦堡”徹底解決了該問題,對x4和x8晶片都能良好的支持,進一步方便了用戶的使用。
“HT Assist”探測過濾器
“HT Assist”探測過濾器是“伊斯坦堡”處理器的一個非常重要的改進功能。它能夠極大的減少4核以上處理器的數據查找時間、降低延遲並節省頻寬。
在傳統的四核心處理器中,如果CPU3需要只有CPU1才有權利訪問的數據,那么CPU3會向CPU1提出申請,隨後CPU1會採用廣播的方式查詢最近的數據在那裡,直到找到並傳輸給CPU3。在這個過程中,多個核心會頻繁交流、報告數據情況、複雜的報告傳輸浪費匯流排頻寬,並使得CPU3等待時間大大延長。從CPU3向CPU1發出請求到最後收到數據,耗費10個時鐘周期。
“HT Assist”對這種問題提出了一個非常聰明的解決方法:它給CPU核心中的數據做了一個“目錄”。這個“目錄”存放在大家都可以訪問的L3快取中,大概占用了1MB的空間(可在BIOS中設定)。有了這個“目錄”就輕鬆多了。啟用“HT Assist”後,CPU3向CPU1提出申請,CPU1直接在L3快取中的“目錄表”中找到數據存在在CPU2中,直接向CPU2傳送請求。CPU2收到請求後將數據傳遞給CPU3。全部過程耗費了4個時鐘周期,節約了60%的時間。
根據AMD的測試,採用了“HT Assist”之後,系統頻寬至少節約了60%。雖然占去了1MB L3快取空間,但是更寬的系統頻寬和更低的系統延遲還是顯著增加了效能。而對於雙核心處理器來說,系統本來只有2個核心,互相查找命中率幾乎是100%,無論怎樣都不需要如此複雜的查找過程,因此對雙核心用戶來說“HT Assist”基本沒用。只有在四核心、六核心甚至更多核心的系統中,“HT Assist”才能有效發揮作用,節約頻寬並提高CPU的數據查詢效率。
核心數量優勢
只要軟體最佳化出色,“伊斯坦堡”就可以展現出更強的性能。比如高性能密集型數據計算、大型資料庫、運算量極為沉重的虛擬化套用領域等。特別是在虛擬化套用領域,只要核心設定正確並擁有足夠的系統記憶體,那么“伊斯坦堡”將表現出大大超越“上海”的性能。另外,由於“伊斯坦堡”擁有64KB一級快取和高達512KB的二級快取,因此在一些快取敏感型用戶上的性能表現也會比較出色。
根據AMD數據,“伊斯坦堡”相比同頻率的“上海”處理器,每瓦性能至少提升了34%。這是一個非常了不起的進步。