通用系統接口概述,介紹,QuickPath 代號,Core i7系列處理器與通用系統接口,通用系統接口與Nehalem EX處理器研發計畫,通用系統接口與2009年值得關注的伺服器,
通用系統接口概述
介紹
通用系統接口(CSI)被設計為能夠集成存儲器控制器和分散式共享存儲器。“從Tukwila——1款Itanium處理器以及Nehalem—一1款於2008年推出的具有核心微架構的增強型派生處理器—開始,通用系統接口(CSI)預計可能被用於幾乎所有未來的英特爾系統的內部構造。”
Core i7(酷睿i7)系列處理器主要由Core(處理器核心心)和Uncore(處理器外核心)組成,Core包括四個處理器核心和L1,L2快取,Uncore包括QPI匯流排控制器,記憶體控制器和L3快取。為了區分市場,Core i7 920與Core i7 940的QPI匯流排都被削減為4.8GT/s,而Core i7 Extreme Edition 965則為6.4GT/s。
作為酷睿架構的繼任者,Nehalem可以說是站在了巨人的肩膀上。既秉承了酷睿架構的高效流水線設計以及成熟的製程經驗,又在此基礎上完善了酷睿的不足,並作出了更多的突破。Nehalem帶來的性能飛躍會比當年酷睿上升更多,而它里程碑式的一些革命性設計則會影響甚至引領以後多核處理器的潮流。
Nehalem架構最大的改進之一就是摒棄了FSB前端匯流排傳統的並行傳輸方式,轉而採用基於PCI Express串列點對點傳輸技術的通用系統接口(CSI),也就是intel所稱的Quick Path互聯繫統架構。Quick Path包括集成的記憶體控制器技術以及改善的系統組件間通信鏈路,類似對手AMD的Inter connect及Crossbar設計,而且在多處理器作業下,每顆處理器可以互相傳送數據,並不需經過晶片組,從而大幅提升整體系統性能。
集成記憶體控制器雖然可以提高系統性能,但是由此也會帶來成本增加以及處理器頻率提升困難的問題。但在Nehalem上,就令人驚喜地看到其集成了DDR3記憶體控制器,據intel表示,Nehalem的記憶體頻寬最高可提升3倍!
QuickPath 代號
Nehalem 大部份微架構設計仍是沿自Yorkfield及Wolfdale,並擁有原生四核心設計。最值得注意的一個創新是它的Quickpath結構。新一代Nehalem將會放棄FSB設計,採用全新的Quick Path Interconnect架構,Nehalem是Intel第一款使用Quickpath互聯繫統架構的處理器產品。
QuickPath有二大組成部分。第一部分是記憶體控制器的內建群組件,整合的記憶體控制器能夠縮短處理器和主存儲器間數據傳輸的延遲;第二部分是處理器間的直接連線技術,使晶片能夠共享資料,而且在多處理器作業下,每顆處理器可以互相傳送資料,並不需經過晶片組,從而大幅提升整體系統性能。英特爾的二大晶片系列——主流x86、高端伺服器的安騰都將採用QuickPath技術。
放棄採用FSB設計,改用Quick Path Interconnect技術,能雙向串聯點對點傳輸。QuickPath單向最高速度暫定為6.4GT/s,其傳輸速率是FSB 1333MHz的5倍,雙向最高速合共10.8GT/s,比AMD採用的Hyper-Transport 3.0的速度更高。
Nehalem微架構最高支持4顆處理器的Quick Path多路伺服器環境,並至少可組成四顆處理器的資料可直接互換的4Ways伺服器架構。單一晶片最高可擁有2、4及8顆核心,支持經改良的Hyper-Theading技術,令單顆處理器最高可支持16 Threads,而且Nehalem架構中的Havendale亦將會內建繪圖核心,不讓AMD Fusion處理器專美。新增SSE4.2指令集及ATA指令集也會讓系統性能得到全面提升。
Core i7系列處理器與通用系統接口
Core i7(酷睿i7)系列處理器主要由Core(處理器核心心)和Uncore(處理器外核心)組成,Core包括四個處理器核心和L1,L2快取,Uncore包括QPI匯流排控制器,記憶體控制器和L3快取。為了區分市場,Core i7 920與Core i7 940的QPI匯流排都被削減為4.8GT/s,而Core i7 Extreme Edition 965則為6.4GT/s。
作為酷睿架構的繼任者,Nehalem可以說是站在了巨人的肩膀上。既秉承了酷睿架構的高效流水線設計以及成熟的製程經驗,又在此基礎上完善了酷睿的不足,並作出了更多的突破。Nehalem帶來的性能飛躍會比當年酷睿上升更多,而它里程碑式的一些革命性設計則會影響甚至引領以後多核處理器的潮流。
Nehalem架構最大的改進之一就是摒棄了FSB前端匯流排傳統的並行傳輸方式,轉而採用基於PCI Express串列點對點傳輸技術的通用系統接口(CSI),也就是intel所稱的Quick Path互聯繫統架構。Quick Path包括集成的記憶體控制器技術以及改善的系統組件間通信鏈路,類似對手AMD的Inter connect及Crossbar設計,而且在多處理器作業下,每顆處理器可以互相傳送數據,並不需經過晶片組,從而大幅提升整體系統性能。
集成記憶體控制器雖然可以提高系統性能,但是由此也會帶來成本增加以及處理器頻率提升困難的問題。但在Nehalem上,就令人驚喜地看到其集成了DDR3記憶體控制器,據intel表示,Nehalem的記憶體頻寬最高可提升3倍!
Nehalem的特色之一,三級快取設計。Nehalem處理器重新設計了快取結構,引入了L3快取。Nehalem的L1快取的設計與Core微架構相同,而L2快取則採用超低延遲的設計,但容量大大降低,每個核心僅有256KB,新加入的L3快取採用共享式設計,首批發布的Core i7配備了8MB L3快取。
Nehalem處理器的L3快取完全開放,由4顆核心共享,並完整地集成了4個核,帶有一個包含與共享3級Cache。一個中央佇列在Nehalem的四個核與非核區域之間充當交叉開關和仲裁器。L3Cache集成存儲控制器和QPI連結。從性能的角度看, 包含式L3 Cache是一個理想的結構因為它能在片上事務中保持Cache一致性。相信會在低延遲和低功耗上受益,另外最後一級Canche共享,會降低重複。
通用系統接口與Nehalem EX處理器研發計畫
根據有關資料,Bull打算研發一系列涵蓋安騰處理器和至強處理的晶片組已經有很多年實踐了。Intel宣布將交付一款針對安騰和至強處理器的通用系統接口(Common System Interface,CSI)——也就是人們所知的QPI技術——的訊息再次激發了Bull的這一計畫。
QPI提供了處理器、記憶體和I/O之間的高頻寬和點對點的互連性,與現有Nehalem EP晶片之前的Xeon處理器以及已有的Montvale安騰處理器所採用的前端匯流排架構相比,這種技術不僅速度更高,而且使用更加方便。
最新的發展路線圖是Bull在2006年夏季公布的,當時第一款在理論上採用QPI的四核安騰處理器即將發布。Bull的計畫是利用他們自己的Fame D晶片組將基於Intel E8870的多個四路主機板集成到一起,讓設備能夠擴展到八路甚至更高。
2006修改之後的計畫要求Intel能夠在2008年年中出貨四核Tukwila安騰處理器——這顯然沒有實現——以及使用最新的Fame 2G晶片組作為針對四路、八路或者更大型設備的主晶片組。有趣的是,Bull的這個Fame 2G晶片組計畫是基於Intel未來的至強處理器的。
本來應該出現在更早期至強處理器中的QPI技術已經就緒,即將被用於2009年年底推出的Nehalem EX處理器Beckton版本中。
通用系統接口與2009年值得關注的伺服器
根據相關的資料介紹,Nehalem架構最大的改造在其前端匯流排(FSB)上面,其傳統的並行傳輸方式被廢棄,轉而採用基於基於PCIExpress串列點對點傳輸技術的通用系統接口(CSI),即Intel所稱的QuickPath,與AMD公司此前所推出的HyperTransport(超傳輸匯流排)高速串列匯流排異曲同工。AMD在2009年第一季度所發布的“上海”晶片升級版將會把其HyperTransport升級到3.0版本,提升其頻寬到17.6GB/S。