並行多核體系結構基礎

並行多核體系結構基礎

《並行多核體系結構基礎》是2018年北京機械工業出版社出版的圖書,作者是湯孟岩。

基本介紹

  • 中文名:並行多核體系結構基礎
  • 作者:湯孟岩
  • 譯者:錢德沛、楊海龍
  • 出版社:北京機械工業出版社
  • 出版時間:2018年10月25日
  • 頁數:384 頁
  • 定價:99 元
  • 裝幀:平裝
  • ISBN:9787111610410 
內容簡介,作者簡介,圖書目錄,

內容簡介

並行編程和性能調優對許多程式設計師而言已經成為不可或缺的能力。本書以問題為引導, 系統地講解了並行多核體系結構中的根本問題。第一部分 (第2-4章) 介紹了在共享存儲多處理器中的編程問題, 如編程模型、規則和非規則套用的並行化技術。第二部分 (第5-12章) 介紹了共享存儲多處理器體系結構, 包括存儲層次、設計共享存儲並行多處理器時的基本問題、快取一致性、 存儲致性、 同步、互連網路, 以及圖形處理單元系統的單指令流多執行緒編程模型。本書最後部分提供了對多核體系結構領域專家的訪談記錄, 從專家視角理解並行多核體系結構的發展過程和未來趨勢。
雖然多核現在是主流架構,但很少有教科書涵蓋並行多核體系結構。本書填補了這一空白,為研究生或高級本科體系結構課程提供了所有材料,重點是多核處理器的體系結構。這本書也適合作為從事多核編程或多核晶片設計的專業人員的參考書。

作者簡介

湯孟岩(Yan Solihin),北卡羅來納州立大學電子與計算機工程系教授,長期從事計算機體系結構方向的研究工作。研究興趣包括計算機體系結構、計算機系統建模方法和圖像處理,在計算機體系結構和性能建模領域發表過大量高水平論文,相關研究受到美國國家自然科學基金、Intel、IBM、Samsung、Tekelec、SunMicrosystems和HP的資助。他於2017年被選為IEEE會士,併入選了高性能計算機體系結構國際會議(HPCA)名人堂(2015年)。此外,他還長期從事計算機體系結構的教學工作,具有豐富的教學經驗。創立和領導了針對性能、可靠性和安全的體系結構研究小組,並且開源了大量針對多核體系結構性能建模和性能最佳化的軟體工具。

圖書目錄

譯者序
前言
縮寫詞表
第1章 多核體系結構概述 1
1.1 多核體系結構的由來 2
1.2 並行計算機概述 9
1.2.1 並行計算機的Flynn分類法 12
1.2.2 MIMD並行計算機分類 13
1.3 未來的多核體系結構 14
1.4 習題 18
課堂習題 18
課後習題 18
第2章 並行編程概述 20
2.1 並行程式性能的限制因素 20
2.2 並行編程模型 23
2.2.1 共享存儲與訊息傳遞模型的對比 25
2.2.2 一個簡單的例子 26
2.2.3 其他編程模型 29
2.3 習題 37
課後習題 37
第3章 共享存儲並行編程 39
3.1 並行編程的步驟 39
3.2 依賴分析 40
3.2.1 循環級依賴分析 42
3.2.2 疊代空間遍歷圖和循環傳遞依賴圖 42
3.3 識別循環結構中的並行任務 45
3.3.1 循環疊代間的並行和DOALL並行 45
3.3.2 DOACROSS:循環疊代間的同步並行 46
3.3.3 循環中語句間的並行 48
3.3.4 DOPIPE:循環中語句間的流水線並行 50
3.4 識別其他層面的並行 51
3.5 通過算法知識識別並行 53
3.6 確定變數的範圍 55
3.6.1 私有化 56
3.6.2 歸約變數和操作 57
3.6.3 準則 58
3.7 同步 59
3.8 任務到執行緒的映射 60
3.9 執行緒到處理器的映射 64
3.10 OpenMP概述 67
3.11 習題 72
課堂習題 72
課後習題 77
第4章 針對鏈式數據結構的並行編程 79
4.1 LDS並行化所面臨的挑戰 79
4.2 LDS並行化技術 80
4.2.1 計算並行化與遍歷 80
4.2.2 針對數據結構的操作並行化 82
4.3 針對鍊表的並行化技術 89
4.3.1 讀操作之間的並行 89
4.3.2 LDS遍歷中的並行 91
4.3.3 細粒度鎖方法 94
4.4 事務記憶體 98
4.5 習題 99
課堂習題 99
課後習題 101
第5章 存儲層次結構概述 103
5.1 存儲層次的意義 103
5.2 高速快取體系結構基礎 104
5.2.1 數據放置策略 105
5.2.2 數據替換策略 109
5.2.3 數據寫策略 111
5.2.4 多級高速快取中的包含策略 113
5.2.5 統一/分立/Banked高速快取和高速快取流水線 117
5.2.6 高速快取定址和旁路轉換緩衝 119
5.2.7 非阻塞式高速快取 121
5.3 高速快取性能 122
5.3.1 高速快取缺失的冪次定律 124
5.3.2 棧距離特性 125
5.3.3 高速快取性能指標 126
5.4 預取 127
5.4.1 步長預取和順序預取 128
5.4.2 多處理器系統中的預取 130
5.5 多核體系結構中的高速快取設計 130
5.6 高速快取的物理組成 131
5.6.1 集中式高速快取 131
5.6.2 分散式高速快取 133
5.6.3 混合式高速快取 133
5.7 高速快取的邏輯組成 135
5.7.1 散列函式 139
5.7.2 改善共享高速快取的距離局部性 140
5.7.3 私有高速快取結構中的容量共享 141
5.8 案例分析 143
5.8.1 IBM Power7的存儲層次 143
5.8.2 AMD Shanghai和Intel Barcelona處理器存儲層次的比較 146
5.9 習題 148
課堂習題 148
課後習題 150
第6章 共享存儲多處理器簡介 152
6.1 快取一致性問題 153
6.2 存儲一致性問題 155
6.3 同步問題 156
6.4 習題 160
課堂習題 160
課後習題 161
第7章 快取一致性基礎 163
7.1 概述 164
7.2 基於匯流排的多處理器快取一致性問題 168
7.2.1 “寫直達”快取的一致性協定 168
7.2.2 “寫回”快取的MSI協定 170
7.2.3 “寫回”快取的MESI協定 175
7.2.4 “寫回”快取的MOESI協定 178
7.2.5 “寫回”快取基於更新的協定 183
7.3 快取設計對快取一致性性能的影響 186
7.4 性能及其他實際問題 187
7.4.1 預取和一致性缺失 187
7.4.2 多級快取 187
7.4.3 偵聽過濾 189
7.5 點對點互連網路上的廣播式協定 189
7.6 習題 203
課堂習題 203
課後習題 207
第8章 對同步的硬體支持 209
8.1 鎖的實現 209
8.1.1 對鎖實現性能的評估 209
8.1.2 對原子指令的需求 210
8.1.3 TS鎖 212
8.1.4 TTSL 214
8.1.5 LL/SC鎖 215
8.1.6 Ticket鎖 218
8.1.7 ABQL 219
8.1.8 各種鎖實現的量化比較 221
8.2 柵障的實現 222
8.2.1 翻轉感應集中式柵障 223
8.2.2 組合樹柵障 225
8.2.3 硬體柵障實現 225
8.3 事務記憶體 227
8.4 練習 232
課堂習題 232
課後習題 236
第9章 存儲一致性模型 238
9.1 程式設計師的直覺 238
9.2 保證順序一致性的體系結構機制 242
9.2.1 在基於匯流排的多處理器中基本的SC實現 242
9.2.2 改善SC性能的技術 244
9.3 鬆弛的一致性模型 246
9.3.1 安全網 246
9.3.2 處理器一致性 246
9.3.3 弱序 248
9.3.4 釋放一致性 250
9.3.5 惰性釋放一致性 253
9.4 不同存儲一致性模型中的同步 254
9.5 習題 256
課堂習題 256
課後習題 260
第10章 高級快取一致性設計 262
10.1 目錄式一致性協定 262
10.2 目錄式一致性協定概覽 262
10.3 目錄式快取一致性協定基礎 268
10.4 實現正確性和性能 272
10.4.1 由目錄狀態不同步引起的競爭處理 272
10.4.2 由對請求非實時處理引起的競爭處理 274
10.4.3 寫傳播和事務串列化 280
10.4.4 同步支持 281
10.4.5 存儲一致性模型 282
10.5 當前設計問題 283
10.5.1 處理不精確的目錄信息 283
10.5.2 一致性粒度 286
10.5.3 系統劃分 288
10.5.4 加速執行緒遷移 289
10.6 習題 291
課堂習題 291
課後習題 293
第11章 互連網路體系結構 295
11.1 鏈路、信道和延遲 296
11.2 網路拓撲 298
11.3 路由策略和算法 302
11.4 路由器體系結構 312
11.5 案例研究:Alpha 21364網路體系結構 315
11.6 多核設計的問題 317
11.7 習題 319
課堂習題 319
課後習題 321
第12章 SIMT體系結構 323
12.1 SIMT編程模型 323
12.2 將SIMT工作負載映射到SIMT核上 325
12.3 SIMT核體系結構 326
12.3.1 標量ISA 326
12.3.2 SIMD化/向量化:Warp構造 326
12.3.3 細粒度多執行緒(Warp級並行) 328
12.3.4 微體系結構 328
12.3.5 流水線執行 329
12.3.6 控制流處理 330
12.3.7 記憶體系統 331
12.4 習題 334
課堂習題 334
課後習題 335
第13章 專家訪談 337
參考文獻 356
索引 361
· · · · · ·

相關詞條

熱門詞條

聯絡我們