《片上網路原理與設計》是於2017年1月機械工業出版社出版的一本圖書,作者是王志英。
基本介紹
- 書名:片上網路原理與設計
- 作者:王志英
- 出版社:機械工業出版社
- 出版時間:2017年1月
內容簡介,作者簡介,圖書目錄,
內容簡介
國內首部片上網路領域學術專著
國防科技大學王志英教授領銜撰寫,全景呈現其科研團隊國際領先的研究方法和研究成果
面對眾核處理器時代的新挑戰,片上網路將報文交換思想引入晶片內部,這已成為事實上的片上通信標準,並且直接決定著未來計算機體系結構的發展方向。本書基於以通信為核心的跨層次最佳化方法,涵蓋大量有趣的課題,既闡明了片上網路的基本原理,也為解決當下的設計難題帶來了啟示。
作者簡介
王志英 國防科技大學計算機學院教授、博士生導師,1992年成為國家級突出貢獻中青年專家並享受政府特殊津貼。現任教育部計算機類專業教學指導委員會副主任、全國高校計算機教育研究會理事長、中國計算機學會教育專委會副主任。
圖書目錄
第1章 緒論2
1.1 眾核處理器時代2
1.2 以通信為核心的跨層次最佳化3
1.3 片上網路簡介5
1.3.1拓撲結構6
1.3.2 路由算法7
1.3.3 流控機制8
1.3.4 路由器微結構10
1.3.5 性能評價指標13
1.4 片上網路研究現狀14
1.4.1 拓撲結構的研究14
1.4.2 單播通信路由的研究15
1.4.3 聚合通信路由的研究16
1.4.4 流控機制的研究17
1.4.5 路由器微結構的研究18
1.5 真實處理器的片上網路19
1.5.1 MIT RAW處理器19
1.5.2 Tilera TILE64處理器21
1.5.3 Sony/Toshiba/IBM Cell處理器23
1.5.4 U. T. Austion TRIPS處理器24
1.5.5 Intel Teraflops處理器26
1.5.6 Intel SCC處理器27
1.5.7 Intel Larrabee處理器29
1.5.8 Intel Knights Corner處理器30
1.5.9 真實處理器片上網路特性總結32
1.6 全書內容概述34
1.7 參考文獻36
第二部分 邏輯層實現
第2章 單周期翼通道路由器結構48
2.1 引言48
2.2 翼通道路由器體系結構50
2.2.1 翼通道單周期路由器總體結構50
2.2.2 翼通道工作原理55
2.3 路由器微體系結構設計58
2.3.1 通道分配部件58
2.3.2 快速仲裁部件60
2.3.3 SIG管理單元和SIG控制單元61
2.4 實驗評估62
2.4.1 模擬環境62
2.4.2 流水線延遲分析63
2.4.3 延遲與吞吐率64
2.4.4 面積與功耗67
2.5 本章小結68
2.6 參考文獻69
第3章 動態虛通道路由器71
3.1 引言71
3.2 擁塞感知的動態虛通道結構72
3.2.1 動態虛通道72
3.2.2 擁塞緩解策略74
3.3 擁塞感知的多連線埠共享緩衝結構75
3.3.1 多連線埠共享緩衝的動態虛通道75
3.3.2 擁塞緩解策略78
3.4 DVC路由器微結構78
3.4.1 虛通道控制部件79
3.4.2 擁塞緩解電路81
3.4.3 虛通道仲裁部件與開關仲裁部件82
3.5 HiBB路由器微結構84
3.5.1 虛通道控制部件85
3.5.2 虛通道仲裁部件與輸出連線埠仲裁部件86
3.5.3 虛通道調整結構88
3.6 實驗評估89
3.6.1 DVC路由器評估89
3.6.2 HiBB路由器評估92
3.7 本章小結95
3.8 參考文獻96
第4章 虛擬匯流排拓撲結構98
4.1 引言98
4.2 相關研究99
4.3 研究動機100
4.3.1 基本片上通信網路100
4.3.2 片上網路問題分析101
4.3.3 基於事務的匯流排通信優勢103
4.4 虛擬匯流排片上網路103
4.4.1 拓撲結構103
4.4.2 虛擬匯流排機制105
4.4.3 餓死與死鎖避免111
4.4.4 VBON路由器結構111
4.5 實驗評估112
4.5.1 模擬框架113
4.5.2 合成流量評估115
4.5.3 真實套用評估118
4.5.4 功耗分析119
4.5.5 開銷分析119
4.6 本章小結120
4.7 參考文獻120
第三部分 網路層路由和流控設計
第5章 區域隔離路由算法124
5.1 引言124
5.2 相關研究126
5.3 研究動機127
5.3.1 局部自適應算法的局限性128
5.3.2 應用程式內部的干擾129
5.3.3 應用程式之間的干擾130
5.4 區域隔離路由算法131
5.4.1 擁塞信息傳播網路132
5.4.2 DBAR路由器微結構134
5.4.3 路由函式設計136
5.5 實驗評估139
5.5.1 路由函式評估140
5.5.2 單區域性能142
5.5.3 多區域性能145
5.5.4 集中型格線網路性能148
5.6 硬體開銷討論151
5.6.1 連線資源151
5.6.2 路由器開銷151
5.6.3 功耗和能量延遲積151
5.7 進一步討論152
5.7.1 擁塞信息傳播網路頻寬152
5.7.2 DBAR的可擴展性153
5.7.3 擁塞信息傳播延遲153
5.8 本章小結153
5.9 參考文獻153
第6章 完全自適應路由算法的流控機制158
6.1 引言158
6.2 相關研究161
6.2.1 死鎖避免理論161
6.2.2 完全自適應路由算法設計162
6.3 研究動機162
6.3.1 虛通道分配策略162
6.3.2 路由靈活性163
6.4 流控和路由設計165
6.4.1 全報文傳送165
6.4.2 逃逸虛通道的積極分配策略168
6.4.3 完全自適應路由算法171
6.4.4 路由器微結構171
6.5 合成流量模式評測173
6.5.1 合成流量模式結果174
6.5.2 路由算法的快取利用率176
6.5.3 敏感性分析178
6.6 真實應用程式評測181
6.6.1 實驗方法和實驗配置182
6.6.2 PARSEC測試集結果182
6.7 流控機制的詳細分析183
6.7.1 快取利用率的詳細分析183
6.7.2 流控機制的公平性分析187
6.8 進一步討論189
6.8.1 報文長度和虛通道深度189
6.8.2 DAMQ和混合流控機制190
6.9 本章小結190
6.10 參考文獻190
第7章 切片氣泡流控機制195
7.1引言195
7.2傳統設計的局限197
7.2.1dateline197
7.2.2本地氣泡策略198
7.2.3關鍵氣泡策略198
7.2.4處理變長報文的低效性199
7.3切片氣泡流控機制及策略200
7.3.1理論描述200
7.3.2本地切片氣泡策略202
7.3.3關鍵切片氣泡策略202
7.3.4餓死現象203
7.4路由器流水線和微結構205
7.4.1FBFC路由器205
7.4.2VCT路由器206
7.5實驗方法207
7.6一維Torus網路性能評測208
7.6.1性能208
7.6.2快取利用率210
7.6.3短報文和長報文的傳輸延遲211
7.7二維Torus網路性能評測212
7.7.14×4 Torus網路性能212
7.7.2單切片報文比例敏感性分析214
7.7.3快取數量敏感性分析215
7.7.48×8 Torus網路可擴展性分析216
7.7.5餓死現象分析217
7.7.6PARSEC測試集實驗結果219
7.7.7大規模系統和訊息傳遞編程模式220
7.8開銷:功耗和面積221
7.8.1測試方法學222
7.8.2功耗222
7.8.3面積225
7.8.4與格線網路的比較226
7.9進一步討論和相關工作229
7.9.1進一步討論229
7.9.2相關工作229
7.10本章小結230
7.11參考文獻231
第8章 高效能與公平性流控235
8.1基於當值快取高效能路由器設計235
8.1.1引言235
8.1.2高效能路由器236
8.1.3實驗設計240
8.1.4實驗評估241
8.1.5小結243
8.2基於報文剩餘跳數的自適應流控244
8.2.1引言244
8.2.2報文之間的相互作用245
8.2.3公平性流控246
8.2.4實驗評估249
8.2.5小結252
8.3參考文獻253
第四部分 軟體層編程模式支持
第9章 一致性協定聚合通信支持256
9.1引言256
9.2歸約訊息組合框架259
9.2.1訊息組合表格式260
9.2.2訊息組合實例260
9.2.3訊息組合表項的不足262
9.3均衡自適應多播路由算法262
9.4路由器流水線和微結構264
9.5實驗評估266
9.5.1性能267
9.5.2BAM和RPM多播虛擬網路性能271
9.5.3訊息組合表大小272
9.5.4敏感性分析274
9.6功耗和能量延遲積分析276
9.7相關研究277
9.7.1訊息組合277
9.7.2片上網路多播路由算法278
9.8本章小結278
9.9參考文獻279
第10章 MPI原語的定製通信架構283
10.1引言283
10.2研究背景284
10.3研究動機286
10.3.1在NoC上實現MPI286
10.3.2MPI函式最佳化286
10.4定製通信架構287
10.4.1體系結構概述287
10.4.2定製的片上網路設計:VBON288
10.4.3MPI原語實現:MU288
10.5實驗評估295
10.5.1方法295
10.5.2實驗結果297
10.6本章小結303
10.7參考文獻304
第11章 MPI通信協定最佳化308
11.1引言308
11.2研究背景309
11.2.1MPI的通信協定309
11.2.2現存問題310
11.2.3相關工作313
11.3研究動機314
11.4自適應通信協定315
11.4.1目標與方法315
11.4.2基本MPI加速的片上網路設計316
11.4.3ADCM結構的支持318
11.4.4與理想協定的比較323
11.5實驗評估324
11.5.1方法324
11.5.2合成流量結果326
11.5.3真實應用程式328
11.5.4敏感性分析330
11.5.5硬體開銷331
11.6本章小結331
11.7參考文獻332
第五部分 後記
第12章 結語與展望336
12.1結語336
12.2展望338