高性能計算:現代系統與套用實踐

《高性能計算:現代系統與套用實踐》是2020年機械工業出版社出版的圖書。

基本介紹

  • 中文名:高性能計算:現代系統與套用實踐
  • 出版時間:2020年5月
  • 出版社:機械工業出版社
  • ISBN:9787111645795
內容簡介,圖書目錄,

內容簡介

本書內容全面且易學易懂,不僅涵蓋高性能計算的基礎概念和知識點,同時重視核心技能的培養。通過閱讀本書:研究者將學習如何將超級計算機作為尋求新知識的重要工具;新手工程師將體驗超級計算機如何運用高性能計算系統和方法來設計和模擬創新產品;學生將會了解未來高性能計算研究和開發的可能方向,為職業生涯做好準備;商用集群的維護和管理者將在掌握高性能計算系統的功能的基礎上,學習如何更好地使用它們。

圖書目錄

譯者序
序言
前言
致謝
第1章 緒論 1
1.1 高性能計算學科 2
1.1.1 定義 3
1.1.2 應用程式 3
1.1.3 性能和指標 3
1.1.4 高性能計算系統 4
1.1.5 超算問題 6
1.1.6 套用編程 7
1.2 超算對科學、社會和安全的影響 8
1.2.1 促進欺詐檢測和市場數據分析 8
1.2.2 發現、管理和分配石油和天然氣 8
1.2.3 加快製造業的創新 9
1.2.4 個性化醫藥和藥物發現 9
1.2.5 預測自然災害和了解氣候變化 10
1.3 超級計算機剖析 11
1.4 計算機性能 13
1.4.1 性能 13
1.4.2 峰值性能 13
1.4.3 持續性能 14
1.4.4 可擴展性 15
1.4.5 性能退化 15
1.4.6 性能提升 17
1.5 超級計算機簡史 17
1.5.1 個階段—利用機械技術的自動計算機 18
1.5.2 第二個階段—真空管時代的馮·諾依曼架構 19
1.5.3 第三個階段—指令級並行 23
1.5.4 第四個階段—向量處理和積分 24
1.5.5 第五個階段—單指令多數據陣列 27
1.5.6 第六個階段—順序處理器的通信和超大規模積體電路 27
1.5.7 第七個階段—多核和千萬億次 30
1.5.8 新數字時代和超越摩爾定律 30
1.6 作為學生的指南和工具 31
1.7 本章小結及成果 32
1.8 練習 33
參考文獻 34
第2章 HPC架構:系統和技術 35
2.1 引言 35
2.2 HPC架構的關鍵特性 36
2.2.1 速度 36
2.2.2 並行性 36
2.2.3 效率 37
2.2.4 功率 37
2.2.5 可靠性 38
2.2.6 可程式性 38
2.3 並行架構家族—弗林分類法 39
2.4 支持技術 41
2.4.1 技術階段 41
2.4.2 技術的角色 44
2.4.3 數字邏輯 45
2.4.4 存儲技術 47
2.5 馮·諾依曼順序處理器 50
2.6 向量和流水線 52
2.6.1 流水線並行 53
2.6.2 向量處理 55
2.7 單指令多數據陣列 56
2.7.1 單指令多數據架構 56
2.7.2 阿姆達定律 57
2.8 多處理器 59
2.8.1 共享記憶體多處理器 60
2.8.2 大規模並行處理器 62
2.8.3 商品集群系統 62
2.9 異構計算機結構 63
2.10 本章小結及成果 64
2.11 練習 65
參考文獻 67
第3章 商品集群 68
3.1 引言 68
3.1.1 商品集群的定義 68
3.1.2 集群的動機和理由 69
3.1.3 集群元素 70
3.1.4 對500強名單的影響 70
3.1.5 簡史 71
3.1.6 章節指南 73
3.2 Beowulf集群項目 74
3.3 硬體架構 76
3.3.1 節點 76
3.3.2 系統區域網路 77
3.3.3 輔助存儲 78
3.3.4 商業系統摘要 78
3.4 編程接口 78
3.4.1 高性能計算程式設計語言 78
3.4.2 並行編程模式 80
3.5 軟體環境 80
3.5.1 作業系統 80
3.5.2 資源管理 82
3.5.3 調試器 83
3.5.4 性能分析 84
3.5.5 可視化 85
3.6 基本使用方法 86
3.6.1 登錄 86
3.6.2 用戶空間和目錄系統 87
3.6.3 包的配置和構建 92
3.6.4 編譯器和編譯 93
3.6.5 運行應用程式 94
3.7 本章小結及成果 94
3.8 練習 95
參考文獻 95
第4章 基準測試程式 97
4.1 引言 97
4.2 HPC基準測試程式的關鍵屬性 100
4.3 標準的HPC社區的基準測試程式 101
4.4 高度並行計算的Linpack 102
4.5 HPC挑戰基準測試套件 104
4.6 高性能共軛梯度 106
4.7 NAS並行基準測試程式 110
4.8 Graph500 111
4.9 小型套用作為基準測試程式 115
4.10 本章小結及成果 116
4.11 練習 117
參考文獻 118
第5章 資源管理的基礎 119
5.1 資源管理 119
5.2 SLURM的基礎 123
5.2.1 架構概述 123
5.2.2 工作負載的組織 124
5.2.3 SLURM調度 125
5.2.4 SLURM命令概要 127
5.2.5 SLURM作業腳本 141
5.2.6 SLURM速查表 146
5.3 攜帶型批量系統基礎 147
5.3.1 PBS概述 147
5.3.2 PBS架構 148
5.3.3 PBS命令概要 148
5.3.4 PBS作業腳本 158
5.3.5 PBS速查表 160
5.4 本章小結及成果 161
5.5 練習 162
參考文獻 163
第6章 對稱多處理器架構 164
6.1 引言 164
6.2 架構概覽 165
6.3 阿姆達定律 168
6.4 處理器核心的架構 171
6.4.1 執行流水線 172
6.4.2 指令級並行 173
6.4.3 分支預測 173
6.4.4 直通 174
6.4.5 保留站 174
6.4.6 多執行緒 174
6.5 存儲層次 175
6.5.1 數據重用和局部性 175
6.5.2 存儲層次結構 176
6.5.3 存儲系統的性能 178
6.6 PCI匯流排 180
6.7 外部I/O接口 184
6.7.1 網路接口控制器 184
6.7.2 串列高級技術附屬檔案 185
6.7.3 JTAG 187
6.7.4 通用串列匯流排 189
6.8 本章小結及成果 190
6.9 練習 191
參考文獻 192
第7章 OpenMP的基礎 194
7.1 引言 194
7.2 OpenMP編程模型概覽 195
7.2.1 執行緒並行 195
7.2.2 執行緒變數 197
7.2.3 運行時庫與環境變數 197
7.3 並行執行緒和循環 199
7.3.1 並行執行緒 199
7.3.2 私有 200
7.3.3 並行“for”語句 200
7.3.4 塊 206
7.4 同步 208
7.4.1 臨界同步指令 208
7.4.2 master指令 209
7.4.3 barr

相關詞條

熱門詞條

聯絡我們