《雲計算:科學與工程實踐指南》是2018年機械工業出版社出版的圖書,作者是[美]伊恩·福斯特(Ian Foster) 、丹尼斯 B. 甘農(Dennis B. Gannon)。
基本介紹
- 書名:雲計算:科學與工程實踐指南
- 作者:[美]伊恩·福斯特(Ian Foster) 、丹尼斯 B. 甘農(Dennis B. Gannon)
- ISBN:9787111606727
- 定價:69元
- 出版社:機械工業出版社
- 出版時間:2018年9月
- 開本:16開
內容簡介,圖書目錄,
內容簡介
本書向科學家、工程師和學生介紹雲計算,內容涵蓋雲計算的支撐技術、解決雲技術問題的新方法,以及將雲服務集成到科學工作中所需要的概念。具體包括:管理雲中的數據,以及如何對這些服務進行編程;在雲計算中,從部署單一虛擬機或容器到支持基本的互動式科學實驗,從而收集機器集群的數據以進行分析;將雲作為自動化分析程式、機器學習和分析流數據的平台;用開源軟體構建自己的雲;雲安全。
圖書目錄
出版者的話
譯者序
前言
致謝
第1章 在雲的宇宙中定位 1
1.1 云:計算機、助理和平台 1
1.2 雲的概況 2
1.3 本書導讀 5
1.4 獲取雲服務的方式:網站、套用編程接口和軟體開發工具包 6
1.4.1 Web界面、套用編程接口、軟體開發工具包和命令行界面 6
1.4.2 本地套用和雲套用 8
1.5 本書使用的工具 8
1.5.1 Python 8
1.5.2 Jupyter:基於Web的互動式計算工具 9
1.5.3 版本控制系統GitHub 10
1.5.4 Globus 10
1.6 小結 10
1.7 資源 11
第一部分 管理雲中的數據
第2章 存儲即服務 15
2.1 三個啟發式的例子 15
2.2 存儲模型 16
2.2.1 檔案系統 16
2.2.2 對象存儲 17
2.2.3 關係型資料庫 17
2.2.4 NoSQL資料庫 18
2.2.5 圖資料庫 19
2.2.6 數據倉庫 20
2.3 雲存儲全景 20
2.3.1 檔案系統 20
2.3.2 對象存儲 21
2.3.3 NoSQL服務 21
2.3.4 關係型資料庫 22
2.3.5 基於數據倉庫的數據分析 22
2.3.6 圖資料庫及其他服務 23
2.3.7 OpenStack存儲服務和Jetstream雲服務 23
2.4 小結 24
2.5 資源 24
第3章 使用雲存儲服務 25
3.1 兩種訪問方式:門戶和API 25
3.2 使用Amazon雲存儲服務 26
3.3 使用Microsoft Azure雲存儲服務 28
3.4 使用Google雲存儲服務 31
3.4.1 Google Bigtable 32
3.4.2 Google Cloud Datastore 33
3.5 使用OpenStack雲存儲服務 34
3.6 用Globus傳輸和共享數據 35
3.6.1 用Globus傳輸數據 36
3.6.2 用Globus共享數據 38
3.7 小結 38
3.8 資源 39
第二部分 雲中的計算
第4章 計算即服務 43
4.1 虛擬機和容器 43
4.2 先進的計算服務 45
4.3 無伺服器計算 46
4.4 公有雲計算的優缺點 46
4.5 小結 47
4.6 資源 48
第5章 虛擬機的使用和管理 49
5.1 歷史根源 49
5.2 亞馬遜的彈性計算雲 50
5.2.1 創建虛擬機實例 50
5.2.2 連線存儲 52
5.3 Azure虛擬機 54
5.4 谷歌雲虛擬機服務 55
5.5 Jetstream虛擬機服務 55
5.6 小結 56
5.7 資源 57
第6章 使用和管理容器 58
6.1 容器的基礎知識 58
6.2 Docker和Hub 59
6.3 容器用於科學 61
6.4 構建你自己的容器 62
6.5 小結 63
6.6 資源 63
第7章 彈性部署 64
7.1 雲中並行計算的範式 64
7.2 SPMD和HPC風格的並行 65
7.2.1 雲中的訊息傳遞接口 65
7.2.2 雲中的GPU 65
7.2.3 在Amazon雲上部署HPC集群 67
7.2.4 在Azure上部署HPC集群 70
7.2.5 集群的進一步擴展 71
7.3 多任務並行計算 72
7.4 MapReduce和批量同步並行計算 72
7.5 圖數據流的執行和Spark 73
7.6 代理和微服務 74
7.6.1 微服務和容器資源管理器 75
7.6.2 在集群中管理身份 75
7.6.3 簡單的例子 75
7.6.4 Amazon EC2容器服務 76
7.6.5 Google的Kubernetes 81
7.6.6 Mesos和Mesosphere 84
7.7 HTCondor 86
7.8 小結 86
7.9 資源 87
第三部分 雲平台
第8章 雲中的數據分析 91
8.1 Hadoop和YARN 91
8.2 Spark 93
8.2.1 一個簡單的Spark程式 93
8.2.2 一個更有趣的Spark程式:k均值聚類 94
8.2.3 容器中的Spark 95
8.2.4 Spark中的SQL 96
8.3 Amazon Elastic MapReduce 97
8.4 Azure HDInsight和數據湖 99
8.4.1 Azure Data Lake存儲 100
8.4.2 數據湖分析 101
8.5 Amazon Athena分析 102
8.6 Google雲數據實驗室 102
8.6.1 華盛頓和印第安納州的風疹 103
8.6.2 尋找氣象台的異常 104
8.7 小結 107
8.8 資源 107
第9章 將數據以流式傳輸到雲端 109
9.1 科學流案例 109
9.1.1 廣域地球物理感測器網路 110
9.1.2 城市信息學 110
9.1.3 大規模科學數據流 111
9.2 流系統的基本設計挑戰 112
9.3 Amazon Kinesis和Firehose 112
9.3.1 Kinesis Streams架構 113
9.3.2 Kinesis和Amazon SQS 114
9.4 Kinesis、Spark和物體陣列 115
9.5 用Azure進行流數據處理 118
9.6 Kafka、Storm和Heron Streams 121
9.7 Google Dataflow和Apache Beam 124
9.8 Apache Flink 126
9.9 小結 127
9.10 資源 128
第10章 基於雲的機器學習 129
10.1 Spark機器學習庫 129
10.1.1 邏輯回歸 130
10.1.2 芝加哥餐廳案例 130
10.2 Azure機器學習空間 133
10.3 Amazon機器學習平台 136
10.4 深度學習淺析 138
10.4.1 深度網路 139
10.4.2 卷積神經網路 140
10.4.3 遞歸神經網路 141
10.5 Amazon MXNet虛擬機鏡像 143
10.6 Google TensorFlow 146
10.7 微軟認知工具包 147
10.8 小結 149
10.9 資源 150
第11章 Globus研究數據管理平台 152
11.1 分散式數據的挑戰和機遇 152
11.2 Globus平台 153
11.2.1 Globus傳輸和共享 153
11.2.2 rule_data結構 155
11.3 身份和證書管理 155
11.3.1 Globus Auth授權服務 156
11.3.2 一個典型的Globus Auth工作流 157
11.3.3 Globus Auth身份 158
11.3.4 Globus賬戶 159
11.3.5 使用Globus Auth身份 159
11.3.6 資源伺服器使用Globus Auth 160
11.3.7 其他Globus能力 161
11.4 創建一個遠程訪問服務 162
11.5 數據研究門戶設計模式 163
11.5.1 Science DMZ和DTN的至關重要的作用 164
11.5.2 數據研究門戶套用 164
11.5.3 用Globus實現設計模式 166
11.6 重新審視門戶設計模式 168
11.7 畫個閉環:從門戶到Graph服務 169
11.8 小結 170
11.9 資源 171
第四部分 構建你自己的雲
第12章 用Eucalyptus構建你自己的雲 175
12.1 實現雲基礎設施抽象 175
12.2 部署計畫 176
12.2.1 控制臺部署流程 176
12.2.2 網路 177
12.2.3 存儲 177
12.2.4 計算伺服器 178
12.2.5 身份管理 178
12.3 單集群Eucalyptus雲 178
12.3.1 硬體配置 179
12.3.2 部署 179
12.3.3 軟體依賴關係和配置 180
12.3.4 安裝 181
12.3.5 頭節點配置 182
12.3.6 工作節點配置 183
12.3.7 引導啟動 183
12.3.8 鏡像安裝 186
12.3.9 用戶證書 187
12.4 小結 187
12.5 資源 187
第13章 使用OpenStack搭建雲 188
13.1 OpenStack核心服務 188
13.2 OpenStack環境中的高性能計算 188
13.3 對科學負載的考慮 189
13.3.1 網路密集輸入或輸出 189
13.3.2 緊耦合計算 190
13.3.3 分級存儲和並行檔案系統 190
13.4 部署OpenStack 191
13.5 部署示例 191
13.5.1 硬體組件 192
13.5.2 OpenStack組件 192
13.5.3 通過RDMA啟用塊存儲 192
13.5.4 啟用SR-IOV網路 193
13.6 小結 196
13.7 資源 196
第14章 構建你自己的SaaS 197
14.1 SaaS的意義 197
14.2 SaaS架構 198
14.3 SaaS和科學 200
14.4 Globus Genomics生物信息學系統 200
14.4.1 Globus Genomics架構和實現 201
14.4.2 Globus Genomics作為SaaS 203
14.5 Globus研究數據管理服務 203
14.5.1 Globus服務架構 204
14.5.2 Globus服務運營 205
14.6 小結 205
14.7 資源 205
第五部分 安全及其他主題
第15章 安全和隱私 209
15.1 雲計算中的安全 209
15.2 基於角色的訪問控制 212
15.3 保障雲中數據的安全 212
15.3.1 保障傳輸中的數據安全 213
15.3.2 控制誰能訪問數據 213
15.3.3 加密數據 213
15.3.4 敏感數據的複雜性 214
15.4 保障虛擬機和容器安全 215
15.4.1 含毒的虛擬機或容器鏡像 215
15.4.2 對運行虛擬機的非法訪問 215
15.4.3 截獲通信 216
15.4.4 基於虛擬機鏡像的信息泄露 216
15.5 保障雲軟體服務的訪問 217
15.6 小結 217
15.7 資源 217
第16章 歷史,批評,未來 219
16.1 歷史視角 219
16.2 批評 220
16.2.1 成本 221
16.2.2 鎖定 221
16.2.3 教育 221
16.2.4 黑盒算法 222
16.2.5 硬體限制 222
16.3 未來 222
16.3.1 原生雲應用程式 222
16.3.2 架構演變 223
16.3.3 邊緣計算 224
16.4 資源 225
第17章 Jupyter筆記本 226
17.1 環境 226
17.2 筆記本 226
17.3 資源 228
第18章 後記:科學發現雲 229
參考文獻