大數據技術體系與開源生態

大數據技術體系與開源生態

《大數據技術體系與開源生態》是2019年6月人民郵電出版社出版的圖書,作者是劉馳。

基本介紹

  • 中文名:大數據技術體系與開源生態
  • 作者:劉馳
  • ISBN:9787115492234
  • 頁數:356頁
  • 定價:159元
  • 出版社:人民郵電出版社
  • 出版時間:2019年6月
  • 裝幀:平裝
  • 開本:小16開
內容簡介,圖書目錄,

內容簡介

本書從大數據生命周期的角度闡述大數據技術體系與開源生態的發展。全書分為7篇,包括大數據技術體系與開源生態概述、大數據獲取技術、大數據管理技術、大數據處理技術、大數據分析與挖掘技術、大數據可視化與互動技術、大數據安全與治理技術。又分為15章,詳細介紹大數據的技術概況、發展近況和技術優勢、軟體架構、和套用場景等內容。
本書適合大數據和人工智慧業內人員、各大高校相關專業的高年級本科生和研究生、以及對大數據套用中各類框架組件的愛好者閱讀。

圖書目錄

第 一篇 大數據技術體系與開源生態概述
第 1章 大數據技術體系概述 3
1.1 大數據技術的主要內容 3
1.2 大數據開源框架 4
1.2.1 大數據獲取技術 4
1.2.2 大數據管理技術 5
1.2.3 大數據處理技術 5
1.2.4 大數據安全與治理技術 5
1.2.5 大數據分析與挖掘技術 6
1.2.6 大數據可視化技術 6
1.3 本章小結 7
第 2章 開源生態與代碼託管平台簡介 8
2.1 開源和開源軟體的簡介 8
2.1.1 開源的簡介 8
2.1.2 開源軟體的簡介 8
2.2 開原始碼託管平台——GitHub 9
2.3 本章小結 10
第3章 大數據開源生態的介紹 11
3. 1 Apache軟體基金會 11
3.1.1 發展歷史 11
3.1.2 主要參與者 12
3.1.3 開源項目 13
3.2 Linux 基金會 14
3.2.1 發展歷史 15
3.2.2 主要參與者 15
3.2.3 開源項目 17
3.3 開源中國 18
3.3.1 發展歷史 18
3.3.2 主要參與者 19
3.4 本章小結 19
第4章 雲計算開源生態的介紹 20
4.1 OpenStack 基金會 20
4.1.1 發展歷史 21
4.1.2 主要參與者 21
4.1.3 開源項目 22
4.2 Cloud Native Computing Foundation 23
4.2.1 發展歷史 23
4.2.2 主要參與者 23
4.2.3 開源項目 25
4.3 本章小結 25
第二篇 大數據獲取技術
第5章 訊息佇列相關技術 29
5.1 ZeroMQ 29
5.1.1 技術概況 29
5.1.2 發展近況和技術優勢 30
5.1.3 軟體架構 31
5.1.4 套用場景 33
5.2 RabbitMQ 34
5.2.1 技術概況 34
5.2.2 發展近況和技術優勢 35
5.2.3 軟體架構 36
5.2.4 套用場景 38
5.3 Active MQ 40
5.3.1 技術概況 40
5.3.2 發展近況和技術優勢 40
5.3.3 軟體架構 42
5.3.4 套用場景 43
5.4 Apache Kafka 44
5.4.1 技術概況 44
5.4.2 發展近況和技術優勢 45
5.4.3 軟體架構 46
5.4.4 套用場景 47
5.5 本章小結 50
第三篇 大數據管理技術
第6章 資料庫相關技術 53
6.1 傳統關係型資料庫 53
6.1.1 MySQL 53
6.1.2 PostgreSQL 60
6.2 文檔型資料庫 65
6.2.1 MongoDB 65
6.2.2 Apache CouchDB 69
6.3 列存儲資料庫 73
6.3.1 Vertica 73
6.3.2 Apache HBase 76
6.4 鍵/值對型資料庫 80
6.4.1 Redis 80
6.4.2 Riak 82
6.5 圖形資料庫 85
6.5.1 Neo4j 85
6.5.2 OrientDB 90
6.5.3 InfiniteGraph 93
6.6 基於記憶體的分散式檔案系統之Alluxio 95
6.6.1 技術概況 95
6.6.2 發展近況和技術優勢 96
6.6.3 軟體架構 97
6.6.4 套用場景 98
6.7 數據倉庫系統之ApacheTajo 99
6.7.1 技術概況 99
6.7.2 發展近況和技術優勢 100
6.7.3 軟體架構 101
6.7.4 套用場景 103
6.8 本章小結 105
第7章 大數據平台資源管理技術 106
7.1 Apache ZooKeeper 106
7.1.1 技術概況 106
7.1.2 發展近況和技術優勢 107
7.1.3 軟體架構 108
7.1.4 套用場景 110
7.2 Apache Hadoop YARN 111
7.2.1 技術概況 111
7.2.2 發展近況和技術優勢 112
7.2.3 軟體架構 113
7.2.4 套用場景 116
7.3 Apache Mesos 119
7.3.1 技術概況 119
7.3.2 發展近況和技術優勢 120
7.3.3 軟體架構 120
7.3.4 套用場景 122
7.4 Apache Mnemonic 123
7.4.1 技術概況 123
7.4.2 發展近況和技術優勢 124
7.5 本章小結 125
第四篇 大數據處理技術
第8章 開源批處理平台 129
8.1 Apache Hadoop 129
8.1.1 技術概況 129
8.1.2 發展近況和技術優勢 130
8.1.3 軟體架構 131
8.1.4 套用場景 136
8.2 Apache Spark 142
8.2.1 技術概況 142
8.2.2 發展近況和技術優勢 142
8.2.3 軟體架構 144
8.2.4 套用場景 146
8.3 Apache Kylin 150
8.3. 1 技術概況 150
8.3.2 發展近況和技術優勢 150
8.3.3 軟體架構 152
8.3.4 套用場景 153
8.4 本章小結 159
第9章 開源實時處理平台 160
9.1 Apache Storm 160
9.1.1 技術概況 160
9.1.2 發展近況和技術優勢 161
9.1.3 軟體架構 162
9.1.4 套用場景 163
9.2 Apache Spark Streaming 169
9.2.1 技術概況 169
9.2.2 發展近況和技術優勢 170
9.2.3 軟體架構 170
9.2.4 套用場景 171
9.3 Apache Flink 173
9.3.1 技術概況 173
9.3.2 發展近況和技術優勢 174
9.3.3 軟體架構 175
9.3.4 套用場景 176
9.4 Apache Beam 179
9.4.1 技術概況 179
9.4.2 發展近況和技術優勢 180
9.4.3 軟體架構 181
9.4.4 套用場景 182
9.5 Apache Apex 186
9.5.1 技術概況 186
9.5.2 發展近況和技術優勢 187
9.5.3 軟體架構 188
9.5.4 套用場景 191
9.6 本章小結 194
第五篇 大數據分析與挖掘技術
第 10章 開源數據分析平台 199
10.1 Apache Mahout 199
10.1.1 技術概況 199
10.1.2 發展近況和技術優勢 200
10.1.3 套用場景 202
10.2 Apache Spark MLlib 204
10.2.1 技術概況 204
10.2.2 發展近況和技術優勢 204
10.2.3 軟體架構 205
10.2.4 套用場景 207
10.3 Apache Lens 208
10.3.1 技術概況 208
10.3.2 發展近況及技術優勢 209
10.3.3 軟體架構 213
10.3.4 套用場景 214
10.4 Scikit-Learn 217
10.4.1 技術概況 217
10.4.2 發展近況與技術優勢 217
10.4.3 軟體架構 218
10.4.4 套用場景 220
10.5 本章小結 223
第 11章 開源深度學習平台 225
11.1 TensorFlow 225
11.1.1 技術概況 225
11.1.2 發展近況和技術優勢 226
11.1.3 軟體架構 226
11.1.4 套用場景 230
11.2 Tensorflow Lite 233
11.2.1 技術概況 233
11.2.2 發展近況和技術優勢 233
11.2.3 軟體架構 234
11.3 Caffe 237
11.3.1 技術概述 237
11.3.2 發展近況和技術優勢 237
11.3.3 軟體架構 239
11.3.4 套用場景 241
11.4 PyTorch 243
11.4.1 技術概況 243
11.4.2 發展近況和技術優勢 243
11.4.3 軟體架構 245
11.4.4 套用場景 247
11.5 本章小結 248
第六篇 大數據可視化與互動技術
第 12章 主流大數據可視化與互動工具 251
12.1 Tableau 251
12.1.1 技術概況 251
12.1.2 發展近況和技術優勢 252
12.1.3 軟體架構 255
12.1.4 套用場景 256
12.2 Apache Zeppelin 260
12.2.1 技術概況 260
12.2.2 發展近況和技術優勢 261
12.2.3 軟體架構 262
12.2.4 套用場景 263
12.3 本章小結 266
第 13章 其他大數據可視化與互動工具 267
13.1 Jaspersoft Community 267
13.1.1 技術概況 267
13.1.2 發展近況和技術優勢 268
13.1.3 軟體架構 270
13.1.4 套用場景 271
13.2 BIRT 274
13.2.1 技術概況 274
13.2.2 發展近況和技術優勢 275
13.2.3 軟體架構 278
13.2.4 套用場景 280
13.3 KNIME 281
13.3.1 技術概況 281
13.3.2 發展近況和技術優勢 281
13.3.3 軟體架構 283
13.3.4 套用場景 285
13.4 本章小結 285
第七篇 大數據安全與治理技術
第 14章 大數據治理技術 289
14.1 Apache Falcon 289
14.1.1 技術概況 290
14.1.2 發展近況和技術優勢 290
14.1.3 軟體架構 292
14.1.4 套用場景 294
14.2 Apache Atlas 297
14.2.1 技術概況 298
14.2.2 發展近況和技術優勢 301
14.2.3 軟體架構 306
14.3 本章小結 314
第 15章 大數據安全技術 316
15.1 Apache Ranger 316
15.1.1 技術概況 316
15.1.2 發展近況和技術優勢 318
15.1.3 軟體架構 321
15.1.4 套用場景 322
15.2 Apache Sentry 324
15.2.1 技術概況 324
15.2.2 發展近況和技術優勢 326
15.2.3 軟體架構 332
15.3 Apache Kerberos 334
15.3.1 技術概況 335
15.3.2 發展近況和技術優勢 336
15.3.3 軟體架構 337
15.4 Apache Metron 339
15.4.1 技術概況 339
15.4.2 發展近況及技術優勢 340
15.4.3 軟體架構 344
15.5 Hyperledger 346
15.5.1 技術概況 346
15.5.2 發展近況和技術優勢 347
15.5.3 軟體架構 348
15.5.4 套用場景 349
15.6 本章小結 351
結束語 353
名詞索引 355

相關詞條

熱門詞條

聯絡我們