分散式資料庫系統原理(第4版)

分散式資料庫系統原理(第4版)

《分散式資料庫系統原理(第4版)》是2023年清華大學出版社出版的圖書,作者:(德)塔姆爾·厄茲敘(M. Tamer ?zsu),派屈克·瓦爾杜里茲(Patrick Valduriez) 著 范舉 等譯。

基本介紹

  • 中文名:分散式資料庫系統原理(第4版)
  • 作者:(德)塔姆爾·厄茲敘(M. Tamer ?zsu)、(德)派屈克·瓦爾杜里茲(Patrick Valduriez)
  • 譯者:范舉
  • 出版時間:2023年7月1日
  • 出版社:清華大學出版社
  • ISBN:9787302636526 
  • 定價:99 元
內容簡介,圖書目錄,

內容簡介

本書主要介紹分散式資料庫管理系統的基本概念、基本理論和設計問題,涵蓋了分散式資料庫系統的設計、實現和管理等方面的諸多專題。全書由兩大部分組成, 第一部分包括第1~14章,以關係資料庫為主,講述了分散式數據管理的基礎原理,內容包括分散式資料庫設計,分散式查詢的分解與最佳化,事務管理,分散式並發控制,分散式資料庫管理系統的可靠性,數據複製等分散式數據管理技術的經典內容,第14章還討論了並行資料庫系統。第二部分包括第15~18章,介紹了網際網路時代分散式數據管理研究的前沿,包括分散式對象資料庫管理,P2P數據管理

圖書目錄

目 錄
第1章 引言 1
1.1 什麼是分散式資料庫系統 1
1.2 分散式DBMS的發展歷程 2
1.3 數據傳輸方案 4
1.4 分散式DBMS的承諾 5
1.4.1 分散式及複製數據的透明管理 6
1.4.2 基於分散式事務的可靠性 8
1.4.3 性能提升 8
1.4.4 可擴展性 9
1.5 設計問題 10
1.5.1 分散式資料庫設計 10
1.5.2 分散式數據控制 10
1.5.3 分散式查詢處理 10
1.5.4 分散式並發控制 11
1.5.5 分散式資料庫的可靠性 11
1.5.6 複製 11
1.5.7 並行資料庫 11
1.5.8 資料庫集成 12
1.5.9 其他分散式方法 12
1.5.10 大數據處理和NoSQL 12
1.6 分散式DBMS體系架構 12
1.6.1 分散式DBMS體系架構的模型 13
1.6.2 客戶/伺服器系統 15
1.6.3 P2P系統 16
1.6.4 多資料庫體系架構 18
1.6.5 雲計算 20
1.7 本章參考文獻說明 23
第2章 分布與並行資料庫設計 25
2.1 數據分片 27
2.1.1 水平分片 28
2.1.2 垂直分片 39
2.1.3 混合分片 48
2.2 分配 49
2.2.1 輔助信息 50
2.2.2 分配模型 50
2.2.3 解決辦法 52
2.3 結合的方法 53
2.3.1 工作負載不可知時的劃分技術 53
2.3.2 工作負載可知的劃分技術 54
2.4 自適應方法 57
2.4.1 檢測工作負載的變化 57
2.4.2 檢測受影響的數據項 58
2.4.3 增量重構 58
2.5 數據目錄 60
2.6 本章小結 61
2.7 本章參考文獻說明 61
2.8 本章習題 63
第3章 分散式數據控制 66
3.1 視圖管理 66
3.1.1 集中式DBMS中的視圖 67
3.1.2 分散式DBMS中的視圖 69
3.1.3 物化視圖的維護 70
3.2 訪問控制 75
3.2.1 裁決式訪問控制 76
3.2.2 多級訪問控制 77
3.2.3 分散式訪問控制 79
3.3 語義完整性控制 81
3.3.1 集中式語義完整性控制 82
3.3.2 分散式語義完整性控制 85
3.4 本章小結 89
3.5 本章參考文獻說明 90
3.6 本章習題 91
第4章 分散式查詢處理 93
4.1 查詢處理概述 93
4.1.1 查詢處理問題 94
4.1.2 查詢最佳化 96
4.1.3 查詢處理的分層結構 98
4.2 數據本地化 101
4.2.1 主水平劃分的歸約 101
4.2.2 連結的歸約 103
4.2.3 垂直分片的歸約 104
4.2.4 誘導分片的歸約 105
4.2.5 混合分片的歸約 106
4.3 分散式查詢的連結排序 107
4.3.1 連結樹 107
4.3.2 連結排序 109
4.3.3 基於半連結的算法 110
4.3.4 連結與半連結的對比 113
4.4 分散式代價模型 114
4.4.1 代價函式 114
4.4.2 資料庫統計數據 115
4.5 分散式查詢最佳化 116
4.5.1 動態方法 116
4.5.2 靜態方法 120
4.5.3 混合方法 122
4.6 自適應查詢處理 126
4.6.1 自適應查詢處理的流程 127
4.6.2 eddy方法 128
4.7 本章小結 129
4.8 本章參考文獻說明 130
4.9 本章習題 131
第5章 分散式事務處理 134
5.1 背景與概念定義 135
5.2 分散式並發控制 137
5.2.1 基於加鎖的並發控制算法 138
5.2.2 基於時間戳的並發控制算法 145
5.2.3 多版本並發控制算法 149
5.2.4 樂觀並發控制算法 150
5.3 基於快照隔離的分散式並發控制算法 152
5.4 分散式DBMS的可靠性 154
5.4.1 兩階段提交協定 155
5.4.2 兩階段提交協定的變型版本 161
5.4.3 處理站點故障 162
5.4.4 網路劃分 168
5.4.5 Paxos共識協定 170
5.4.6 體系架構方面的考慮 173
5.5 擴展事務管理的現代方法 174
5.5.1 Spanner系統 175
5.5.2 LeanXcale系統 175
5.6 本章小結 177
5.7 本章參考文獻說明 178
5.8 本章習題 181
第6章 數據複製 183
6.1 複製資料庫的一致性 184
6.1.1 相互一致性 184
6.1.2 相互一致性與事務一致性 186
6.2 更新管理策略 187
6.2.1 積極更新傳播 187
6.2.2 懶惰更新傳播 188
6.2.3 集中式技術 188
6.2.4 分散式技術 189
6.3 複製協定 189
6.3.1 積極集中式協定 189
6.3.2 積極分散式協定 194
6.3.3 懶惰集中式協定 194
6.3.4 懶惰分散式協定 199
6.4 分組通信 200
6.5 複製與故障 202
6.5.1 故障和懶惰複製 202
6.5.2 故障和積極複製 202
6.6 本章小結 205
6.7 本章參考文獻說明 205
6.8 本章習題 207
第7章 資料庫集成——多資料庫系統 209
7.1 資料庫集成 209
7.1.1 自底向上的設計方法 210
7.1.2 模式匹配 213
7.1.3 模式集成 220
7.1.4 模式映射 221
7.1.5 數據清洗 227
7.2 多資料庫查詢處理 228
7.2.1 多資料庫查詢處理的關鍵問題 228
7.2.2 多資料庫查詢處理體系架構 229
7.2.3 基於視圖的查詢重寫 231
7.2.4 查詢最佳化和執行 234
7.2.5 查詢翻譯和執行 243
7.3 本章小結 245
7.4 本章參考文獻說明 246
7.5 本章習題 248
第8章 並行資料庫系統 258
8.1 並行資料庫系統的目標 258
8.2 並行架構 261
8.2.1 通用架構 261
8.2.2 共享記憶體架構 262
8.2.3 共享磁碟架構 264
8.2.4 無共享架構 264
8.3 數據放置 265
8.4 並行查詢處理 268
8.4.1 數據處理的並行算法 268
8.4.2 並行查詢最佳化 273
8.5 負載均衡 277
8.5.1 並行執行的問題 277
8.5.2 運算元內負載均衡 279
8.5.3 運算元間負載均衡 280
8.5.4 查詢內負載均衡 280
8.6 容錯性 283
8.7 資料庫集群 284
8.7.1 資料庫集群架構 285
8.7.2 複製 286
8.7.3 負載均衡 286
8.7.4 查詢處理 286
8.8 本章小結 289
8.9 本章參考文獻說明 289
8.10 本章習題 291
第9章 對等數據管理 293
9.1 基礎設施 295
9.1.1 非結構化P2P網路 296
9.1.2 結構化P2P網路 298
9.1.3 超級節點P2P網路 301
9.1.4 P2P網路比較 303
9.2 P2P系統上的模式映射 303
9.2.1 成對模式映射 303
9.2.2 基於機器學習技術的映射 304
9.2.3 公共協定映射 304
9.2.4 基於信息檢索技術的模式映射 305
9.3 P2P系統的查詢處理 306
9.3.1 Top-k查詢 306
9.3.2 連結查詢 316
9.3.3 區間查詢 317
9.4 副本一致性 320
9.4.1 DHT中的基本支持 320
9.4.2 DHT中的數據貨幣 321
9.4.3 副本協調 322
9.5 區塊鏈 325
9.5.1 區塊鏈定義 326
9.5.2 區塊鏈基礎設施 327
9.5.3 區塊鏈2.0 329
9.5.4 問題 330
9.6 本章小結 331
9.7 本章參考文獻說明 332
9.8 本章習題 333
第10章 大數據處理 335
10.1 分散式存儲系統 337
10.1.1 谷歌檔案系統 338
10.1.2 對象存儲與檔案存儲的結合 339
10.2 大數據處理框架 339
10.2.1 MapReduce數據處理 340
10.2.2 使用Spark處理數據 348
10.3 流數據處理 352
10.3.1 流模型、語言和運算元 353
10.3.2 數據流的查詢處理 356
10.3.3 數據流系統容錯 362
10.4 圖分析平台 363
10.4.1 圖劃分 365
10.4.2 MapReduce和圖分析 369
10.4.3 圖分析專用系統 369
10.4.4 以頂點為中心的整體同步系統 372
10.4.5 以頂點為中心的異步並行系統 374
10.4.6 以頂點為中心的聚集-套用-分散系統 376
10.4.7 以劃分為中心的整體同步系統 377
10.4.8 以劃分為中心的異步並行系統 378
10.4.9 以劃分為中心的聚集-套用-分散系統 378
10.4.10 以邊為中心的整體同步系統 378
10.4.11 以邊為中心的異步並行系統 379
10.4.12 以邊為中心的聚集-套用-分散系統 379
10.5 數據湖 379
10.5.1 數據湖與數據倉庫 379
10.5.2 體系架構 380
10.5.3 挑戰 382
10.6 本章小結 382
10.7 本章參考文獻說明 383
10.8 本章習題 385
第11章 NoSQL、NewSQL與Polystore技術 388
11.1 NoSQL系統提出的動機 388
11.2 鍵值存儲系統 390
11.2.1 DynamoDB 390
11.2.2 其他鍵值存儲系統 392
11.3 文檔存儲系統 392
11.3.1 MongoDB 393
11.3.2 其他文檔存儲 395
11.4 寬列存儲 395
11.4.1 Bigtable 396
11.4.2 其他寬列存儲系統 397
11.5 圖資料庫管理系統 397
11.5.1 Neo4j 398
11.5.2 其他圖資料庫系統 401
11.6 混合數據存儲系統 401
11.6.1 多模型NoSQL存儲系統 401
11.6.2 NewSQL資料庫系統 402
11.7 Polystore系統 404
11.7.1 松耦合的Polystore系統 405
11.7.2 緊耦合Polystore系統 408
11.7.3 混合系統 412
11.7.4 結束語 415
11.8 本章小結 416
11.9 本章參考文獻說明 417
11.10 本章習題 418
第12章 全球資訊網數據管理 419
12.1 全球資訊網圖管理 420
12.2 全球資訊網搜尋 421
12.2.1 全球資訊網爬取 422
12.2.2 索引 423
12.2.3 排序與連結分析 424
12.2.4 對關鍵字搜尋的評價 425
12.3 全球資訊網查詢 426
12.3.1 半結構化數據方法 427
12.3.2 全球資訊網查詢語言方法 430
12.4 問答系統 435
12.5 隱藏全球資訊網搜尋與查詢 438
12.5.1 隱藏全球資訊網爬取 438
12.5.2 元搜尋 439
12.6 全球資訊網數據集成 441
12.6.1 全球資訊網表格/融合表格 442
12.6.2 語義全球資訊網和連結開放數據 442
12.6.3 全球資訊網數據集成中的數據質量問題 456
12.7 本章參考文獻說明 462
12.8 本章習題 464
附錄 465
參考文獻 466

相關詞條

熱門詞條

聯絡我們