內容簡介
本書內容主要分為三部分:第1部分導論,介紹SQL Server 2017的安裝及配置方法、數據導入方法和工具,並且通過數據可視化技術介紹數據分析處理技術的基本需求、數據模型及實現方法;第2部分資料庫基礎知識與SQL實踐,介紹關係資料庫基礎理論、資料庫基礎實現技術、SQL命令及查詢實現技術、資料庫實現新技術等相關知識;第3部分數據倉庫和OLAP基礎,介紹數據倉庫的基本概念及相關理論、OLAP的基本概念及相關操作、基於企業Benchmark的OLAP實踐案例。 本書採用面向數據完整生命周期的貫穿式案例教學方法,以數據的採集、載入、管理、處理、分析、最佳化、數據可視化、多維展示、數據挖掘等從起點到終點的案例式處理過程,介紹數據分析處理全生命周期中相關的技術,使讀者掌握全面的資料庫分析處理技術,增強讀者獨立解決實際問題的能力。
目錄
第1部分 導 論
第1章 初識SQL Server 2017 2
1.1 SQL Server 2017在Windows平台的安裝與配置 2
1.2 SQL Server 2017在Linux平台的安裝與配置 7
1.3 SQL Server資料庫數據導入和導出 14
1.3.1 從Access檔案向SQL Server導入數據 15
1.3.2 通過BULK INSERT命令導入平面數據檔案 17
1.3.3 通過數據導入和導出嚮導導入平面數據檔案 22
1.4 使用Integration Services導入數據 29
小結 39
第2章 數據分析與資料庫的初步認識 40
2.1 Excel數據分析工具 40
2.1.1 Excel表單數據操作 40
2.1.2 Power Pivot for Excel 41
2.1.3 Power Map 45
2.2 Power BI Desktop數據分析工具 46
2.2.1 數據管理 46
2.2.2 數據分析與可視化報表 50
2.2.3 數據發布與訪問 53
2.3 Tableau數據可視化分析工具 54
2.3.1 數據連線與管理 55
2.3.2 可視化分析 57
2.3.3 創建儀錶板和故事 62
小結 64
第2部分 資料庫基礎知識與SQL實踐
第3章 資料庫基礎知識 66
3.1 資料庫的基本概念 66
3.1.1 數據、資料庫、資料庫管理系統、資料庫系統 66
3.1.2 資料庫系統的特點 69
3.2 關係數據模型 71
3.2.1 實體?聯繫模型 72
3.2.2 關係 72
3.2.3 關係模式 75
3.2.4 碼 77
3.2.5 規範化 79
3.2.6 完整性約束 88
3.3 關係操作與關係代數 95
3.3.1 關係操作 95
3.3.2 關係代數與關係運算 96
3.4 資料庫系統結構 105
3.4.1 內模式(Internal Schema) 105
3.4.2 模式(Schema) 108
3.4.3 外模式(External Schema) 109
3.4.4 資料庫的二級映像與數據獨立性 109
3.5 資料庫系統的組成 110
3.5.1 資料庫硬體平台 110
3.5.2 資料庫軟體 112
3.5.3 資料庫人員 113
小結 114
第4章 關係資料庫結構化查詢語言SQL 115
4.1 SQL概述 115
4.2 數據定義SQL 119
4.2.1 模式的定義與刪除 119
4.2.2 表的定義、刪除與修改 121
4.2.3 代表性的索引技術 127
4.2.4 索引的創建與刪除 134
4.3 數據查詢SQL 136
4.3.1 單表查詢 137
4.3.2 連線查詢 147
4.3.3 嵌套查詢 152
4.3.4 集合查詢 158
4.3.5 基於派生表查詢 161
4.4 數據更新SQL 162
4.4.1 插入數據 162
4.4.2 修改數據 164
4.4.3 刪除數據 165
4.4.4 事務 165
4.5 視圖的定義和使用 166
4.5.1 定義視圖 166
4.5.2 查詢視圖 168
4.5.3 更新視圖 169
4.6 面向大數據管理的SQL擴展語法 172
4.6.1 HiveQL 172
4.6.2 JSON數據管理 175
4.6.3 圖數據管理 179
小結 183
第5章 資料庫實現與查詢最佳化技術 185
5.1 資料庫查詢處理實現技術和查詢最佳化技術的基本原理 185
5.1.1 表存儲結構 185
5.1.2 緩衝區管理 189
5.1.3 索引查詢最佳化技術 190
5.1.4 基於代價模型的查詢最佳化 196
5.2 記憶體查詢最佳化技術 201
5.2.1 記憶體表 202
5.2.2 列存儲索引 205
5.3 查詢最佳化案例分析 209
5.4 代表性的關係資料庫 226
小結 232
第3部分 數據倉庫和OLAP基礎
第6章 數據倉庫和OLAP 236
6.1 數據倉庫 236
6.1.1 數據倉庫的概念 236
6.1.2 數據倉庫的特徵 237
6.1.3 數據倉庫的體系結構 238
6.1.4 數據倉庫的實現技術 241
6.2 OLAP在線上分析處理 249
6.2.1 多維數據模型 250
6.2.2 OLAP操作 251
6.2.3 OLAP實現技術 255
6.2.4 OLAP存儲模型設計 256
6.3 數據倉庫案例分析 264
6.3.1 TPC-H 265
6.3.2 SSB 274
6.3.3 TPC-DS 276
小結 287
第7章 OLAP實踐案例 288
7.1 基於SSB資料庫的OLAP案例實踐 288
7.1.1 SSB數據集分析 288
7.1.2 創建Analysis Services數據源 292
7.1.3 創建數據源視圖 295
7.1.4 創建多維數據集 297
7.1.5 創建維度 301
7.1.6 多維分析 307
7.1.7 通過Excel數據透視表查看多維數據集 308
7.2 基於FoodMart資料庫的OLAP案例實踐 311
7.3 基於TPC-H資料庫的OLAP案例實踐 326
7.4 SQL Server 2017內置統計功能 338
7.4.1 系統安裝配置 338
7.4.2 SQL Server 2017 R腳本執行案例 340
7.4.3 SQL Server 2017 R腳本執行與Analysis Services中統計功能 342
7.4.4 Analysis Services中常見的數據挖掘功能 351
7.4.5 SQL Server 2017 Python腳本執行 361
小結 364
參考文獻 365,第1部分 導 論
第1章 初識SQL Server 2017 2
1.1 SQL Server 2017在Windows平台的安裝與配置 2
1.2 SQL Server 2017在Linux平台的安裝與配置 7
1.3 SQL Server資料庫數據導入和導出 14
1.3.1 從Access檔案向SQL Server導入數據 15
1.3.2 通過BULK INSERT命令導入平面數據檔案 17
1.3.3 通過數據導入和導出嚮導導入平面數據檔案 22
1.4 使用Integration Services導入數據 29
小結 39
第2章 數據分析與資料庫的初步認識 40
2.1 Excel數據分析工具 40
2.1.1 Excel表單數據操作 40
2.1.2 Power Pivot for Excel 41
2.1.3 Power Map 45
2.2 Power BI Desktop數據分析工具 46
2.2.1 數據管理 46
2.2.2 數據分析與可視化報表 50
2.2.3 數據發布與訪問 53
2.3 Tableau數據可視化分析工具 54
2.3.1 數據連線與管理 55
2.3.2 可視化分析 57
2.3.3 創建儀錶板和故事 62
小結 64
第2部分 資料庫基礎知識與SQL實踐
第3章 資料庫基礎知識 66
3.1 資料庫的基本概念 66
3.1.1 數據、資料庫、資料庫管理系統、資料庫系統 66
3.1.2 資料庫系統的特點 69
3.2 關係數據模型 71
3.2.1 實體?聯繫模型 72
3.2.2 關係 72
3.2.3 關係模式 75
3.2.4 碼 77
3.2.5 規範化 79
3.2.6 完整性約束 88
3.3 關係操作與關係代數 95
3.3.1 關係操作 95
3.3.2 關係代數與關係運算 96
3.4 資料庫系統結構 105
3.4.1 內模式(Internal Schema) 105
3.4.2 模式(Schema) 108
3.4.3 外模式(External Schema) 109
3.4.4 資料庫的二級映像與數據獨立性 109
3.5 資料庫系統的組成 110
3.5.1 資料庫硬體平台 110
3.5.2 資料庫軟體 112
3.5.3 資料庫人員 113
小結 114
第4章 關係資料庫結構化查詢語言SQL 115
4.1 SQL概述 115
4.2 數據定義SQL 119
4.2.1 模式的定義與刪除 119
4.2.2 表的定義、刪除與修改 121
4.2.3 代表性的索引技術 127
4.2.4 索引的創建與刪除 134
4.3 數據查詢SQL 136
4.3.1 單表查詢 137
4.3.2 連線查詢 147
4.3.3 嵌套查詢 152
4.3.4 集合查詢 158
4.3.5 基於派生表查詢 161
4.4 數據更新SQL 162
4.4.1 插入數據 162
4.4.2 修改數據 164
4.4.3 刪除數據 165
4.4.4 事務 165
4.5 視圖的定義和使用 166
4.5.1 定義視圖 166
4.5.2 查詢視圖 168
4.5.3 更新視圖 169
4.6 面向大數據管理的SQL擴展語法 172
4.6.1 HiveQL 172
4.6.2 JSON數據管理 175
4.6.3 圖數據管理 179
小結 183
第5章 資料庫實現與查詢最佳化技術 185
5.1 資料庫查詢處理實現技術和查詢最佳化技術的基本原理 185
5.1.1 表存儲結構 185
5.1.2 緩衝區管理 189
5.1.3 索引查詢最佳化技術 190
5.1.4 基於代價模型的查詢最佳化 196
5.2 記憶體查詢最佳化技術 201
5.2.1 記憶體表 202
5.2.2 列存儲索引 205
5.3 查詢最佳化案例分析 209
5.4 代表性的關係資料庫 226
小結 232
第3部分 數據倉庫和OLAP基礎
第6章 數據倉庫和OLAP 236
6.1 數據倉庫 236
6.1.1 數據倉庫的概念 236
6.1.2 數據倉庫的特徵 237
6.1.3 數據倉庫的體系結構 238
6.1.4 數據倉庫的實現技術 241
6.2 OLAP在線上分析處理 249
6.2.1 多維數據模型 250
6.2.2 OLAP操作 251
6.2.3 OLAP實現技術 255
6.2.4 OLAP存儲模型設計 256
6.3 數據倉庫案例分析 264
6.3.1 TPC-H 265
6.3.2 SSB 274
6.3.3 TPC-DS 276
小結 287
第7章 OLAP實踐案例 288
7.1 基於SSB資料庫的OLAP案例實踐 288
7.1.1 SSB數據集分析 288
7.1.2 創建Analysis Services數據源 292
7.1.3 創建數據源視圖 295
7.1.4 創建多維數據集 297
7.1.5 創建維度 301
7.1.6 多維分析 307
7.1.7 通過Excel數據透視表查看多維數據集 308
7.2 基於FoodMart資料庫的OLAP案例實踐 311
7.3 基於TPC-H資料庫的OLAP案例實踐 326
7.4 SQL Server 2017內置統計功能 338
7.4.1 系統安裝配置 338
7.4.2 SQL Server 2017 R腳本執行案例 340
7.4.3 SQL Server 2017 R腳本執行與Analysis Services中統計功能 342
7.4.4 Analysis Services中常見的數據挖掘功能 351
7.4.5 SQL Server 2017 Python腳本執行 361
小結 364
參考文獻 365