《數據可視化與數據挖掘——基於Tableau和SPSS Modeler圖形界面》一書作者王國平 ,電子工業出版社2017年10月出版
基本介紹
- 書名:數據可視化與數據挖掘——基於Tableau和SPSS Modeler圖形界面
- 作者:王國平
- ISBN:978-7-121-32702-5
- 頁數:348頁
- 定價:69.00元
- 出版社:電子工業出版社
- 出版時間:2017年10月出版
- 開本:16
內容提要
當前,經典的數據挖掘算法日趨成熟,相關標準和技術已經在各行各業得到廣泛套用。為了使數據挖掘技術滿足不同層次用戶的需要,可視化數據挖掘技術被提出,通過可視化的手段將數據挖掘過程的各個階段展示給用戶,使用戶能更好地理解過程,該技術已經成為數據挖掘領域的研究熱點。
《數據可視化與數據挖掘——基於Tableau和SPSS Modeler圖形界面》旨在介紹最新的可視化數據挖掘技術,是作者多年工作經驗的總結。內容基於 Tableau 10.3和 IBM SPSS Modeler 18.0 編寫,詳細介紹了 Tableau 的數據連線、圖形編輯、創建地圖、表計算和聚合計算等功能,以及 IBM SPSS Modeler 的數據連線、CRISP-DM(跨行業數據挖掘標準流程)等功能。通過實際案例,重點介紹了可視化數據挖掘技術在電信、電力、醫藥、銀行、電商和房地產等行業中的套用,可以作為網際網路、銀行證券、電商等行業的從業者,以及高等院校相關專業學生參考使用。
目錄
第1部分 數據可視化篇
第1章 可視化數據挖掘概述 2
1.1 數據可視化 2
1.1.1 Tableau 3
1.1.2 QlikView 5
1.1.3 Power BI 5
1.2 可視化數據挖掘 6
1.2.1 IBM SPSS Modeler 6
1.2.2 Intelligent Miner 7
1.2.3 SAS Enterprise Miner 9
第2章 Tableau Desktop簡介 11
2.1 軟體頁面簡介 11
2.1.1 開始頁面 12
2.1.2 數據源頁面 13
2.1.3 工作簿頁面 15
2.2 數據類型 15
2.2.1 主要數據類型 15
2.2.2 更改數據類型 16
2.3 運算符及優先權 18
2.3.1 算術運算符 18
2.3.2 邏輯運算符 18
2.3.3 比較運算符 19
2.3.4 運算符優先權 19
2.4 軟體安裝 20
2.4.1 軟體下載 20
2.4.2 安裝步驟 21
2.4.3 軟體激活 23
2.5 檔案類型 26
第3章 連線數據源 27
3.1 連線到檔案 27
3.1.1 Excel檔案 27
3.1.2 文本檔案 29
3.1.3 Access 30
3.1.4 JSON檔案 32
3.1.5 PDF檔案 34
3.1.6 空間檔案 35
3.1.7 統計檔案 36
3.1.8 其他檔案 38
3.2 連線到資料庫 38
3.2.1 Tableau Server 38
3.2.2 SQL Server 39
3.2.3 MySQL 40
3.2.4 Oracle 41
3.2.5 Amazon Redshift 42
3.2.6 更多資料庫 43
第4章 Tableau主要操作 47
4.1 維度和度量 47
4.1.1 維度 47
4.1.2 度量 49
4.2 連續和離散 50
4.2.1 連續欄位 50
4.2.2 離散欄位 51
4.3 工作區操作 52
4.3.1 “數據”窗格 53
4.3.2 “分析”窗格 54
4.3.3 工具列 54
4.3.4 狀態欄 55
4.3.5 卡和功能區 56
4.4 工作表操作 58
4.4.1 創建工作表 58
4.4.2 複製工作表 59
4.4.3 導出工作表 59
4.4.4 刪除工作表 60
4.5 Tableau高級操作 61
4.5.1 表計算 61
4.5.2 創建欄位 63
4.5.3 創建參數 65
4.5.4 聚合計算 71
4.5.5 缺失值處理 74
第5章 創建圖表 76
5.1 單變數圖形 76
5.1.1 條形圖 76
5.1.2 餅圖 79
5.1.3 直方圖 80
5.1.4 折線圖 81
5.2 多變數圖形 84
5.2.1 散點圖 84
5.2.2 甘特圖 85
第2部分 可視化數據挖掘篇
第6章 SPSS Modeler簡介 88
6.1 軟體簡介 88
6.1.1 軟體歷史 88
6.1.2 軟體界面 90
6.1.3 軟體特點 96
6.2 算法及功能 97
6.2.1 軟體算法 97
6.2.2 軟體功能 99
6.3 軟體安裝及啟動 101
6.3.1 軟體安裝 101
6.3.2 授權許可 104
6.3.3 啟動軟體 107
第7章 數據挖掘流程 110
7.1 業務理解 110
7.2 數據理解 111
7.3 數據準備 112
7.4 建立模型 113
7.5 評估模型 114
7.6 套用模型 114
第8章 SPSS Modeler導入數據源 116
8.1 連線到檔案 116
8.1.1 Excel檔案 117
8.1.2 變數檔案 117
8.1.3 固定檔案 119
8.1.4 SAS檔案 120
8.1.5 Statistics檔案 121
8.2 連線到資料庫 121
第9章 SPSS Modeler基礎操作 125
9.1 數據流操作 125
9.1.1 生成數據流 125
9.1.2 添加和刪除節點 125
9.1.3 連線數據流 126
9.1.4 修改連線節點 127
9.1.5 執行數據流 128
9.2 圖形製作 128
9.2.1 散點圖 129
9.2.2 直方圖 131
9.2.3 網路圖 132
9.2.4 評估圖 132
第3部分 案例實戰篇
第10章 電信行業中的套用 136
10.1 建模思路 137
10.2 Logistic回歸 138
10.3 業務理解 139
10.4 數據理解 140
10.5 數據準備 142
10.6 建立模型 143
10.6.1 模型參數設定 143
10.6.2 模型運行結果 154
10.7 模型評估 157
10.7.1 模型精確度 157
10.7.2 模型擬合度 158
10.8 模型套用 158
10.9 小結 161
第11章 電力行業中的套用 162
11.1 建模思路 163
11.2 時間序列模型 163
11.3 業務理解 165
11.4 數據理解 166
11.5 數據準備 167
11.6 建立模型 168
11.6.1 模型參數設定 168
11.6.2 模型運行結果 184
11.7 模型評估 186
11.8 模型套用 187
11.9 小結 188
第12章 醫藥行業中的套用 189
12.1 建模思路 189
12.2 聚類模型 190
12.3 業務理解 192
12.4 數據理解 193
12.5 數據準備 195
12.6 建立模型 196
12.6.1 模型參數設定 196
12.6.2 模型運行結果 199
12.7 模型評估 202
12.8 模型套用 204
12.9 小結 206
第13章 銀行業中的套用 207
13.1 建模思路 208
13.2 判別分析 208
13.3 業務理解 210
13.4 數據理解 211
13.5 數據準備 213
13.6 建立模型 214
13.6.1 模型參數設定 214
13.6.2 模型運行結果 221
13.7 模型評估 226
13.8 模型套用 226
13.9 小結 229
第14章 電商中的套用 230
14.1 建模思路 231
14.2 神經網路模型 232
14.2.1 神經元 234
14.2.2 多層感知器 235
14.2.3 徑向基函式 237
14.3 業務理解 238
14.4 數據理解 239
14.5 數據準備 241
14.6 建立模型 243
14.6.1 模型參數設定 243
14.6.2 模型運行結果 251
14.7 模型評估 254
14.8 模型套用 255
14.9 小結 257
第15章 房地產業中的套用 258
15.1 建模思路 258
15.2 決策樹模型 259
15.3 業務理解 261
15.4 數據理解 261
15.5 數據準備 263
15.6 建立模型 266
15.6.1 模型參數設定 266
15.6.2 模型運行結果 276
15.7 模型評估 277
15.7.1 模型精確度 277
15.7.2 模型擬合度 278
15.8 模型套用 279
15.9 小結 281
附錄A 配置MySQL ODBC數據源 282
附錄B Tableau重要函式 285
附錄C SPSS Modeler函式 313