數據挖掘 (第2版)(2023年電子工業出版社出版的圖書)

本詞條是多義詞,共2個義項
更多義項 ▼ 收起列表 ▲

《數據挖掘(第2版)》是2023年電子工業出版社出版的圖書,作者是蔣盛益。

基本介紹

  • 中文名:數據挖掘(第2版)
  • 作者:蔣盛益
  • 出版社:電子工業出版社
  • 出版時間:2023年2月
  • 頁數:324 頁
  • 定價:68.0 元
  • 開本:16 開
  • ISBN:9787121450778
內容簡介,圖書目錄,

內容簡介

本書內容分為數據挖掘理論和數據挖掘實踐兩部分。數據挖掘理論部分主要包括數據挖掘的基本概念、數據預處理、聚類分析、分類與回歸、關聯規則挖掘及離群點檢測。數據挖掘實踐部分討論數據挖掘在文本挖掘和金融領域中的套用,通過虛假新聞檢測和社交平台情緒分析等案例,展示數據挖掘在文本挖掘方面的套用;通過潛在貸款客戶挖掘、貸款違約等案例展示數據挖掘在金融領域的套用。 本書可作為高等學校計算機、數據科學與大數據、電子商務、信息科學等相關專業的教材或參考書,也可供從事數據挖掘研究的科研、技術人員參考。

圖書目錄

上篇 理論篇
第1章 緒論 2
1.1 數據挖掘技術使用背景 4
1.2 數據挖掘任務及過程 5
1.2.1 數據挖掘定義 5
1.2.2 數據挖掘任務 5
1.2.3 數據挖掘過程 7
1.2.4 數據挖掘對象 8
1.2.5 數據挖掘工具及其選擇 13
1.3 數據挖掘套用 13
1.3.1 數據挖掘在計算機領域中的套用 14
1.3.2 數據挖掘在商業領域中的套用 15
1.3.3 數據挖掘在其他領域中的套用 16
1.3.4 數據挖掘技術的前景 17
1.4 數據挖掘與隱私保護 18
本章小結 20
習題1 20
第2章 數據處理基礎 23
2.1 數據 24
2.1.1 數據及數據類型 24
2.1.2 數據集的類型 25
2.2 數據探索 27
2.2.1 描述性統計分析 27
2.2.2 數據可視化 30
2.2.3 辛普森悖論 34
2.3 數據預處理 37
2.3.1 數據清理 38
2.3.2 數據集成 41
2.3.3 特徵變換 41
2.3.4 數據歸約 48
2.4 相似性度量 55
2.4.1 屬性之間的相似性度量 56
2.4.2 對象之間的相似性度量 57
本章小結 60
習題2 61
第3章 分類和回歸 65
3.1 分類概述 66
3.2 決策樹分類方法 67
3.2.1 決策樹的基本概念 67
3.2.2 構建決策樹的要素 68
3.2.3 Hunt算法 73
3.2.4 C4.5算法 74
3.2.5 CART算法 79
3.2.6 決策樹算法的特點 90
3.3 貝葉斯分類方法 90
3.3.1 貝葉斯定理 91
3.3.2 樸素貝葉斯分類算法 92
3.3.3 貝葉斯信念網路 96
3.4 k-最近鄰分類方法 97
3.4.1 k-最近鄰分類的基本問題 98
3.4.2 k-最近鄰分類算法描述 98
3.4.3 k-最近鄰分類算法的優缺點 100
3.5 神經網路分類方法 100
3.5.1 人工神經網路的基本概念 100
3.5.2 典型神經網路模型介紹 102
3.5.3 神經網路的特點 103
3.5.4 深度網路和深度學習算法 104
3.6 支持向量機 105
3.7 集成分類方法 107
3.8 分類問題拓展 113
3.8.1 不平衡分類問題 113
3.8.2 半監督學習 115
3.8.3 單類分類 115
3.8.4 多標籤分類 115
3.8.5 層次分類 115
3.9 分類模型的評價 116
3.9.1 分類模型性能評價指標 116
3.9.2 分類模型的過度擬合 117
3.9.3 評估分類模型性能的方法 117
3.10 綜合案例:信用風險分析 118
3.11 回歸分析 121
3.11.1 多元線性回歸模型 122
3.11.2 非線性回歸 125
3.11.3 邏輯回歸 127
本章小結 131
習題3 131
第4章 聚類分析 137
4.1 聚類分析概述 138
4.2 k-means算法及其改進 141
4.2.1 基本k-means算法 141
4.2.2 k-means聚類算法的拓展 145
4.3 層次聚類算法 150
4.3.1 二分k-means算法 151
4.3.2 BIRCH算法 152
4.3.3 CURE算法 154
4.3.4 ROCK算法 155
4.4 基於密度的聚類算法 157
4.5 基於圖的聚類算法 160
4.5.1 Chameleon聚類算法 160
4.5.2 基於SNN的聚類算法 165
4.6 一趟聚類算法 167
4.6.1 閾值選擇 167
4.6.2 算法套用 171
4.7 基於模型的聚類算法 172
4.7.1 期望優選化方法 172
4.7.2 概念聚類 172
4.7.3 SOM方法 174
4.8 聚類算法評價 176
4.9 綜合案例:航空公司客戶價值分析 178
本章小結 184
習題4 184
第5章 關聯分析 187
5.1 關聯分析概述 188
5.2 關聯規則分析基礎 188
5.2.1 基本概念 188
5.2.2 基礎分析方法 190
5.3 Apriori算法 192
5.3.1 Apriori性質 192
5.3.2 產生頻繁項集 193
5.3.3 頻繁項集構造示例 194
5.3.4 產生關聯規則 195
5.3.5 規則的評估標準 198
5.3.6 Apriori算法評價 201
5.4 FP-Growth算法 201
5.4.1 FP-tree表示法 201
5.4.2 構建FP-tree 202
5.4.3 發現頻繁項集 204
5.5 關聯規則擴展 205
5.5.1 關聯規則分類 205
5.5.2 多層次關聯規則 206
5.5.3 多維度關聯規則 207
5.5.4 定量關聯規則 208
5.5.5 基於約束的關聯規則 208
5.5.6 序列模式挖掘 208
5.6 綜合案例:移動業務關聯分析 209
5.6.1 數據準備 209
5.6.2 數據預處理 209
5.6.3 關聯規則挖掘過程 211
5.6.4 規則的最佳化 214
5.6.5 模型的套用 215
本章小結 216
習題5 216
第6章 離群點挖掘 220
6.1 離群點挖掘概述 221
6.2 基於統計的方法 222
6.3 基於距離的方法 224
6.4 基於相對密度的方法 226
6.5 基於聚類的方法 231
6.5.1 基於對象的離群因子方法 231
6.5.2 基於簇的離群因子方法 234
6.5.3 基於聚類的動態數據離群點檢測方法 236
6.6 離群點挖掘方法的評估 237
6.7 綜合案例 237
6.7.1 離群點檢測在癌症診斷中的套用 237
6.7.2 離群點檢測在網路入侵檢測中的套用 239
本章小結 242
習題6 242
下篇 實踐篇
第7章 文本挖掘 246
7.1 文本挖掘概述 247
7.1.1 分詞 247
7.1.2 文本表示與詞權重計算 250
7.1.3 文本特徵選擇 252
7.1.4 文本分類 253
7.1.5 文本聚類 256
7.1.6 文檔自動摘要 258
7.1.7 文本情感分析 262
7.1.8 用戶畫像 265
7.2 案例分析 269
7.2.1 虛假新聞檢測案例 269
7.2.2 社交平台情感分類 277
本章小結 283
第8章 數據挖掘的金融套用 285
8.1 數據挖掘在金融領域中的套用概述 287
8.1.1 金融科技 287
8.1.2 金融領域中的數據挖掘套用 289
8.2 銀行潛在貸款客戶挖掘 295
8.2.1 業務理解 295
8.2.2 數據理解與數據準備 296
8.2.3 模型構建與評估 299
8.3 貸款違約 301
本章小結 305
附錄A 數據挖掘常用資源列表 307
參考文獻 308

相關詞條

熱門詞條

聯絡我們