內容簡介
本書對數據挖掘的基本算法進行了系統介紹,每種算法不僅介紹了算法的基本原理,而且配有大量例題以及原始碼,並對原始碼進行了分析,這種理論和實踐相結合的方式有助於讀者較好地理解和掌握抽象的數據挖掘算法。
全書共分11章,內容同時涵蓋了數據預處理、關聯規則挖掘算法、分類算法和料諒戒聚類算法,具體章節包括緒論、數據預處理、關聯規則挖掘、決策樹分類算法、貝葉斯分類算法、人工神經網路算法、支持向量機、Kmeans聚類算法、K中促設心點聚類算法、神經網路聚類算法以及數據挖掘的發展等內容。
本書可作為高等院校數據挖掘課程的教材,也可以作為從事數據挖掘工作以及其他相關工程技術工作人員的參考書。
圖書目錄
第1章緒論/1
1.1數據挖掘的概念/1
1.2數據挖掘的歷史及發展/1
1.3數據挖掘的研究內容及功能/5
1.3.1數據挖掘的研究內容/5
1.3.2數據挖掘的功能/6
1.4數據挖掘的常用技術及工具/9
1.4.1數據挖掘的常用技術/9
1.4.2數據挖掘的工具/12
1.5數據挖掘的套用熱點/12
1.6小結/14
思考題/15第2章數據預處理/16
2.1數據預處理的目的 /16
2.2數據清理/18
2.2.1填充缺失值/18
2.2.2光滑噪聲數據/18
2.2.3數據清理過程/19
2.3數據集成和數據變換/20
2.3.1數據集成/20
2.3.2數據變換/21
2.4數據歸約/23
2.4.1數據立方體聚集/23
2.4.2維歸約/23
2.4.3數據歡達組壓縮/24
2.4.4數值歸約/25
2.4.5數據離散化與概念分層/28
2.5特徵選擇與提取/302.5.1特徵選擇/30
2.5.2特徵提碑墓拘取/31
2.6小結/33
思考題/33第3章關聯規則挖掘/35
3.1基本概念 /35
3.2關聯規則挖掘算法——Apriori算法原理/36
3.3Apriori算法實例分析/38
3.4Apriori算法源程式分析/41
3.5Apriori算法的特點及套用/50
3.5.1Apriori算法特點/50
3.5.2Apriori 算法套用/51
3.6小結/52
思考雄蜜戀戒題/52第4章決策樹分類算法/54
4.1基本概念/54
4.1.1決策樹分類算法概述/54
4.1.2決策樹基本算法概述/54
4.2決策樹分類算法——ID3算法原理/56
4.2.1ID3算法原理/56
4.2.2熵和信息增益/57
4.2.3ID3算法/59
4.3ID3算法實例分析/60
4.4ID3算法源程式分析/64
4.5ID3算法的特點及套用/72
4.5.1ID3算法特點/72
4.5.2ID3算法套用/72
4.6決策樹分頸汗享舟類算法——C4.5算法原理/73
4.6.1C4.5算法/73
4.6.2C4.5算法的偽代碼/75
4.7C4.5算法實例分析/76
4.8C4.5算法源程式分析 /77
4.9C4.5算法的特點及套用/101
4.9.1C4.5算法特點/101
4.9.2C4.5算法套用/101
4.10小結/102
思考題/102第5章貝葉斯分類算法/103
5.1基本概念/103
5.1.1主觀機率/103
5.1.2貝葉斯定理/104
5.2貝葉斯分類算法原理/105
5.2.1樸素貝葉斯分類模型/105
5.2.2貝葉斯信念網路/107
5.3貝葉斯良臭漿算法實例分析/110
5.3.1樸素貝葉斯分類器/110
5.3.2BBN/112
5.4貝葉斯算法源程式分析/114
5.5貝葉斯算法特點及套用/119
5.5.1樸素貝葉斯分類算法/119
5.5.2貝葉斯信念網/120
思考題/121第6章人工神經網路算法/122
6.1基本概念/122
6.1.1生物神經元模型/122
6.1.2人工神經元模型/123
6.1.3主要的神經網路模型/124
6.2BP算法原理/126
6.2.1Delta學習規則的基本原理/126
6.2.2BP網路的結構/126
6.2.3BP網路的算法描述/127
6.2.4標準BP網路的工作過程/129
6.3BP算法實例分析/130
6.4BP算法源程式分析/134
6.5BP算法的特點及套用/143
6.5.1BP算法特點/143
6.5.2BP算法套用/144
6.6小結/145
思考題/145第7章支持向量機/146
7.1基本概念/146
7.1.1支持向量機理論基礎/146
7.1.2統計學習核心理論/146
7.1.3學習過程的一致性條件/146
7.1.4函式集的VC維/147
7.1.5泛化誤差界/148
7.1.6結構風險最小化歸納原理/148
7.2支持向量機原理/149
7.2.1支持向量機核心理論/149
7.2.2最大間隔分類超平面/149
7.2.3支持向量機/150
7.2.4核函式分類/153
7.3支持向量機實例分析/154
7.4支持向量機的特點及套用/156
7.4.1支持向量機的特點/156
7.4.2支持向量機的套用/157
7.5小結/158
思考題/158第8章Kmeans聚類算法/159
8.1簡介/159
8.2Kmeans聚類算法原理/159
8.3Kmeans聚類算法實例分析/161
8.4Kmeans聚類算法源程式分析/164
8.5Kmeans聚類算法的特點及套用/171
8.5.1Kmeans聚類算法的特點/171
8.5.2Kmeans聚類算法的套用/171
8.6小結/172
思考題/172第9章K中心點聚類算法/173
9.1簡介/173
9.2K中心點聚類算法原理/173
9.3K中心點聚類算法實例分析/174
9.4K中心點聚類算法源程式分析/175
9.5K中心點聚類算法的特點及套用/183
9.5.1K中心點聚類算法的特點/183
9.5.2K中心點聚類算法的套用/183
9.6小結/183第10章神經網路聚類方法: SOM /184
10.1簡介/184
10.2競爭學習算法基礎/184
10.2.1自組織神經網路結構/184
10.2.2自組織神經網路的原理/185
10.3SOM算法原理/187
10.3.1SOM網路的拓撲結構/187
10.3.2SOM權值調整域/188
10.3.3SOM網路運行原理/189
10.3.4學習方法/189
10.4SOM算法實例分析/190
10.4.1問題描述/190
10.4.2網路設計及學習結果/191
10.4.3結果輸出/191
10.5SOM算法源程式分析/192
10.6SOM算法的特點及套用/202
10.6.1SOM特點/202
10.6.2SOM套用/202
10.7小結/203
思考題/203第11章數據挖掘的發展/204
11.1Web挖掘/204
11.1.1Web數據挖掘定義/204
11.1.2Web數據挖掘分類/204
11.1.3Web數據挖掘的數據源/206
11.1.4Web數據挖掘中知識的分類/207
11.1.5Web數據挖掘的關鍵問題/208
11.2空間數據挖掘/209
11.2.1空間數據挖掘的定義與特點/209
11.2.2空間數據挖掘的體系結構/210
11.2.3空間數據挖掘可獲得的知識
類型/210
11.2.4空間數據挖掘的方法/212
11.3流數據挖掘/215
11.3.1流數據的特點/215
11.3.2流數據挖掘關鍵技術/215
11.3.3流數據挖掘的實際套用及前景/217
11.4數據挖掘與可視化技術/218
11.4.1什麼是可視化/218
11.4.2數據可視化技術分類/219
11.4.3數據挖掘可視化技術的套用/221
11.5小結/222
思考題/223參考文獻/224
4.5.1ID3算法特點/72
4.5.2ID3算法套用/72
4.6決策樹分類算法——C4.5算法原理/73
4.6.1C4.5算法/73
4.6.2C4.5算法的偽代碼/75
4.7C4.5算法實例分析/76
4.8C4.5算法源程式分析 /77
4.9C4.5算法的特點及套用/101
4.9.1C4.5算法特點/101
4.9.2C4.5算法套用/101
4.10小結/102
思考題/102第5章貝葉斯分類算法/103
5.1基本概念/103
5.1.1主觀機率/103
5.1.2貝葉斯定理/104
5.2貝葉斯分類算法原理/105
5.2.1樸素貝葉斯分類模型/105
5.2.2貝葉斯信念網路/107
5.3貝葉斯算法實例分析/110
5.3.1樸素貝葉斯分類器/110
5.3.2BBN/112
5.4貝葉斯算法源程式分析/114
5.5貝葉斯算法特點及套用/119
5.5.1樸素貝葉斯分類算法/119
5.5.2貝葉斯信念網/120
思考題/121第6章人工神經網路算法/122
6.1基本概念/122
6.1.1生物神經元模型/122
6.1.2人工神經元模型/123
6.1.3主要的神經網路模型/124
6.2BP算法原理/126
6.2.1Delta學習規則的基本原理/126
6.2.2BP網路的結構/126
6.2.3BP網路的算法描述/127
6.2.4標準BP網路的工作過程/129
6.3BP算法實例分析/130
6.4BP算法源程式分析/134
6.5BP算法的特點及套用/143
6.5.1BP算法特點/143
6.5.2BP算法套用/144
6.6小結/145
思考題/145第7章支持向量機/146
7.1基本概念/146
7.1.1支持向量機理論基礎/146
7.1.2統計學習核心理論/146
7.1.3學習過程的一致性條件/146
7.1.4函式集的VC維/147
7.1.5泛化誤差界/148
7.1.6結構風險最小化歸納原理/148
7.2支持向量機原理/149
7.2.1支持向量機核心理論/149
7.2.2最大間隔分類超平面/149
7.2.3支持向量機/150
7.2.4核函式分類/153
7.3支持向量機實例分析/154
7.4支持向量機的特點及套用/156
7.4.1支持向量機的特點/156
7.4.2支持向量機的套用/157
7.5小結/158
思考題/158第8章Kmeans聚類算法/159
8.1簡介/159
8.2Kmeans聚類算法原理/159
8.3Kmeans聚類算法實例分析/161
8.4Kmeans聚類算法源程式分析/164
8.5Kmeans聚類算法的特點及套用/171
8.5.1Kmeans聚類算法的特點/171
8.5.2Kmeans聚類算法的套用/171
8.6小結/172
思考題/172第9章K中心點聚類算法/173
9.1簡介/173
9.2K中心點聚類算法原理/173
9.3K中心點聚類算法實例分析/174
9.4K中心點聚類算法源程式分析/175
9.5K中心點聚類算法的特點及套用/183
9.5.1K中心點聚類算法的特點/183
9.5.2K中心點聚類算法的套用/183
9.6小結/183第10章神經網路聚類方法: SOM /184
10.1簡介/184
10.2競爭學習算法基礎/184
10.2.1自組織神經網路結構/184
10.2.2自組織神經網路的原理/185
10.3SOM算法原理/187
10.3.1SOM網路的拓撲結構/187
10.3.2SOM權值調整域/188
10.3.3SOM網路運行原理/189
10.3.4學習方法/189
10.4SOM算法實例分析/190
10.4.1問題描述/190
10.4.2網路設計及學習結果/191
10.4.3結果輸出/191
10.5SOM算法源程式分析/192
10.6SOM算法的特點及套用/202
10.6.1SOM特點/202
10.6.2SOM套用/202
10.7小結/203
思考題/203第11章數據挖掘的發展/204
11.1Web挖掘/204
11.1.1Web數據挖掘定義/204
11.1.2Web數據挖掘分類/204
11.1.3Web數據挖掘的數據源/206
11.1.4Web數據挖掘中知識的分類/207
11.1.5Web數據挖掘的關鍵問題/208
11.2空間數據挖掘/209
11.2.1空間數據挖掘的定義與特點/209
11.2.2空間數據挖掘的體系結構/210
11.2.3空間數據挖掘可獲得的知識
類型/210
11.2.4空間數據挖掘的方法/212
11.3流數據挖掘/215
11.3.1流數據的特點/215
11.3.2流數據挖掘關鍵技術/215
11.3.3流數據挖掘的實際套用及前景/217
11.4數據挖掘與可視化技術/218
11.4.1什麼是可視化/218
11.4.2數據可視化技術分類/219
11.4.3數據挖掘可視化技術的套用/221
11.5小結/222
思考題/223參考文獻/224