《數據挖掘與機器學習:PMML建模下》是2020年化學工業出版社出版的圖書。
基本介紹
- 中文名:數據挖掘與機器學習:PMML建模下
- 作者:潘風文//黃春芳
- 類別:機器學習
- 出版社:化學工業出版社
- 出版時間:2020年
- 開本:16 開
- 裝幀:平裝
- ISBN:9787122369871
內容簡介,圖書目錄,
內容簡介
本書詳細描述了PMML規範(Ver4.3)所支持的8種模型:神經網路模型、決策樹模型、規則集模型、序列模型、評分卡模型、支持向量機模型、時間序列模型和聚合模型。全書不是簡單地介紹PMML語法,而是融合各種挖掘模型基礎知識和算法知識,告訴開發者如何融會貫通地掌握、使用PMML語言,不僅能夠學習到標準的PMML模型表達方式,而且能學習機器學習模型的豐富知識,從而熟練地把PMML語言套用到自己的項目實踐中。
圖書目錄
1 神經網路模型(NeuralNetwork) 1
1.1 神經網路模型基礎知識 2
1.2 神經網路模型算法簡介 5
1.3 神經網路模型元素 9
1.3.1 模型屬性 10
1.3.2 模型子元素 14
1.3.3 評分套用過程 28
2 決策樹模型(TreeModel) 29
2.1 決策樹模型基礎知識 30
2.1.1 決策樹模型簡介 30
2.1.2 邏輯謂詞表達式 31
2.2 決策樹模型算法簡介 33
2.2.1 卡方自動互動檢驗算法(CHAID) 33
2.2.2 疊代二叉樹ID3 42
2.2.3 分類器C4.5和C5.0 47
2.2.4 分類與回歸樹算法CART 53
2.3 決策樹模型元素 54
2.3.1 模型屬性 56
2.3.2 模型子元素 59
2.3.3 評分套用過程 68
3 規則集模型(RuleSetModel) 79
3.1 規則集模型基礎知識 80
3.2 規則集模型元素 80
3.2.1 模型屬性 81
3.2.2 模型子元素 81
3.2.3 評分套用過程 89
4 序列模型(SequenceModel) 93
4.1 序列模型基礎知識 94
4.2 序列模型算法簡介 97
4.2.1 GSP算法 97
4.2.2 SPADE算法 101
4.2.3 PrefixSpan算法 103
4.3 序列模型元素 104
4.3.1 模型屬性 106
4.3.2 模型子元素 107
4.3.3 評分套用過程 118
5 評分卡模型(Scorecard) 119
5.1 評分卡模型基礎知識 120
5.2 評分卡模型算法簡介 121
5.3 評分卡模型元素 131
5.3.1 模型屬性 132
5.3.2 模型子元素 134
5.3.3 評分套用過程 143
6 支持向量機模型(SupportVectorMachineModel) 145
6.1 支持向量機模型基礎知識 146
6.2 支持向量機模型算法簡介 148
6.3 支持向量機模型元素 152
6.3.1 模型屬性 154
6.3.2 模型子元素 155
6.3.3 評分套用過程 164
7 時間序列模型(TimeSeriesModel) 167
7.1 時間序列模型基礎知識 168
7.2 時間序列模型算法簡介 171
7.2.1 算法概述 172
7.2.2 指數平滑算法 173
7.3 時間序列模型元素 176
7.3.1 模型屬性 177
7.3.2 模型子元素 178
7.3.3 評分套用過程 192
8 聚合模型(MiningModel) 195
8.1 模型聚合基礎知識 196
8.2 挖掘模型MiningModel 197
附錄 225
後記 227