《數據挖掘與機器學習——WEKA套用技術與實踐(第二版)》是2016年出版的圖書,作者是袁梅宇。
基本介紹
- 書名:數據挖掘與機器學習——WEKA套用技術與實踐(第二版)
- 作者:袁梅宇
- ISBN:9787302444701
- 定價:79元
- 出版時間:2016.08.01
基本簡介,圖書目錄,
基本簡介
本書藉助代表當今數據挖掘和機器學習最高水平的著名開源軟體Weka,通過大量的實踐操作,使讀者了解並掌握數據挖掘和機器學習的相關技能,拉近理論與實踐的距離。全書共分9章,主要內容包括Weka介紹、探索者界面、知識流界面、實驗者界面、命令行界面、Weka高級套用、Weka API、學習方案原始碼分析和機器學習實戰。本書系統講解Weka 3.7.13的操作、理論和套用,內容全面、實例豐富、可操作性強,做到理論與實踐的統一。本書適合數據挖掘和機器學習相關人員作為技術參考書使用,也適合用作計算機專業高年級本科生和研究生的教材或教學參考用書。
圖書目錄
第1章 Weka介紹 1
1.1 Weka簡介 2
1.1.1 Weka歷史 3
1.1.2 Weka功能簡介 3
1.2 基本概念 5
1.2.1 數據挖掘和機器學習 5
1.2.2 數據和數據集 5
1.2.3 ARFF格式 6
1.2.4 預處理 7
1.2.5 分類與回歸 10
1.2.6 聚類分析 12
1.2.7 關聯分析 12
1.3 Weka系統安裝 13
1.3.1 系統要求 13
1.3.2 安裝過程 14
1.3.3 Weka使用初步 16
1.3.4 系統運行注意事項 18
1.4 訪問資料庫 24
1.4.1 配置檔案 25
1.4.2 資料庫設定 26
1.4.3 常見問題及解決辦法 27
1.5 示例數據集 28
1.5.1 天氣問題 29
1.5.2 鳶尾花 30
1.5.3 CPU 31
1.5.4 玻璃數據集 32
1.5.5 美國國會投票記錄 33
1.5.6 乳腺癌數據集 33
課後強化練習 34
第2章 探索者界面 35
2.1 圖形用戶界面 36
2.1.1 標籤頁簡介 36
2.1.2 狀態欄 37
2.1.3 圖像輸出 37
2.1.4 手把手教你用 37
2.2 預處理 40
2.2.1 載入數據 40
2.2.2 屬性處理 43
2.2.3 過濾器 44
2.2.4 過濾器算法介紹 46
2.2.5 手把手教你用 52
2.3 分類 59
...
2.3.1分類器選擇 59
2.3.2分類器訓練 61
2.3.3分類器輸出 62
2.3.4分類算法介紹 65
2.3.5分類模型評估 79
2.3.6手把手教你用 81
2.4聚類 98
2.4.1Cluster標籤頁的操作 98
2.4.2聚類算法介紹 99
2.4.3手把手教你用 101
2.5關聯 107
2.5.1Associate標籤頁的操作 107
2.5.2關聯算法介紹 108
2.5.3手把手教你用 111
2.6選擇屬性 117
2.6.1Selectattributes標籤頁的
操作 118
2.6.2選擇屬性算法介紹 119
2.6.3手把手教你用 120
2.7可視化 128
2.7.1Visualize標籤頁 128
2.7.2邊界可視化工具 131
2.7.3代價/收益分析可視化 133
2.7.4手把手教你用 134
課後強化練習 140
第3章知識流界面 143
3.1知識流介紹 144
3.1.1知識流特性 144
3.1.2知識流界面布局 145
3.2知識流組件 148
3.2.1數據源 148
3.2.2數據接收器 151
3.2.3評估器 155
3.2.4可視化器 156
3.2.5其他工具 158
3.3使用知識流組件 160
3.4手把手教你用 162
課後強化練習 181
第4章實驗者界面 183
4.1簡介 184
4.2標準實驗 185
4.2.1簡單實驗 185
4.2.2高級實驗 190
4.2.3手把手教你用 198
4.3遠程實驗 210
4.3.1遠程實驗設定 210
4.3.2手把手教你用 213
4.4分析結果 221
4.4.1獲取實驗結果 221
4.4.2動作 221
4.4.3配置測試 222
4.4.4保存結果 225
4.4.5手把手教你用 225
課後強化練習 229
第5章命令行界面 231
5.1命令行界面介紹 232
5.1.1命令調用 233
5.1.2命令自動完成 234
5.2Weka結構 235
5.2.1類實例和包 235
5.2.2weka.core包 236
5.2.3weka.classifiers包 237
5.2.4其他包 238
5.3命令行選項 238
5.3.1常規選項 239
5.3.2特定選項 241
5.4過濾器和分類器選項 242
5.4.1過濾器選項 242
5.4.2分類器選項 245
5.4.3手把手教你用 247
5.5包管理器 252
5.5.1命令行包管理器 252
5.5.2運行安裝的算法 254
課後強化練習 255
第6章Weka高級套用 257
6.1貝葉斯網路 258
6.1.1簡介 258
6.1.2貝葉斯網路編輯器 261
6.1.3在探索者界面中使用貝葉斯
網路 269
6.1.4結構學習 270
6.1.5分布學習 272
6.1.6查看貝葉斯網路 273
6.1.7手把手教你用 276
6.2神經網路 286
6.2.1GUI使用 286
6.2.2手把手教你用 289
6.3文本分類 293
6.3.1 文本分類示例 294
6.3.2分類真實文本 298
6.3.3手把手教你用 300
6.4時間序列分析及預測 306
6.4.1使用時間序列環境 306
6.4.2手把手教你用 318
課後強化練習 326
第7章WekaAPI 327
7.1載入數據 328
7.1.1從檔案載入數據 328
7.1.2從資料庫載入數據 329
7.1.3手把手教你用 330
7.2保存數據 335
7.2.1保存數據至檔案 335
7.2.2保存數據至資料庫 335
7.2.3手把手教你用 336
7.3處理選項 339
7.3.1選項處理方法 339
7.3.2手把手教你用 340
7.4記憶體數據集處理 341
7.4.1在記憶體中創建數據集 341
7.4.2打亂數據順序 345
7.4.3手把手教你用 345
7.5過濾 349
7.5.1批量過濾 350
7.5.2即時過濾 351
7.5.3手把手教你用 351
7.6分類 355
7.6.1分類器構建 355
7.6.2分類器評估 356
7.6.3實例分類 358
7.6.4手把手教你用 359
7.7聚類 370
7.7.1聚類器構建 370
7.7.2聚類器評估 371
7.7.3實例聚類 373
7.7.4手把手教你用 373
7.8屬性選擇 379
7.8.1使用元分類器 380
7.8.2使用過濾器 380
7.8.3使用底層API 381
7.8.4手把手教你用 381
7.9可視化 384
7.9.1ROC曲線 385
7.9.2圖 385
7.9.3手把手教你用 386
7.10序列化 391
7.10.1序列化基本方法 391
7.10.2手把手教你用 392
7.11文本分類綜合示例 395
7.11.1程式運行準備 395
7.11.2源程式分析 396
7.11.3運行說明 403
課後強化練習 404
第8章學習方案原始碼分析 405
8.1NaiveBayes原始碼分析 406
8.2實現分類器的約定 427
課後強化練習 429
第9章機器學習實戰 431
9.1數據挖掘過程概述 432
9.1.1CRISP-DM過程 432
9.1.2數據預處理 433
9.1.3挖掘項目及工具概述 434
9.2實戰KDDCup1999 434
9.2.1任務描述 435
9.2.2數據集描述 436
9.2.3挖掘詳細過程 438
9.3實戰KDDCup2010 447
9.3.1任務描述 447
9.3.2數據集描述 447
9.3.3挖掘詳細過程 450
9.3.4更接近實際的挖掘過程 459
課後強化練習 471
附錄A中英文術語對照 472
附錄BWeka算法介紹 476
過濾器算法介紹 476
分類算法介紹 498
聚類算法介紹 526
關聯算法介紹 530
選擇屬性算法介紹 532
參考文獻 537