數據挖掘實用機器學習技術

內容簡介

本書介紹數據挖掘的基本理論與實踐方法。主要內容包括：各種模型(決策樹，關聯規則、線性模型、聚類、貝葉斯網以及神經網路)以及在實踐中的運用，所存任缺陷的分析。安全地清理數據集、建立以及評估模型的預測質量的方法，並且提供了一個公開的數據挖掘工作平台Weka。Weka系統擁有進行數據挖掘仟務的圖形用戶界面，有助於理解模型，是一個實用並且深受歡迎的工具。

本書適合作為高等學校本科生或研究生的教材，也可供相關技術人員參考。

作者簡介

Ian H.Witten，紐西蘭懷卡托大學計算機科學系教授，ACM和紐西蘭皇（IFIP）頒發的Namur獎項。他的著作包括《Managing Gigabytes:Compressing and Indexing Documents and Images》、《How to Build a Digital Library》以及眾多的期刊和學會文章。

圖書目錄

出版者的話

專家指導委員會

譯者序

中文版前言

序

前言

第一部分機器學習工具與技術

第1章緒論

1.l 數據挖掘和機器學習

l.2 簡單的例子：天氣問題和其他

l.3 套用領域-

1.4 機器學習和統計學

1.5 用於搜尋的概括

l.6 數據挖掘和道德

1.7 補允讀物

第2章輸入概念、實例和屬性

2.1 概念

2.2 樣本

2.3 屬性

2.4 輸入準備

2.5 補充讀物

第3章輸出：知識表達

3.1 決策表

3.2 決策樹

3.3 分類規則

3.4 關聯規則

3.5 包含例外的規則

3.6 包含關係的規則

3.7 數值預測樹

3.8 基於實例的表達

3.9 聚類

3.10 補充讀物

第4章算法基本方法

4.1 推斷基本規則

4.2 統計建模

4.3 分治法：創建決策樹

4.4 覆蓋算法：建立規則

4.5 挖掘關聯規州

4.6 線性模型

4.7 基於實例的學習

4.8 聚類

4.9 補充讀物

第5章可信度：評估機器學習結果

5.1 訓練和測試

5.2 預測性能

5.3 交叉驗證

5.4 其他估計法

5.5 可信度：評估機器學習結果

5.6 預測機率

5.7 計算成本

數據挖掘實用機器學習技術

基本介紹

內容簡介

作者簡介

圖書目錄

相關詞條

熱門詞條