《數據挖掘實用機器學習技術》是2006年機械工業出版社出版的圖書,原作者是(紐西蘭)威滕(Witten,I.H.)、(紐西蘭)弗蘭克(Frank,E.),由董琳譯著。
基本介紹
- 書名:數據挖掘實用機器學習技術
- 作者:(紐西蘭)威滕(Witten,I.H.)、(紐西蘭)弗蘭克(Frank,E.)
- 譯者:董琳
- ISBN:9787111182054
- 類別:數據倉庫與數據挖掘
- 頁數:362頁
- 定價:48.00元
- 出版社:機械工業出版社
- 出版時間:2006年7月1日
- 裝幀:平裝
- 紙張:膠版紙
- 叢書名:計算機科學叢書
- 版次:1
內容簡介,作者簡介,圖書目錄,
內容簡介
本書介紹數據挖掘的基本理論與實踐方法。主要內容包括:各種模型(決策樹,關聯規則、線性模型、聚類、貝葉斯網以及神經網路)以及在實踐中的運用,所存任缺陷的分析。安全地清理數據集、建立以及評估模型的預測質量的方法,並且提供了一個公開的數據挖掘工作平台Weka。Weka系統擁有進行數據挖掘仟務的圖形用戶界面,有助於理解模型,是一個實用並且深受歡迎的工具。
本書適合作為高等學校本科生或研究生的教材,也可供相關技術人員參考。
作者簡介
Ian H.Witten,紐西蘭懷卡托大學計算機科學系教授,ACM和紐西蘭皇(IFIP)頒發的Namur獎項。他的著作包括《Managing Gigabytes:Compressing and Indexing Documents and Images》、《How to Build a Digital Library》以及眾多的期刊和學會文章。
圖書目錄
出版者的話
專家指導委員會
譯者序
中文版前言
序
前言
第一部分 機器學習工具與技術
第1章 緒論
1.l 數據挖掘和機器學習
l.2 簡單的例子:天氣問題和其他
l.3 套用領域-
1.4 機器學習和統計學
1.5 用於搜尋的概括
l.6 數據挖掘和道德
1.7 補允讀物
第2章 輸入概念、實例和屬性
2.1 概念
2.2 樣本
2.3 屬性
2.4 輸入準備
2.5 補充讀物
第3章 輸出:知識表達
3.1 決策表
3.2 決策樹
3.3 分類規則
3.4 關聯規則
3.5 包含例外的規則
3.6 包含關係的規則
3.7 數值預測樹
3.8 基於實例的表達
3.9 聚類
3.10 補充讀物
第4章 算法基本方法
4.1 推斷基本規則
4.2 統計建模
4.3 分治法:創建決策樹
4.4 覆蓋算法:建立規則
4.5 挖掘關聯規州
4.6 線性模型
4.7 基於實例的學習
4.8 聚類
4.9 補充讀物
第5章 可信度:評估機器學習結果
5.1 訓練和測試
5.2 預測性能
5.3 交叉驗證
5.4 其他估計法
5.5 可信度:評估機器學習結果
5.6 預測機率
5.7 計算成本
5.8 評估數值預測
5.9 最短描述長度原理
5.10 聚類方法中套用MDL原理
5.1l 補充讀物
第6章 實現:真正的機器學習方案
……
第7章 轉換:處理輸入和輸出
第8章 繼續擴展和套用
第9章 Weka簡介
第10章 Explorer界面
第1l章 Knowledge Flow界面
第12章 Experimenter界面
第13章 命令行界面
第14章 嵌入式機器學習
第15章 編寫新學習方案
參考文獻
索引