數據挖掘原理(第4版)

數據挖掘原理(第4版)

《數據挖掘原理(第4版)》是清華大學出版社2022年出版的圖書,作者是[英] 麥克斯·布拉默(Max Bramer),譯者是李曉峰和逄金輝。

基本介紹

  • 中文名:數據挖掘原理(第4版)
  • 作者:[英] 麥克斯·布拉默(Max Bramer)
  • 原作品:Principles of Data Mining Fourth Edtion
  • 譯者:李曉峰、逄金輝
  • 出版社:清華大學從出版社
  • 出版時間:2022年1月
  • 定價:118 元
  • 開本:16 開
  • 裝幀:平裝
  • ISBN:9787302596493
內容簡介,圖書目錄,作者簡介,

內容簡介

本書解釋、探索了數據挖掘的主要技術,可以從數據中自動提取隱式和潛在有用的信息。數據挖掘越來越多地用於商業、科學和其他套用領域,它側重於分類、關聯規則挖掘和聚類。
書中對每個主題都進行了清晰的解釋,重點是算法而不是數學公式,並通過詳細的有效示例加以說明。本書是為沒有強數學或統計學背景的讀者寫的,並詳細解釋了使用的所有公式。
本書適合作為本科生或研究生層次的教材,適用專業包括計算機科學、商業研究、市場行銷、人工智慧、生物信息學和法醫學。
為了幫助讀者自學,本書旨在幫助普通讀者理解什麼是“黑盒”,這樣他們就可以有差別地使用商業數據挖掘包,高級讀者或學術研究者可以對未來該領域的技術進步做出貢獻。
書中每一章都有實踐練習,讓讀者檢查自己的進度。附錄還包括所使用的技術術語的完整術語表。
數據挖掘原理包括對流數據分類算法的介紹,包括平穩數據(底層模型是固定的)和依賴時間的數據(底層模型不時變化)——這種現象稱為概念漂移。
本書提供了前饋神經網路與反向傳播的詳細描述,並顯示它如何可以用於分類。

圖書目錄

第1章 數據挖掘簡介
1.1 數據爆炸
1.2 知識發現
1.3 數據挖掘的套用
1.4 標籤數據和無標籤數據
1.5 監督學習:分類
1.6 監督學習:數值預測
1.7 無監督學習:關聯規則
1.8 無監督學習:聚類
第2章 用於挖掘的數據
2.1 標準制定
2.2 變數的類型
2.3 數據準備
2.4 缺失值
2.4.1 丟棄實例
2.4.2 用最頻繁值/平均值替換
2.5 減少屬性個數
2.6 數據集的UCI存儲庫
2.7 本章小結
2.8 自我評估練習
第3章 分類簡介:樸素貝葉斯和最近鄰算法
3.1 什麼是分類
3.2 樸素貝葉斯分類器
3.3 最近鄰分類
3.3.1 距離測量
3.3.2 標準化
3.3.3 處理分類屬性
3.4 急切式和懶惰式學習
3.5 本章小結
3.6 自我評估練習
第4章 使用決策樹進行分類
4.1 決策規則和決策樹
4.1.1 決策樹:高爾夫示例
4.1.2 術語
4.1.3 degrees數據集
4.2 TDIDT算法
4.3 推理的類型
4.4 本章小結
4.5 自我評估練習
第5章 決策樹歸納:使用熵進行屬性選擇
5.1 屬性選擇:一個實驗
5.2 替代決策樹
5.2.1 足球/無板籃球示例
5.2.2 匿名數據集
5.3 選擇要分裂的屬性:使用熵
……
第6章 決策樹歸納:使用頻率表進行屬性選擇
第7章 估計分類器的預測精度
第8章 連續屬性
第9章 避免決策樹的過度擬合
第10章 關於熵的更多信息
第11章 歸納分類的模組化規則
第12章 度量分類器的性能
第13章 處理大量數據
第14章 集成分類
第15章 比較分類器
第16章 關聯規則挖掘Ⅰ
第17章 關聯規則挖掘Ⅱ
第18章 關聯規則挖掘Ⅲ:頻繁模式樹
第19章 聚類
第20章 文本挖掘
第21章 分類流數據
第22章 分類流數據Ⅱ:時間權關數據
第23章 神經網路概論
附錄A 基本數學知識
附錄B 數據集
附錄C 更多信息來源
附錄D 辭彙表和符號
附錄E 自我評估練習題答案

作者簡介

麥克斯·布拉默是英國朴次茅斯大學信息技術系榮譽教授、IFIP副主席、英國計算機學會AI專家組主席。
自從 “數據挖掘”“資料庫中的知識發現”“大數據”和“預測分析”等技術興起以來,Max積極參與了多個數據挖掘項目,尤其是與數據自動分類相關的項目。Max發表了大量技術文章,曾撰寫Research and Development in Intelligent Systems等著作。Max具有多年的本科和研究生教學經驗。

相關詞條

熱門詞條

聯絡我們