數據挖掘:概念、模型、方法和算法

數據挖掘:概念、模型、方法和算法

《數據挖掘——概念、模型、方法和算法》是一本由清華大學出版社在2004年出版的書籍。作為一本教科書,本書全面講述了數據挖掘的概念、模型、方法和算法。本書共包括13章和2個附錄,全面、詳細地講述了從數據挖掘的基本概念到數據挖掘的整個過程,以及數據挖掘工具及其典型套用領域。本書編寫嚴謹、內容權威、結構合理、科學規範、語言流暢,特別適合作為高等院校數據挖掘課程的教科書,還適合作為數據挖掘研究人員必備的參考書。

基本介紹

  • 書名:數據挖掘:概念、模型、方法和算法
  • 作者:(美)Mehmed Kantardzic
  • ISBN:9787302307143
  • 頁數:403
  • 出版社:清華大學出版社 
  • 出版時間:2013年
  • 裝幀:平裝
  • 開本:16
  • 字數:655000 
出版信息,摘要,目錄,

出版信息

拼音題名
shu ju wa jue
其它題名
並列題名
ISBN
978-7-302-30714-3
責任者
(美)Mehmed Kantardzic著
出版者
清華大學出版社
出版地
北京
出版時間
2013
中圖分類號
TP311.13
附註
國外計算機科學經典教材

摘要

本書全面講述了數據挖掘的概念、模型、方法和算法,包括14章和2個附錄,詳細講述了從數據挖掘的基本概念到數據挖掘的整個過程,以及數據挖掘工具及其典型套用領域。

目錄

第1章 數據挖掘的概念
1.1 概述
1.2 數據挖掘的起源
1.3 數據挖掘過程
1.4 大型數據集
1.5 數據倉庫
1.6 數據挖掘的商業方面:為什麼數據挖掘項目會失敗
1.7 本書結構安排
1.8 複習題
1.9 參考書目
第2章 數據準備
2.1 原始數據的表述
2.2 原始數據的特性
2.3 原始數據的轉換
2.3.1 標準化
2.3.2 數據平整
2.3.3 差值和比率
2.4 丟失數據
2.5 時間相關數據
2.6 異常點分析
2.7 複習題
2.8 參考書目
第3章 數據歸約
3.1 大型數據集的維度
3.2 特徵歸約
3.2.1 特徵選擇
3.2.2 特徵提取
3.3 re1ief算法
3.4 特徵排列的熵度量
3.5 主成分分析
3.6 值歸約
3.7 特徵離散化:chimerge技術
3.8 案例歸約
3.9 複習題
3.10 參考書目
第4章 從數據中學習
4.1 學習機器
4.2 統計學習原理
4.3 學習方法的類型
4.4 常見的學習任務
4.5 支持向量機
4.6 knn:最近鄰分類器
4.7 模型選擇與泛化
4.8 模型的評估
4.9 90%準確的情形
4.9.1 保險欺詐檢測
4.9.2 改進心臟護理
4.10 複習題
4.11 參考書目
第5章 統計方法
5.1 統計推斷
5.2 評測數據集的差異
5.3 貝葉斯定理
5.4 預測回歸
5.5 方差分析
5.6 對數回歸
5.7 對數—線性模型
5.8 線性判別分析
5.9 複習題
5.10 參考書目
第6章 決策樹和決策規則
6.1 決策樹
6.2 c4.5算法:生成決策樹
6.3 未知屬性值
6.4 修剪決策樹
6.5 c4.5算法:生成決策規則
6.6 cart算法和gini指標
6.7 決策樹和決策規則的局限性
6.8 複習題
6.9 參考書目
第7章 人工神經網路
7.1 人工神經元的模型
7.2 人工神經網路的結構
7.3 學習過程
7.4 使用ann完成的學習任務
7.4.1 模式聯想
7.4.2 模式識別
7.5 多層感知機
7.6 競爭網路和競爭學習
7.7 som
7.8 複習題
7.9 參考書目
第8章 集成學習
8.1 集成學習方法論
8.2 多學習器組合方案
8.3 bagging和boosting
8.4 adaboost算法
8.5 複習題
8.6 參考書目
第9章 聚類分析
9.1 聚類的概念
9.2 相似度的度量
9.3 凝聚層次聚類
9.4 分區聚類
9.5 增量聚類
9.6 dbscan算法
9.7 birch算法
9.8 聚類驗證
9.9 複習題
9.10 參考書目
第10章 關聯規則
10.1 購物籃分析
10.2 apriori算法
10.3 從頻繁項集中得到關聯規則
10.4 提高apriori算法的效率
10.5 fp增長方法
10.6 關聯分類方法
10.7 多維關聯規則挖掘
10.8 複習題
10.9 參考書目
第11章 web挖掘和文本挖掘
11.1 web挖掘
11.2 web內容、結構與使用挖掘
11.3 hits和logsom算法
11.4 挖掘路徑遍歷模式
11.5 pagerank算法
11.6 文本挖掘
11.7 潛在語義分析
11.8 複習題
11.9 參考書目
第12章 數據挖掘高級技術
12.1 圖挖掘
12.2 時態數據挖掘
12.2.1 時態數據表示
12.2.2 序列之間的相似性度量
12.2.3 時態數據模型
12.2.4 數據挖掘
12.3 空間數據挖掘(sdm)
12.4 分散式數據挖掘(ddm)
12.5 關聯並不意味著存在因果關係
12.6 數據挖掘的隱私、安全及法律問題
12.7 複習題
12.8 參考書目
第13章 遺傳算法
13.1 遺傳算法的基本原理
13.2 用遺傳算法進行最佳化
13.2.1 編碼方案和初始化
13.2.2 適合度估計
13.2.3 選擇
13.2.4 交叉
13.2.5 突變
13.3 遺傳算法的簡單例證
13.3.1 表述
13.3.2 初始群體
13.3.3 評價
13.3.4 交替
13.3.5 遺傳運算元
13.3.6 評價(第二次疊代)
13.4 圖式
13.5 旅行推銷員問題
13.6 使用遺傳算法的機器學習
13.6.1 規則交換
13.6.2 規則概化
13.6.3 規則特化
13.6.4 規則分割
13.7 遺傳算法用於聚類
13.8 複習題
13.9 參考書目
第14章 模糊集和模糊邏輯
14.1 模糊集
14.2 模糊集的運算
14.3 擴展原理和模糊關係
14.4 模糊邏輯和模糊推理系統
14.5 多因子評價
14.6 從數據中提取模糊模型
14.7 數據挖掘和模糊集
14.8 複習題
14.9 參考書目
第15章 可視化方法
15.1 感知和可視化
15.2 科學可視化和信息可視化
15.3 平行坐標
15.4 放射性可視化
15.5 使用自組織映射進行可視化
15.6 數據挖掘的可視化系統
15.7 複習題
15.8 參考書目
附錄a 數據挖掘工具
附錄b 數據挖掘套用

相關詞條

熱門詞條

聯絡我們