數據挖掘基礎及其套用

數據挖掘基礎及其套用

《數據挖掘基礎及其套用》是一本2020年8月1日西安電子科技大學出版社出版的圖書,作者是馬小科。本書全面介紹了數據挖掘基礎及其套用,重點闡述了數據挖掘經典算法、原理及其套用。

基本介紹

  • 中文名:數據挖掘基礎及其套用
  • 作者:馬小科
  • 出版社:西安電子科技大學出版社
  • ISBN:9787560658810
內容簡介,圖書目錄,

內容簡介

《數據挖掘基礎及其套用》全面介紹了數據挖掘基礎及其套用,重點闡述了數據挖掘經典算法、原理及其套用,旨在為讀者提供數據挖掘所需的基本知識,使讀者能夠從整體上對數據挖掘內容與方法有所理解。該書內容包含五個主題:數據、分類、關聯規則、聚類分析及其套用。對於分類、關聯規則、聚類分析這三個主題,首先介紹了其基本概念與經典算法,在後續的章節中闡述了其更高級的主題。
《數據挖掘基礎及其套用》可作為高等學校計算機相關專業的高年級本科生與研究生教材,也可作為需要理解數據挖掘和智慧型系統的專業人員的參考書。

圖書目錄

第1章 緒論
1.1 數據概述
1.2 數據與社會變革
1.2.1 數據改變思維模式
1.2.2 數據改變社會模式
1.2.3 數據改變國家戰略
1.3 數據挖掘的定義
1.4 數據挖掘的發展與套用
1.4.1 數據挖掘的發展
1.4.2 數據挖掘的套用
1.5 數據挖掘的任務與挑戰
1.5.1 數據挖掘的任務
1.5.2 數據挖掘面臨的挑戰
1.6 本書內容與組織
1.6.1 章節安排
1.6.2 輔助閱讀材料
本章小結
習題
參考文獻
第2章 數據
2.1 數據的定義
2.2 屬性的分類
2.3 數據類型
2.3.1 數據的特性
2.3.2 數據的分類
2.4 相似性計算
2.4.1 相似性定義
2.4.2 單屬性相似性度量
2.4.3 多屬性相似性度量
本章小結
習題
參考文獻
第3章 數據預處理
3.1 數據質量
3.1.1 誤差與噪聲
3.1.2 套用問題
3.2 數據預處理概述
3.3 數據清洗
3.3.1 缺失數據處理
3.3.2 噪聲數據處理
3.3.3 不一致數據處理
3.4 數據集成與轉換
3.4.1 數據集成處理
3.4.2 數據轉換處理
3.4.3 離散化和二進制化
3.5 數據約簡
3.5.1 數據立方歸併
3.5.2 維數約簡
3.5.3 數據壓縮
3.5.4 數據塊約簡
本章小結
習題
參考文獻
第4章 分類Ⅰ:概念與決策樹算法
4.1 引言
4.1.1 分類的定義
4.1.2 分類的套用
4.1.3 分類算法
4.2 決策樹
4.3 決策樹原理與構建
4.3.1 算法原理
4.3.2 分支原則
4.3.3 最優劃分
4.4 補充算法
4.4.1 ID3算法
4.4.2 C4.5 算法
4.5 過擬合/欠擬合
4.5.1 定義
4.5.2 規避策略
4.6 分類準確性評估
4.6.1 準確性
4.6.2 ROC曲線
本章小結
習題
參考文獻
第5章 分類Ⅱ:支持向量機
5.1 引言
5.2 數學模型
5.2.1 算法動機
5.2.2 數學模型
5.3 最佳化理論
5.3.1 凸最佳化
5.3.2 對偶理論
5.3.3 拉格朗日方法和KKT條件
5.4 SVM最佳化
5.4.1 硬間隔SVM
5.4.2 軟間隔SVM
5.5 非線性SVM
5.6 SVM的套用
5.6.1 人臉識別
5.6.2 語音識別
5.6.3 圖像處理
本章小結
習題
參考文獻
第6章 分類Ⅲ:機率分類與回歸
6.1 引言
6.2 貝葉斯公式
6.2.1 機率基礎
6.2.2 圖論基礎
6.2.3 信息理論
6.3 貝葉斯分類算法
6.3.1 算法原理
6.3.2 樸素貝葉斯算法
6.3.3 算法套用
6.4 貝葉斯信念網路
6.4.1 定義與推理
6.4.2 結構學習(網路構建)
6.4.3 貝葉斯信念網路的特點
6.5 回歸分析
6.5.1 預備知識
6.5.2 線性回歸
6.5.3 多元線性回歸
6.5.4 最小二乘同歸
本章小結
……
第7章 關聯規則Ⅰ:頻繁模式挖掘
第8章 關聯規則Ⅱ:關聯規則挖掘
第9章 聚類分析Ⅰ:概念與K-均值算法
第10章 聚類分析Ⅱ:分層聚類與密度聚類
第11章 社交網路圖聚類
第12章 生物網路挖掘
附錄 數學基礎

相關詞條

熱門詞條

聯絡我們