數據挖掘（第2版）(2023年電子工業出版社出版的圖書)

內容簡介

本書內容分為數據挖掘理論和數據挖掘實踐兩部分。數據挖掘理論部分主要包括數據挖掘的基本概念、數據預處理、聚類分析、分類與回歸、關聯規則挖掘及離群點檢測。數據挖掘實踐部分討論數據挖掘在文本挖掘和金融領域中的套用，通過虛假新聞檢測和社交平台情緒分析等案例，展示數據挖掘在文本挖掘方面的套用；通過潛在貸款客戶挖掘、貸款違約等案例展示數據挖掘在金融領域的套用。本書可作為高等學校計算機、數據科學與大數據、電子商務、信息科學等相關專業的教材或參考書，也可供從事數據挖掘研究的科研、技術人員參考。

圖書目錄

上篇理論篇

第1章緒論 2

1．1 數據挖掘技術使用背景 4

1．2 數據挖掘任務及過程 5

1．2．1 數據挖掘定義 5

1．2．2 數據挖掘任務 5

1．2．3 數據挖掘過程 7

1．2．4 數據挖掘對象 8

1．2．5 數據挖掘工具及其選擇 13

1．3 數據挖掘套用 13

1．3．1 數據挖掘在計算機領域中的套用 14

1．3．2 數據挖掘在商業領域中的套用 15

1．3．3 數據挖掘在其他領域中的套用 16

1．3．4 數據挖掘技術的前景 17

1．4 數據挖掘與隱私保護 18

本章小結 20

習題1 20

第2章數據處理基礎 23

2．1 數據 24

2．1．1 數據及數據類型 24

2．1．2 數據集的類型 25

2．2 數據探索 27

2．2．1 描述性統計分析 27

2．2．2 數據可視化 30

2．2．3 辛普森悖論 34

2．3 數據預處理 37

2．3．1 數據清理 38

2．3．2 數據集成 41

2．3．3 特徵變換 41

2．3．4 數據歸約 48

2．4 相似性度量 55

2．4．1 屬性之間的相似性度量 56

2．4．2 對象之間的相似性度量 57

本章小結 60

習題2 61

第3章分類和回歸 65

3．1 分類概述 66

3．2 決策樹分類方法 67

3．2．1 決策樹的基本概念 67

3．2．2 構建決策樹的要素 68

3．2．3 Hunt算法 73

3．2．4 C4．5算法 74

3．2．5 CART算法 79

3．2．6 決策樹算法的特點 90

3．3 貝葉斯分類方法 90

3．3．1 貝葉斯定理 91

3．3．2 樸素貝葉斯分類算法 92

3．3．3 貝葉斯信念網路 96

3．4 k-最近鄰分類方法 97

3．4．1 k-最近鄰分類的基本問題 98

數據挖掘（第2版）(2023年電子工業出版社出版的圖書)

基本介紹

內容簡介

圖書目錄

相關詞條

熱門詞條

數據挖掘 （第2版）(2023年電子工業出版社出版的圖書)

基本介紹

內容簡介

圖書目錄

相關詞條

熱門詞條

數據挖掘（第2版）(2023年電子工業出版社出版的圖書)