數據挖掘：方法與套用

內容簡介

本書主要根據作者近幾年在清華大學面向研究生和本科生開設的“數據挖掘：方法與套用”課程的教學實踐與積累，參考近幾年國外著名大學相關課程的教學體系，系統的介紹數據挖掘的基本概念和基本原理方法；結合一些典型的套用實例展示用數據挖掘的思維方法求解問題的一般性模式與思路。

本書可作為有一定數據結構、資料庫和程式設計基礎的研究生或本科生開展數據挖掘知識學習和研究的入門性教材與參考讀物。

圖書目錄

第1章緒論1

1.1套用背景1

1.1.1商業上的驅動2

1.1.2科學研究上的驅動2

1.1.3數據挖掘伴隨著資料庫技術而出現2

1.2什麼是數據挖掘3

1.2.1基本描述3

1.2.2關於知識發現4

1.3數據挖掘的主要技術5

1.4數據挖掘的主要研究內容7

1.5數據挖掘面臨的主要問題10

1.6數據挖掘相關的資料11

1.7本書的總體章節安排12

1.8小結13

參考文獻13

第2章數據預處理14

2.1前言14

2.2數據預處理的基本概念14

2.2.1數據的基本概念14

2.2.2為什麼要進行數據預處理17

2.2.3數據預處理的任務18

2.3數據的描述18

2.3.1描述數據的中心趨勢19

2.3.2描述數據的分散程度21

2.3.3描述數據的其他方式22

2.4數據清洗24

2.4.1數據缺失的處理24

2.4.2數據清洗25

2.5數據集成和轉換27

2.5.1數據集成27

2.5.2數據冗餘性27

2.5.3數據轉換29

2.6數據歸約和變換30

2.6.1數據歸約30

2.6.2數據離散化33

2.6.3概念層次生成34

2.7小結35

參考文獻36

第3章數據倉庫37

3.1前言37

3.2資料庫基本概念回顧37

3.2.1資料庫簡介38

3.2.2表、記錄和域38

3.2.3資料庫管理系統38

3.3數據倉庫簡介39

3.3.1數據倉庫特點39

3.3.2數據倉庫概念40

3.3.3數據倉庫作用41

3.3.4數據倉庫與DBMS對比41

3.3.5分離數據倉庫的原因42

3.4多維數據模型43

3.4.1數據立方體43

3.4.2概念模型45

3.4.3概念分層48

3.4.4典型OLAP操作49

3.4.5星型網路的查詢模型51

3.5數據倉庫結構52

數據挖掘：方法與套用

基本介紹

內容簡介

圖書目錄

相關詞條

熱門詞條