大數據挖掘及套用（第2版）

zhua曲子白渡白顆

出版社：清華大學出版社
ISBN：9787302585701
版次：2
商品編碼：13509742
品牌：清華大學
包裝：平裝
開本：16開
出版時間：2021-11-01
用紙：膠版紙
頁數：404
字數：608000

內容簡介

本書圍繞大數據背景下的數據挖掘及套用技術，從大數據挖掘的基本概念入手，由淺入深、循序漸進地介紹大數據挖掘分析過程中的數據認知與預處理、數據可視化技術、數據挖掘的基本方法、Hadoop大數據分散式處理生態系統及分析套用等內容。其中數據挖掘的基本方法不僅包括數據關聯分析、數據分類分析及數據聚類分析，還包括深度學習等重要的數據挖掘研究和發展主題。作者對每一章的內容都儘量從不同的角度進行深入剖析，案例均採用Python語言編程。

本書既可以面向計算機科學與技術、數據科學與技術、人工智慧、智慧型科學與技術等信息類專業的本科生和研究生，也可以面向廣大的IT從業人員。全書不僅提供了全部案例的Python原始碼，還提供了豐富的習題和參考文獻，對讀者掌握大數據挖掘及套用領域的基本知識和進一步研究都具有參考價值。

第1章大數據挖掘及套用概論1

1.1大數據挖掘及套用的背景1

1.1.1從“小”到“大”的數據分析處理1

1.1.2大數據的智慧型分析與挖掘2

1.1.3大數據4

1.1.4雲計算5

1.2大數據挖掘的發展及挑戰7

1.2.1大數據的發展催生三元空間世界7

1.2.2大數據挖掘分析處理面臨的挑戰9

1.3數據挖掘概述11

1.3.1數據挖掘的概念11

1.3.2數據挖掘的功能11

1.3.3數據挖掘運用的技術13

1.3.4大數據挖掘與傳統數據挖掘的關係13

1.3.5數據分析過程的5個原則14

1.4大數據挖掘分析處理框架15

1.4.1大數據挖掘計算平台框架16

1.4.2大數據挖掘處理流程20

1.5小結22

1.6習題23

1.7參考文獻24

第2章數據認知與預處理25

2.1數據挖掘的定義和流程26

2.1.1如何理解和描述數據挖掘的問題26

2.1.2數據獲取與準備27

2.1.3數據質量評估28

2.2數據類型28

2.2.1屬性的定義29

2.2.2標稱屬性29

2.2.3二元屬性30

2.2.4序值屬性30

2.2.5數值屬性30

2.3數據的統計描述方法30

2.3.1數據的中心趨勢度量30

大數據挖掘及套用（第2版）

相關詞條

熱門詞條