統計分析與數據挖掘技術

統計分析與數據挖掘技術

《統計分析與數據挖掘技術》是2019年12月清華大學出版社出版的圖書,作者是岳曉寧、趙宏偉。

基本介紹

  • 書名:統計分析與數據挖掘技術
  • 作者:岳曉寧、趙宏偉
  • ISBN:9787302540984
  • 定價:49.80元
  • 出版社:清華大學出版社
  • 出版時間:2019年12月
內容簡介,圖書目錄,

內容簡介

《統計分析與數據挖掘技術》介紹了統計學的常用基本概念及數據收集與處理技術,從傳統統計學的角度講述了數據描述性分析、數據分析理論及方法,詳細介紹了多元統計分析的基本統計思想和相關理論,為數據挖掘算法的研究提供了必要的理論支持,為讀者查閱基本概念和基本理論提供方便。《統計分析與數據挖掘技術》還考查了數據挖掘的任務、數據流模型與分類及數據流概要描述方法,介紹了數據挖掘的基本理論和常用算法,如分類、聚類及關聯規則等數據挖掘算法,為初學者提供了必要的科普知識。
《統計分析與數據挖掘技術》分4篇,第1篇闡述了大數據的相關知識;第2篇闡述了統計基礎和數據統計分析相關內容;第3篇闡述了多元統計分析的基本統計思想和相關理論;第4篇闡述了數據挖掘技術的分類、聚類及關聯規則的算法。《統計分析與數據挖掘技術》將統計理論與大數據挖掘技術融合起來,讓統計理論更好地服務於大數據時代,對統計理論在大數據時代下的可持續發展和研究做了嘗試。
《統計分析與數據挖掘技術》可作為普通高等院校大數據相關專業本科生和研究生的參考教材,也可以作為數據統計分析與數據挖掘技術研究人員的自學教材。

圖書目錄

第1篇 大數據時代
第1章 大數據概述 2
1.1 指數時代 2
1.2 大數據特徵和價值 3
1.2.1 大數據特徵 3
1.2.2 大數據價值 3
1.3 大數據研究現狀和發展動態 5
1.3.1 大數據研究現狀 5
1.3.2 大數據研究發展動態 7
1.4 大數據研究存在的主要問題 7
1.4.1 大數據技術存在的問題 7
1.4.2 研究方法問題 9
1.4.3 領域融合問題 9
1.5 大數據時代統計學重構意義 10
1.5.1 對大數據的初步認識 10
1.5.2 統計思維變化 11
1.5.3 大數據時代下統計學重構 14
第2篇 傳統統計分析方法
第2章 統計基礎 20
2.1 統計學基本概念 20
2.1.1 統計學及統計工作過程 20
2.1.2 總體和樣本 23
2.1.3 標誌與變數 24
2.1.4 統計指標和指標體系 27
2.2 數據收集處理與數據描述 29
2.2.1 數據來源 29
2.2.2 數據質量 29
2.2.3 數據預處理 30
2.2.4 數據分組 31
2.2.5 頻數分布 33
2.2.6 數據顯示 36
2.3 數據描述性統計分析 38
2.3.1 數據對比分析 38
2.3.2 集中趨勢測量 39
2.3.3 離散趨勢測量 49
第3章 數據統計分析 57
3.1 參數估計 57
3.1.1 抽樣推斷與抽樣分布 57
3.1.2 參數估計基本方法 66
3.1.3 總體均值區間估計 68
3.1.4 正態總體方差的區間估計 71
3.1.5 總體成數區間估計 71
3.1.6 樣本容量確定 72
3.2 假設檢驗 73
3.2.1 假設檢驗基本問題 73
3.2.2 總體平均數檢驗 77
3.2.3 正態總體方差假設檢驗 81
3.2.4 總體成數檢驗 82
3.3 方差分析 83
3.3.1 方差分析概念和意義 83
3.3.2 單因素方差分析 84
3.3.3 無互動作用的雙因素方差分析 88
3.4 相關與回歸分析 92
3.4.1 相關分析 92
3.4.2 一元線性回歸 101
3.4.3 多元線性回歸 113
3.4.4 非線性回歸 119
第3篇 多元統計分析及其方法
第4章 多元統計分析 124
4.1 多元統計分析基本概念 124
4.1.1 隨機向量和隨機矩陣數字特徵 124
4.1.2 隨機向量相互獨立性 126
4.1.3 多元樣本相關概念 128
4.2 多元常態分配及其推廣 129
4.2.1 多元常態分配定義 130
4.2.2 多元正態變數基本性質 130
4.2.3 多元常態分配參數估計 131
4.2.4 多元常態分配變形形式 132
4.2.5 多元常態分配參數假設檢驗 133
4.3 主成分分析 137
4.3.1 基本思想 138
4.3.2 主成分分析與幾何解釋 138
4.3.3 主成分分析步驟 143
4.4 層次分析 147
4.4.1 基本思想 147
4.4.2 遞階層次結構建立 148
4.4.3 構造兩兩比較判斷矩陣 149
4.4.4 判斷矩陣一致性檢驗 149
4.4.5 元素對目標層總排序權重 151
4.5 聚類分析 153
4.5.1 基本思想 154
4.5.2 衡量相似性統計量 155
4.5.3 系統聚類方法 158
4.6 判別分析 162
4.6.1 Fisher兩類判別 163
4.6.2 Bayes多類判別 167
4.6.3 逐步判別分析 171
第4篇 數據挖掘技術
第5章 數據挖掘導論 180
5.1 數據挖掘 180
5.1.1 數據挖掘意義 180
5.1.2 數據挖掘與數據分析區別 180
5.2 數據挖掘任務與套用 182
5.2.1 數據挖掘主要任務 182
5.2.2 數據挖掘套用 184
5.3 數據流 185
5.3.1 數據流概念 186
5.3.2 數據流模型與分類 186
5.3.3 不確定數據流概念漂移 188
第6章 分類挖掘算法 190
6.1 分類挖掘算法研究概述 190
6.1.1 分類挖掘研究背景及意義 190
6.1.2 分類挖掘含義 191
6.1.3 分類器性能評估標準 191
6.1.4 分類挖掘算法研究現狀及套用領域 192
6.1.5 分類挖掘研究面臨的問題 193
6.2 分類挖掘算法舉例 195
6.2.1 決策樹分類算法 195
6.2.2 貝葉斯分類算法 199
6.2.3 支持向量機分類算法 202
第7章 聚類挖掘算法 210
7.1 聚類挖掘算法研究概述 210
7.1.1 聚類挖掘研究背景及意義 210
7.1.2 聚類分析含義 211
7.1.3 聚類挖掘算法性能評估方法 211
7.1.4 聚類挖掘研究發展趨勢及套用領域 212
7.1.5 聚類挖掘研究面臨的問題 216
7.2 聚類挖掘算法舉例 218
7.2.1 劃分聚類法 218
7.2.2 層次聚類法 223
7.2.3 基於密度和格線聚類法 229
第8章 關聯規則挖掘算法 235
8.1 關聯規則挖掘算法研究概述 235
8.1.1 關聯規則研究背景及意義 235
8.1.2 關聯規則含義 236
8.1.3 關聯規則挖掘研究現狀及套用領域 238
8.1.4 關聯規則挖掘算法分類 239
8.1.5 關聯規則挖掘研究面臨的問題 240
8.2 關聯規則挖掘算法舉例 241
8.2.1 Apriori算法 241
8.2.2 Apriori改進算法 243
8.2.3 TDA及其並行式挖掘算法 247
第9章 數據挖掘套用領域和發展趨勢 252
9.1 數據挖掘套用領域 252
9.2 數據挖掘中隱私問題 254
9.3 數據挖掘發展趨勢 254
9.3.1 數據挖掘與物聯網、雲計算和大數據 254
9.3.2 數據挖掘研究和套用面臨的挑戰 255
9.3.3 數據挖掘發展方向 255
參考文獻 257

相關詞條

熱門詞條

聯絡我們