Python大數據分析算法與實例

Python大數據分析算法與實例

《Python大數據分析算法與實例》是清華大學出版社2020年出版的圖書,作者是鄧立國。

基本介紹

  • 書名:Python大數據分析算法與實例
  • 作者:鄧立國
  • 出版社:清華大學出版社
  • 出版時間:2020年
內容簡介,作品目錄,

內容簡介

大數據時代,大數據分析是關鍵技術。Python是一款優秀的大數據分析軟體,本書以Python 3結合第三方開源工具進行大數據分析,以最小的代價編程實現數據的提取、處理、分析和可視化。 本書分為8章,首先介紹大數據分析的背景和行業套用,給出了數據特徵算法分析;然後基於Python 3介紹常用典型第三方大數據分析工具的場景套用;最後比較翔實地闡述大數據分析算法與經典實例套用。 本書適合從事大數據分析的研究人員、計算機或數學等相關專業的從業者參考學習,也可以作為計算機或數學等專業本科高年級或研究生的專業用書。

作品目錄

第1章大數據分析概述 1
1.1大數據分析背景 1
1.2大數據分析的套用 2
1.3大數據分析算法 3
1.4大數據分析工具 6
1.5本章小結 9
第2章數據特徵算法分析 10
2.1數據分布性分析 10
2.1.1數據分布特徵集中趨勢的測定 10
2.1.2數據分布特徵離散程度的測定 15
2.1.3數據分布特徵偏態與峰度的測定 19
2.2數據相關性分析 21
2.2.1數據相關關係 21
2.2.2數據相關分析的主要內容 24
2.2.3相關關係的測定 24
2.3數據聚類性分析 26
2.3.1聚類分析定義 26
2.3.2聚類類型 27
2.3.3聚類套用 29
2.4數據主成分分析 29
2.4.1主成分分析的原理及模型 30
2.4.2數據主成分分析的幾何解釋 31
2.4.3數據主成分的導出 32
2.4.4證明主成分的方差是依次遞減的 34
2.4.5數據主成分分析的計算 35
2.5數據動態性分析 36
2.6數據可視化 40
2.7本章小結 42
第3章大數據分析工具:NumPy 43
3.1NumPy簡介 43
3.2NumPy環境安裝配置 44
3.3ndarray對象 45
3.4數據類型 47
3.5數組屬性 49
3.6數組創建例程 52
3.7切片和索引 57
3.8廣播 60
3.9數組操作與疊代 61
3.10位操作與字元串函式 87
3.11數學運算函式 91
3.12算數運算 93
3.13統計函式 97
3.14排序、搜尋和計數函式 101
3.15位元組交換 104
3.16副本和視圖 105
3.17矩陣庫 107
3.18線性代數模組 109
3.19Matplotlib庫 112
3.20Matplotlib繪製直方圖 114
3.21IO檔案操作 116
3.22NumPy實例:GPS定位 117
3.23本章小結 120
第4章大數據分析工具:SciPy 121
4.1SciPy簡介 121
4.2檔案輸入和輸出:SciPy.io 122
4.3特殊函式:SciPy.special 123
4.4線性代數操作:SciPy.linalg 124
4.5快速傅立葉變換:sipy.fftpack 124
4.6最佳化器:SciPy.optimize 125
4.7統計工具:SciPy.stats 126
4.8SciPy實例 127
4.8.2函式最小值 128
4.9本章小結 130
第5章大數據分析工具:Matplotlib 131
5.1初級繪製 131
5.2圖像、子區、子圖、刻度 137
5.3其他種類的繪圖 140
5.4本章小結 147
第6章大數據分析工具:Pandas 148
6.1Pandas系列 148
6.2Pandas數據幀 151
6.3Pandas面板 155
6.4Pandas快速入門 158
6.5本章小結 172
第7章大數據分析工具:Statsmodels與Gensim 173
7.1Statsmodels 173
7.1.1Statsmodels統計資料庫 173
7.1.2Statsmodels典型的擬合模型概述 175
7.1.3Statsmodels舉例 176
7.2Gensim 178
7.2.1基本概念 178
7.2.2訓練語料的預處理 179
7.2.3主題向量的變換 180
7.2.4文檔相似度的計算 181
7.3本章小結 182
第8章大數據分析算法與實例 183
8.1描述統計 183
8.2假設檢驗 188
8.3信度分析 192
8.4列聯表分析 195
8.5相關分析 196
8.6方差分析 198
8.6.1單因素方差分析 199
8.6.2多因素方差分析 201
8.7回歸分析 203
8.8聚類分析 207
8.9判別分析 212
8.10主成分分析 216
8.11因子分析 218
8.12時間序列分析 221
8.13生存分析 224
8.14典型相關分析 245
8.15RoC分析 250
8.16距離分析 255
8.17對應分析 264
8.18決策樹分析 265
8.19神經網路-深度學習 271
8.19.1深度學習的基本模型 271
8.19.2新聞分類實例 275
8.20蒙特·卡羅模擬 280
8.20.1蒙特·卡羅模擬基本模型 281
8.20.2蒙特·卡羅模擬計算看漲期權實例 281
8.21關聯規則 287
8.21.1關聯規則的概念 288
8.21.2Apriori算法及實例 289
8.21.3FP樹頻集算法 292
8.22UpliftModeling 301
8.23集成方法 306
8.24異常檢測 311
8.25文本挖掘 315
8.26Boosting算法(提升法和GradientBoosting) 322
8.27本章小結 325
參考文獻 326

相關詞條

熱門詞條

聯絡我們