Python數據挖掘方法及套用

書籍信息,內容簡介,圖書目錄,

書籍信息

作譯者:王斌會,王術
出版時間:2019-03千 字 數:340版次:01-01頁 數:216
開本:16開裝幀:I S B N :9787121344954
換版:
紙質書定價:¥49.0

內容簡介

本書重點介紹Python語言在數據處理與數據挖掘方面的套用技巧,主要包括數據分析基礎知識(數據收集與分析軟體、數據挖掘的分析基礎、簡單數據的統計分析),數據分析高級方法(多元數據的綜合分析、時序數據的模型分析),大數據基本處理方法(大數據分析基礎套用、文獻計量與科研評價、社會網路分析方法、數據分析編程平台)等內容。附錄中還提供了Python數據分析相關方法和函式等,方便讀者隨時查看。本書內容豐富,圖文並茂,可操作性強且便於查閱,主要面向數據分析的讀者,能有效幫助讀者提高數據處理與分析的水平,提升工作效率。 本書適合各層次的數據分析用戶,既可作為初學者的入門指南,又可作為中高級用戶的參考手冊,同時也可作為各大中專院校和培訓班的數據分析教材。

圖書目錄

第一部分 數據分析基礎知識
第1章 數據收集與分析軟體 2
1.1 數據收集過程 2
1.1.1 數據的類型 2
1.1.2 數據的收集 3
1.1.3 數據的管理 8
1.2 數據分析軟體 9
1.2.1 數據分析軟體簡介 9
1.2.2 Python語言介紹 10
1.2.3 Python線上平台 13
1.3 Python編程基礎 18
1.3.1 Python編程入門 18
1.3.2 Python數據類型 20
1.3.3 數值分析包numpy 24
1.3.4 數據分析包pandas 25
1.3.5 Python編程運算 34
數據及練習1 38
第2章 數據挖掘的分析基礎 41
2.1 數據的描述分析 41
2.1.1 基本統計量 41
2.1.2 基本繪圖函式 46
2.2 數據的透視分析 55
2.2.1 一維頻數分析 56
2.2.2 二維集聚分析 57
2.2.3 多維透視分析 60
數據及練習2 62
第3章 簡單數據的統計分析 64
3.1 隨機變數及其分布 64
3.1.1 均勻分布 64
3.1.2 常態分配 65
3.2 隨機模擬及其套用 67
3.2.1 隨機模擬方法 67
3.2.2 模擬大數定律 68
3.2.3 模擬方法求積分 69
3.3 單變數統計分析模型 70
3.3.1 單變數線性相關模型 71
3.3.2 單變數線性回歸模型 73
數據及練習3 75
第二部分 數據分析高級方法
第4章 多元數據的綜合分析 78
4.1 多元線性相關與回歸 79
4.1.1 多元線性相關 79
4.1.2 多元線性回歸模型 81
4.2 綜合評價方法 91
4.2.1 綜合評價指標體系 91
4.2.2 綜合評價分析方法 93
4.3 數據壓縮方法 99
4.3.1 主成分分析的基本思想 99
4.3.2 主成分的基本分析 101
4.4 聚類分析方法 105
4.4.1 聚類分析的概念 105
4.4.2 系統聚類方法 108
數據與練習4 113
第5章 時序數據的模型分析 116
5.1 時間序列簡介 116
5.1.1 時間序列的概念 116
5.1.2 時間序列的模擬 116
5.1.3 時間序列的讀取 118
5.2 時間序列分析模型 119
5.2.1 AR模型 120
5.2.2 MR模型 120
5.2.3 ARMA模型 121
5.2.4 ARIMA模型 122
5.3 ARMA模型的構建 124
5.3.1 序列的相關性檢驗 124
5.3.2 ARMA模型的建立與檢驗 127
5.3.3 序列的平穩性檢驗 131
5.4 股票指數預測模型的構建 133
5.4.1 模型的預處理 134
5.4.2 參數的估計與檢驗 135
5.4.3 模型的預測 136
數據與練習5 137
第三部分 大數據基本處理方法
第6章 大數據分析基礎套用 140
6.1 大數據的概念 140
6.1.1 大數據的含義 140
6.1.2 大數據套用舉例 141
6.1.3 大數據分析方法 142
6.2 Python文本預處理 144
6.2.1 字元串的基本操作 144
6.2.2 字元串查詢與替換 146
6.3 網路爬蟲及套用 146
6.3.1 網頁的基礎知識 147
6.3.2 Python爬蟲步驟 148
6.3.3 爬蟲方法的套用 149
6.4 資料庫技術及套用 154
6.4.1 Python中資料庫的使用 154
6.4.2 資料庫的建立與使用 155
數據及練習6 156
第7章 文獻計量與科研評價 159
7.1 文獻計量研究的框架 159
7.2 文獻數據的獲取與分析 161
7.2.1 文獻數據的獲取 161
7.2.2 文獻數據的分析 163
7.3 科研數據的管理與評價 166
7.3.1 科研單位與項目分析 167
7.3.2 科研期刊與作者分析 169
數據及練習7 171
第8章 社會網路分析方法 172
8.1 社會網路的初步印象 172
8.1.1 社會網路分析概念 172
8.1.2 社會網路分析包 174
8.2 社會網路圖的構建 174
8.2.1 社會網路數據形式 174
8.2.2 社會網路統計量 177
8.2.3 網路圖之知識圖譜 180
數據及練習8 183
第9章 數據分析編程平台 185
9.1 Anaconda科學計算發行包 185
9.1.1 Anaconda下載與安裝 185
9.1.2 Anaconda啟動與運行 186
9.2 Jupyter編輯平台 188
9.2.1 Jupyter Notebook 188
9.2.2 Jupyter Lab 193
9.2.3 在Jupyter中使用R語言 196
9.3 Spyder分析平台 197
9.3.1 Spyder平台簡介 197
9.3.2 Spyder平台使用 198
附錄A 本書的學習網站 200
附錄B 書中的例子數據 201
附錄C 書中自定義函式 202
參考文獻 205

相關詞條

熱門詞條

聯絡我們