《大數據數學基礎(R語言描述)》是2019年8月人民郵電出版社出版的圖書,作者是程丹、張良均。
基本介紹
- 中文名:大數據數學基礎(R語言描述)
- 作者:程丹、張良均
- 出版社:人民郵電出版社
- 出版時間:2019年8月
- 頁數:249 頁
- 定價:49.8 元
- 開本:16 開
- 裝幀:平裝
- ISBN:9787115499226
內容簡介,圖書目錄,
內容簡介
本書全面地講解了在科學領域運用廣泛的數據微積分、線性代數、統計學、數值計算、多元統計分析等數學基礎知識。全書共6章:第1章介紹了大數據與數學、數學與R語言的關係;第2章介紹了霉墊微積分的基礎知識,包括函式、極限、導數、微分棕己企阿、不定積分與定積分及其套用;第3章介紹了線性代數的基礎知識,包括矩陣的運算、行列式、特徵分解、奇異值分解;第4章介紹了統計學的基礎知識,包括數據分布特徵、機率論、隨機變數的數字特徵、參數估計、假設檢驗;第5章介紹了數值計算的基礎知識,包括插值方法、函式逼近與擬合、非線性方程(組)求根;第6章介紹了常用的槓閥芝多元統計分析方法,包括回歸分析、聚類分析、判別分析、主成分分析、因子分析和典型相關分析。本書中的幾乎所有實例都結合R語言進行求解分析,所有章後都有課後習題,可以幫助讀者鞏戒項霉固所學的內容。
圖書目錄
第 1章 緒論 1
1.1 大數據與數學 1
1.1.1 大數據的定義 1
1.1.2 數學在大數據領域的作用 2
1.2 數學與R語言 4
1.2.1 base 5
1.2.2 stats 5
小結 6
課後習題 6
第 2章 微積分基礎 8
2.1 函式與極限 8
2.1.1 映射與函式 9
2.1.2 數列與函式的極限 14
2.1.3 極限運算法則與存在法則 17
2.1.4 連續函式的運算與初等函式的連續性 18
2.2 導數與微分 19
2.2.1 導數的概念 19
2.2.2 函式的求導法則 24
2.2.3 微分的概念 26
2.3 微分中值定理與導數的套用 30
2.3.1 微分中值定理 30
2.3.2 函式的單調性與曲線的凹凸性 31
2.3.3 函式的極值與最值 34
2.4 不定積分與定積分 39
2.4.1 不定積分的概念與性質 40
2.4.2 換元積分法與分部積分法 44
2.4.3 定積分的概念與性質 46
2.4.4 定積分的換元法與分部積分法 50
2.4.5 不定積分與定積分的實際套用 51
小結 53
課後習題 54
第3章 線性代數基礎 56
3.1 矩陣及其運算 56
3.1.1 矩陣的定義 56
3.1.2 特殊矩陣 57
3.1.3 矩陣的運算 61
3.1.4 矩陣行列式 65
3.1.5 矩陣的逆 78
3.1.6 矩陣的秩 80
3.2 矩陣的特徵分解與奇異值分解 84
3.2.1 特徵分解 84
3.2.2 奇異值分解 96
小結 100
課後習題 101
第4章 機率論與數理統計基礎 103
4.1 數據分布特徵的統計描述 103
4.1.1 集中趨勢度量 103
4.1.2 離散趨勢度量 110
4.1.3 偏度與峰度的度量 115
4.2 隨機事件及其機率 117
4.2.1 隨機事件的定義 117
4.2.2 隨機事件的機率 119
4.3 隨機變數與機率分布 122
4.3.1 隨機變數的定義 122
4.3.2 隨機變數的分布函式 122
4.4 隨機變數的數字特徵 127
4.4.1 隨機變數的數學期望 127
4.4.2 隨機變數的方差 130
4.4.3 協方差與相關係數 132
4.4.4 協方差矩陣與相關矩陣 134
4.5 參數估計與假設檢驗 137
4.5.1 參數估計 137
4.5.2 假設檢驗 139
小結 142
課後習題 142
第5章 提協霸數值計算基礎 144
5.1 數值計算的基本概念 144
5.1.1 誤差的來源 144
5.1.2 誤差分類 146
5.1.3 數值計算的衡量標準 147
5.2 插值法 舉頁慨虹147
5.2.1 Lagrange插值 147
5.2.2 線性插值 150
5.2.3 樣條插值 152
5.3 函式逼近與擬合 153
5.3.1 數雄酷承據的最小二乘線性擬合 153
5.3.2 函式的最佳平方逼近 155
5.3.3 數據的多變數擬合 158
5.3.4 數據的非線性曲線擬合 160
5.4 非線性方程(組)求根 162
5.4.1 二分法求解非線性方程 163
5.4.2 Newton法求解非線性方程 165
5.4.3 Newton法求解非線性方程組 166
小結 169
課後習題 170
第6章 多元統計分析 172
6.1 回歸分析 172
6.1.1 一元線性回歸 172
6.1.2 多元線性回歸 178
6.1.3 Logistic回歸 184
6.2 聚類分析 189
6.2.1 距離和相似係數 189
6.2.2 系統聚類法 193
6.2.3 動態聚類法 198
6.3 判別分析 200
6.3.1 距離判別 200
6.3.2 貝葉斯判別 204
6.3.3 費希爾判別 205
6.4 主成分分析 206
6.4.1 總體主成分 207
6.4.2 樣本主成分 209
6.5 因子分析 211
6.5.1 正交因子模型 212
6.5.2 參數估計 214
6.5.3 因子旋轉 218
6.5.4 因子得分 220
6.6 典型相關分析 222
6.6.1 總體典型相關 222
6.6.2 樣本典型相關 223
6.6.3 典型相關係數的顯著性檢驗 228
小結 229
課後習題 230
附錄I t分布表 236
附錄II F分布表 238
參考文獻 250
3.2.1 特徵分解 84
3.2.2 奇異值分解 96
小結 100
課後習題 101
第4章 機率論與數理統計基礎 103
4.1 數據分布特徵的統計描述 103
4.1.1 集中趨勢度量 103
4.1.2 離散趨勢度量 110
4.1.3 偏度與峰度的度量 115
4.2 隨機事件及其機率 117
4.2.1 隨機事件的定義 117
4.2.2 隨機事件的機率 119
4.3 隨機變數與機率分布 122
4.3.1 隨機變數的定義 122
4.3.2 隨機變數的分布函式 122
4.4 隨機變數的數字特徵 127
4.4.1 隨機變數的數學期望 127
4.4.2 隨機變數的方差 130
4.4.3 協方差與相關係數 132
4.4.4 協方差矩陣與相關矩陣 134
4.5 參數估計與假設檢驗 137
4.5.1 參數估計 137
4.5.2 假設檢驗 139
小結 142
課後習題 142
第5章 數值計算基礎 144
5.1 數值計算的基本概念 144
5.1.1 誤差的來源 144
5.1.2 誤差分類 146
5.1.3 數值計算的衡量標準 147
5.2 插值法 147
5.2.1 Lagrange插值 147
5.2.2 線性插值 150
5.2.3 樣條插值 152
5.3 函式逼近與擬合 153
5.3.1 數據的最小二乘線性擬合 153
5.3.2 函式的最佳平方逼近 155
5.3.3 數據的多變數擬合 158
5.3.4 數據的非線性曲線擬合 160
5.4 非線性方程(組)求根 162
5.4.1 二分法求解非線性方程 163
5.4.2 Newton法求解非線性方程 165
5.4.3 Newton法求解非線性方程組 166
小結 169
課後習題 170
第6章 多元統計分析 172
6.1 回歸分析 172
6.1.1 一元線性回歸 172
6.1.2 多元線性回歸 178
6.1.3 Logistic回歸 184
6.2 聚類分析 189
6.2.1 距離和相似係數 189
6.2.2 系統聚類法 193
6.2.3 動態聚類法 198
6.3 判別分析 200
6.3.1 距離判別 200
6.3.2 貝葉斯判別 204
6.3.3 費希爾判別 205
6.4 主成分分析 206
6.4.1 總體主成分 207
6.4.2 樣本主成分 209
6.5 因子分析 211
6.5.1 正交因子模型 212
6.5.2 參數估計 214
6.5.3 因子旋轉 218
6.5.4 因子得分 220
6.6 典型相關分析 222
6.6.1 總體典型相關 222
6.6.2 樣本典型相關 223
6.6.3 典型相關係數的顯著性檢驗 228
小結 229
課後習題 230
附錄I t分布表 236
附錄II F分布表 238
參考文獻 250