《數據分析:R語言實戰》是2014年電子工業出版社出版的圖書。
基本介紹
- 書名:數據分析:R語言實戰
- 作者:李詩羽 張飛 王正林
- ISBN:978712123714
- 出版時間:2014-08
- 開本:16(185*235)
內容簡介,前言,基本信息,目 錄,
內容簡介
大數據時代,數據成為決策最為重要的參考之一,數據分析行業邁入了一個全新的階段。R是一款非常優秀的統計分析軟體,本書側重於使用R進行數據的處理、整理和分析,重點講述了R的數據分析流程、算法包的使用以及相關工具的套用,同時結合大量精選的數據分析問題對R軟體進行科學、準確和全面的介紹,以便使讀者能深刻理解R的精髓和靈活、高效的使用技巧。 通過本書,讀者不僅能掌握使用R及相關的算法包來快速解決實際問題,而且能學會從實際問題分析入手,到利用R進行求解,以及對結果進行分析。
前言
前 言 大數據時代,數據成為決策最為重要的參考之一,數據分析隨著大數據概念的普及而日益得到重視,數據分析行業邁入了一個全新的階段。 數據分析的軟體如雨後春筍般地湧現,其中R軟體的發展備受矚目。R是一個免費開源軟體,它提供了首屈一指的統計計算和繪圖功能,尤其是大量的統計分析、數據挖掘方面的算法包,使得它成為一款優秀的、不可多得的數據分析工具軟體。 本書的主要目的是向讀者介紹如何用R進行數據。
基本信息
叢書名 :大數據時代的R語言
作 譯 者:李詩羽 張飛 王正林
出版時間:2014-08
千 字 數:521
版 次:01-01 頁 數:336
開 本:16(185*235)
I S B N :978712123714
目 錄
上篇:數據預處理
第0章 致敬,R! 1
致敬,肩膀! 1
致敬,時代! 3
致敬,人才! 3
致敬,R瑟! 5
第1章 數據分析導引 8
1.1 數據分析概述 8
1.1.1 數據分析的原則 8
1.1.2 數據分析的步驟 9
1.1.3 數據分析的過程 10
1.1.4 數據分析的對象 11
1.2 大數據分析 11
1.2.1 大數據分析的流程 11
1.2.2 大數據分析的基本方面 12
1.2.3 大數據分析的套用 13
1.3 數據分析常用工具 13
1.4 R在數據分析中的優勢 14
第2章 數據的讀取與保存 16
2.1 數據讀取 16
2.1.1 讀取內置數據集 16
2.1.2 讀取文本檔案 17
2.1.3 讀取固定寬度格式的檔案 20
2.1.4 讀取Excel數據 21
2.1.5 讀取資料庫檔案 22
2.1.6 讀取網頁數據 26
2.1.7 讀入R格式的檔案 28
2.1.8 從其他統計軟體讀入數據 28
2.2 數據保存 31
2.2.1 使用函式cat() 31
2.2.2 保存為文本檔案 32
2.2.3 保存R格式檔案 33
2.2.4 保存為其他類型檔案 33
第3章 數據預處理 34
3.1 基本函式 34
3.2 數據修改 38
3.2.1 修改數據標籤 38
3.2.2 行列刪除 38
3.3 缺失值處理 38
3.3.1 判斷缺失數據 39
3.3.2 判斷缺失模式 39
3.3.3 處理缺失數據 41
3.4 數據整理 44
3.4.1 數據合併 44
3.4.2 選取數據的子集 46
3.4.3 數據排序 47
3.5 長寬格式的轉換 48
3.5.1 揉數據函式 48
3.5.2 揉數據的最佳伴侶 49
中篇:基本分析及套用
第4章 數據的圖形描述 54
4.1 R繪圖概述 54
4.2 繪圖區域分割 55
4.2.1 函式par() 55
4.2.2 函式layout() 56
4.2.3 函式split.screen() 57
4.3 二維圖形 58
4.3.1 高級繪圖函式 58
4.3.2 多元數據繪圖 61
4.3.3 低級繪圖函式 63
4.3.4 圖形美化 64
4.3.5 互動式繪圖命令 65
4.4 三維圖形 67
4.5 LATTICE程式包 69
4.6 GGPLOT2程式包 73
4.6.1 快速繪圖 74
4.6.2 分圖層繪圖 76
4.7 圖形保存 84
4.8 綜合實例:數據地圖 84
第5章 數據的描述性分析 88
5.1 R內置的分布 88
5.2 集中趨勢的分析 90
5.2.1 集中趨勢的測度 90
5.2.2 R語言實現 91
5.3 離散趨勢的分析 93
5.3.1 離散趨勢的測度 93
5.3.2 R語言實現 94
5.4 數據的分布分析 95
5.4.1 分布情況的測度 95
5.4.2 R語言實現 96
5.5 圖形分析及R實現 97
5.5.1 直方圖和密度函式圖 97
5.5.2 QQ圖 98
5.5.3 莖葉圖 100
5.5.4 箱線圖 100
5.5.5 經驗分布圖 102
5.6 多組數據分析及R實現 102
5.6.1 多組數據的統計分析 102
5.6.2 多組數據的圖形分析 103
第6章 參數估計及R實現 112
6.1 點估計及R實現 112
6.1.1 矩估計 112
6.1.2 極大似然估計 116
6.2 單正態總體的區間估計 122
6.2.1 均值 的區間估計 122
6.2.2 方差 的區間估計 125
6.3 兩正態總體的區間估計 126
6.3.1 均值差 的區間估計 127
6.3.2 兩方差比 的區間估計 130
6.4 關於比率的區間估計 131
第7章 假設檢驗及R實現 134
7.1 假設檢驗概述 134
7.1.1 理論依據 135
7.1.2 檢驗步驟 135
7.1.3 兩類錯誤 136
7.2 單正態總體的檢驗 137
7.2.1 均值 的檢驗 138
(2) 未知 140
7.2.2 方差 的檢驗 141
7.3 兩正態總體的檢驗 142
7.3.1 均值差 的檢驗 143
7.3.2 成對數據的t檢驗 146
7.3.3 兩總體方差的檢驗 147
7.4 比率的檢驗 148
7.4.1 比率的二項分布檢驗 148
7.4.2 比率的近似檢驗 149
7.5 非參數的檢驗 149
7.5.1 總體分布的 檢驗 150
7.5.2 Kolmogrov-Smirnov檢驗 153
第8章 方差分析及R實現 157
8.1 單因素方差分析及R實現 157
8.1.1 基本假設的檢驗 157
8.1.2 單因素方差分析 160
8.1.3 多重t檢驗 164
8.1.4 Kruskal-Wallis秩和檢驗 166
8.2 雙因素方差分析及R實現 168
8.2.1 無互動作用的分析 169
8.2.2 有互動作用的分析 172
8.3 協方差分析及R實現 176
第9章 回歸分析及R實現 180
9.1 一元線性回歸 180
9.1.1 模型理論 180
9.1.2 顯著性檢驗 181
9.1.3 R語言實現 181
9.2 多元線性回歸 187
9.2.1 模型理論 187
9.2.2 顯著性檢驗 188
9.2.3 R語言實現 189
9.2.4 逐步回歸 192
9.3 回歸診斷及R實現 194
9.3.1 殘差診斷 195
9.3.2 影響分析 198
9.3.3 多重共線性診斷 201
9.4 嶺回歸及R實現 203
9.5 廣義線性模型 206
9.5.1 模型理論 206
9.5.2 R語言實現 207
第10章 主成分分析與因子分析 211
10.1 主成分分析 211
10.1.1 理論基礎 211
10.1.2 R語言實現 215
10.2 因子分析 221
10.2.1 理論模型 221
10.2.2 因子載荷矩陣的估計方法 223
10.2.3 R語言實現 225
第11章 典型相關分析和對應分析 230
11.1 典型相關分析 230
11.1.1 理論基礎 230
11.1.2 典型相關分析的套用 232
11.1.3 R語言實現 233
11.2 對應分析 236
11.2.1 理論基礎 236
11.2.2 對應分析的步驟 237
11.2.3 R語言實現 238
第12章 判別分析和聚類分析 242
12.1 判別分析及R實現 242
12.1.1 距離判別法 243
12.1.2 距離判別法的R實現 244
12.1.3 Fisher判別法 247
12.1.4 Fisher判別法的R實現 248
12.1.5 貝葉斯判別法 251
12.1.6 貝葉斯判別法的R實現 252
12.2 聚類分析及R實現 252
12.2.1 理論概述 253
12.2.2 R實現舉例 254
第13章 時間序列分析及R實現 260
13.1 時間序列的基本分析 260
13.1.1 平穩性與非平穩性 260
13.1.2 R實現的基本步驟 261
13.2 時間序列的分解 262
13.2.1 分解非季節性數據 263
13.2.2 分解季節性數據 265
13.3 指數平滑法預測分析 268
13.3.1 簡單指數平滑法 269
13.3.2 殘差的白噪聲檢驗 272
13.3.3 Holt指數平滑法 275
13.3.4 Winters指數平滑法 277
13.4 ARIMA模型分析 280
13.4.1 基本思想 280
13.4.2 平穩化處理 281
13.4.3 建模 282
13.4.4 模型的參數估計 284
13.4.5 模型預測及檢驗 284
下篇:綜合實例
第14章 R在金融數據分析中的套用 288
14.1 投資組合最最佳化實例 288
14.1.1 概述 288
14.1.2 均值—方差模型 289
14.1.3 模擬退火算法 292
14.2 構造投資組合的有效前沿 298
14.2.1 R中的算法包 298
14.2.2 計算分析 298
14.3 股票聚類分析 301
14.3.1 概述 301
14.3.2 K-means聚類分析 302
14.3.3 層次聚類分析 304
第15章 R在數據預測中的套用 306
15.1 回歸分析預測 306
15.1.1 概述 306
15.1.2 綜合實例 306
15.2 時間序列預測 318
15.2.1 概述 318
15.2.2 綜合實例 318