R語言實戰(第2版)

R語言實戰(第2版)

《R語言實戰(第2版)》是2020年4月人民郵電出版社出版的圖書,作者是[美]卡巴科弗(Robert I·Kabacoff)。

基本介紹

  • 中文名:R語言實戰(第2版)
  • 作者:[美]卡巴科弗(Robert I·Kabacoff)
  • ISBN:9787115420572
  • 頁數:534頁
  • 定價:99元
  • 出版社:人民郵電出版社
  • 出版時間:2020年4月
  • 裝幀:平裝
  • 開本:16開
內容簡介,圖書目錄,

內容簡介

本書注重實用性,是一本全面而細緻的R指南,高度概括了該軟體和它的強大功能,展示了使用的統計示例,且對於難以用傳統方法處理的凌亂、不完整和非正態的數據給出了優雅的處理方法。作者不僅僅探討統計分析,還闡述了大量探索和展示數據的圖形功能。新版做了大量更新和修正,新增了近200頁內容,介紹數據挖掘、預測性分析和高 級編程。
本書適合數據分析人員及R用戶學習參考。

圖書目錄

第 一部分 入門
第 1章 R語言介紹 3
1.1 為何要使用R 4
1.2 R的獲取和安裝 6
1.3 R的使用 6
1.3.1 新手上路 7
1.3.2 獲取幫助 10
1.3.3 工作空間 10
1.3.4 輸入和輸出 12
1.4 包 13
1.4.1 什麼是包 14
1.4.2 包的安裝 14
1.4.3 包的載入 14
1.4.4 包的使用方法 14
1.5 批處理 15
1.6 將輸出用為輸入:結果的重用 16
1.7 處理大數據集 16
1.8 示例實踐 16
1.9 小結 18
第 2章 創建數據集 19
2.1 數據集的概念 19
2.2 數據結構 20
2.2.1 向量 21
2.2.2 矩陣 22
2.2.3 數組 23
2.2.4 數據框 24
2.2.5 因子 27
2.2.6 列表 28
2.3 數據的輸入 30
2.3.1 使用鍵盤輸入數據 31
2.3.2 從帶分隔設定的文本檔案導入數據 32
2.3.3 導入Excel數據 35
2.3.4 導入XML數據 36
2.3.5 從網頁抓取數據 36
2.3.6 導入SPSS數據 36
2.3.7 導入SAS數據 37
2.3.8 導入Stata數據 37
2.3.9 導入NetCDF數據 38
2.3.10 導入HDF5數據 38
2.3.11 訪問資料庫管理系統 38
2.3.12 通過Stat/Transfer導入數據 40
2.4 數據集的標註 40
2.4.1 變數標籤 40
2.4.2 值標籤 41
2.5 處理數據對象的實用函式 41
2.6 小結 42
第3章 圖形初階 43
3.1 使用圖形 43
3.2 一個簡單的例子 45
3.3 圖形參數 46
3.3.1 符號和線條 47
3.3.2 顏色 49
3.3.3 文本屬性 50
3.3.4 圖形尺寸與邊界尺寸 51
3.4 添加文本、自定義坐標軸和圖例 53
3.4.1 標題 54
3.4.2 坐標軸 54
3.4.3 參考線 56
3.4.4 圖例 57
3.4.5 文本標註 58
3.4.6 數學標註 60
3.5 圖形的組合 61
3.6 小結 67
第4章 基本數據管理 68
4.1 一個示例 68
4.2 創建新變數 70
4.3 變數的重編碼 71
4.4 變數的重命名 72
4.5 缺失值 74
4.5.1 重編碼某些值為缺失值 74
4.5.2 在分析中排除缺失值 75
4.6 日期值 76
4.6.1 將日期轉換為字元型變數 77
4.6.2 更進一步 78
4.7 類型轉換 78
4.8 數據排序 79
4.9 數據集的合併 79
4.9.1 向數據框添加列 79
4.9.2 向數據框添加行 80
4.10 數據集取子集 80
4.10.1 選入(保留)變數 80
4.10.2 剔除(丟棄)變數 81
4.10.3 選入觀測 82
4.10.4 subset()函式 82
4.10.5 隨機抽樣 83
4.11 使用SQL語句運算元據框 83
4.12 小結 84
第5章 高 級數據管理 85
5.1 一個數據處理難題 85
5.2 數值和字元處理函式 86
5.2.1 數學函式 86
5.2.2 統計函式 87
5.2.3 機率函式 90
5.2.4 字元處理函式 92
5.2.5 其他實用函式 94
5.2.6 將函式套用於矩陣和數據框 95
5.3 數據處理難題的一套解決方案 96
5.4 控制流 100
5.4.1 重複和循環 100
5.4.2 條件執行 101
5.5 用戶自編函式 102
5.6 整合與重構 104
5.6.1 轉置 104
5.6.2 整合數據 105
5.6.3 reshape2包 106
5.7 小結 108
第 二部分 基本方法
第6章 基本圖形 110
6.1 條形圖 110
6.1.1 簡單的條形圖 111
6.1.2 堆砌條形圖和分組條形圖 112
6.1.3 均值條形圖 113
6.1.4 條形圖的微調 114
6.1.5 棘狀圖 115
6.2 餅圖 116
6.3 直方圖 118
6.4 核密度圖 120
6.5 箱線圖 122
6.5.1 使用並列箱線圖進行跨組比較 123
6.5.2 小提琴圖 125
6.6 點圖 127
6.7 小結 129
第7章 基本統計分析 130
7.1 描述性統計分析 131
7.1.1 方法雲集 131
7.1.2 更多方法 132
7.1.3 分組計算描述性統計量 134
7.1.4 分組計算的擴展 135
7.1.5 結果的可視化 137
7.2 頻數表和列聯表 137
7.2.1 生成頻數表 137
7.2.2 獨立性檢驗 143
7.2.3 相關性的度量 144
7.2.4 結果的可視化 145
7.3 相關 145
7.3.1 相關的類型 145
7.3.2 相關性的顯著性檢驗 147
7.3.3 相關關係的可視化 149
7.4 t檢驗 149
7.4.1 獨立樣本的t檢驗 150
7.4.2 非獨立樣本的t檢驗 151
7.4.3 多於兩組的情況 151
7.5 組間差異的非參數檢驗 152
7.5.1 兩組的比較 152
7.5.2 多於兩組的比較 153
7.6 組間差異的可視化 155
7.7 小結 155
第三部分 中級方法
第8章 回歸 158
8.1 回歸的多面性 159
8.1.1 OLS回歸的適用情境 159
8.1.2 基礎回顧 160
8.2 OLS 回歸 160
8.2.1 用lm()擬合回歸模型 161
8.2.2 簡單線性回歸 163
8.2.3 多項式回歸 164
8.2.4 多元線性回歸 167
8.2.5 有互動項的多元線性回歸 169
8.3 回歸診斷 171
8.3.1 標準方法 172
8.3.2 改進的方法 175
8.3.3 線性模型假設的綜合驗證 181
8.3.4 多重共線性 181
8.4 異常觀測值 182
8.4.1 離群點 182
8.4.2 高槓桿值點 182
8.4.3 強影響點 184
8.5 改進措施 186
8.5.1 刪除觀測點 186
8.5.2 變數變換 187
8.5.3 增刪變數 188
8.5.4 嘗試其他方法 188
8.6 選擇“**佳”的回歸模型 189
8.6.1 模型比較 189
8.6.2 變數選擇 190
8.7 深層次分析 193
8.7.1 交叉驗證 193
8.7.2 相對重要性 195
8.8 小結 197
第9章 方差分析 198
9.1 術語速成 198
9.2 ANOVA模型擬合 201
9.2.1 aov()函式 201
9.2.2 表達式中各項的順序 202
9.3 單因素方差分析 203
9.3.1 多重比較 204
9.3.2 評估檢驗的假設條件 206
9.4 單因素協方差分析 208
9.4.1 評估檢驗的假設條件 209
9.4.2 結果可視化 210
9.5 雙因素方差分析 211
9.6 重複測量方差分析 214
9.7 多元方差分析 217
9.7.1 評估假設檢驗 218
9.7.2 穩健多元方差分析 220
9.8 用回歸來做ANOVA 220
9.9 小結 222
第 10章 功效分析 223
10.1 假設檢驗速覽 223
10.2 用pwr包做功效分析 225
10.2.1 t檢驗 226
10.2.2 方差分析 228
10.2.3 相關性 228
10.2.4 線性模型 229
10.2.5 比例檢驗 230
10.2.6 卡方檢驗 231
10.2.7 在新情況中選擇合適的效應值 232
10.3 繪製功效分析圖形 233
10.4 其他軟體包 235
10.5 小結 236
第 11章 中級繪圖 237
11.1 散點圖 238
11.1.1 散點圖矩陣 240
11.1.2 高密度散點圖 242
11.1.3 三維散點圖 244
11.1.4 旋轉三維散點圖 247
11.1.5 氣泡圖 248
11.2 折線圖 250
11.3 相關圖 253
11.4 馬賽克圖 258
11.5 小結 260
第 12章 重抽樣與自助法 261
12.1 置換檢驗 261
12.2 用coin包做置換檢驗 263
12.2.1 獨立兩樣本和K樣本檢驗 264
12.2.2 列聯表中的獨立性 266
12.2.3 數值變數間的獨立性 266
12.2.4 兩樣本和K樣本相關性檢驗 267
12.2.5 深入探究 267
12.3 lmPerm包的置換檢驗 267
12.3.1 簡單回歸和多項式回歸 268
12.3.2 多元回歸 269
12.3.3 單因素方差分析和協方差分析 270
12.3.4 雙因素方差分析 271
12.4 置換檢驗點評 271
12.5 自助法 272
12.6 boot包中的自助法 272
12.6.1 對單個統計量使用自助法 274
12.6.2 多個統計量的自助法 276
12.7 小結 278
第四部分 高 級方法
第 13章 廣義線性模型 280
13.1 廣義線性模型和glm()函式 281
13.1.1 glm()函式 281
13.1.2 連用的函式 282
13.1.3 模型擬合和回歸診斷 283
13.2 Logistic回歸 284
13.2.1 解釋模型參數 286
13.2.2 評價預測變數對結果機率的影響 287
13.2.3 過度離勢 288
13.2.4 擴展 289
13.3 泊松回歸 289
13.3.1 解釋模型參數 291
13.3.2 過度離勢 292
13.3.3 擴展 294
13.4 小結 295
第 14章 主成分分析和因子分析 296
14.1 R中的主成分和因子分析 297
14.2 主成分分析 298
14.2.1 判斷主成分的個數 298
14.2.2 提取主成分 300
14.2.3 主成分旋轉 303
14.2.4 獲取主成分得分 304
14.3 探索性因子分析 305
14.3.1 判斷需提取的公共因子數 306
14.3.2 提取公共因子 307
14.3.3 因子旋轉 308
14.3.4 因子得分 312
14.3.5 其他與EFA相關的包 312
14.4 其他潛變數模型 312
14.5 小結 313
第 15章 時間序列 315
15.1 在R 中生成時序對象 317
15.2 時序的平滑化和季節性分解 319
15.2.1 通過簡單移動平均進行平滑處理 319
15.2.2 季節性分解 321
15.3 指數預測模型 326
15.3.1 單指數平滑 326
15.3.2 Holt 指數平滑和Holt-Winters指數平滑 329
15.3.3 ets()函式和自動預測 331
15.4 ARIMA預測模型 333
15.4.1 概念介紹 333
15.4.2 ARMA和ARIMA模型 334
15.4.3 ARIMA的自動預測 339
15.5 延伸閱讀 340
15.6 小結 340
第 16章 聚類分析 342
16.1 聚類分析的一般步驟 343
16.2 計算距離 344
16.3 層次聚類分析 345
16.4 劃分聚類分析 350
16.4.1 K均值聚類 350
16.4.2 圍繞中心點的劃分 354
16.5 避免不存在的類 356
16.6 小結 359
第 17章 分類 360
17.1 數據準備 361
17.2 邏輯回歸 362
17.3 決策樹 363
17.3.1 經典決策樹 364
17.3.2 條件推斷樹 366
17.4 隨機森林 368
17.5 支持向量機 370
17.6 選擇預測效果**好的解 374
17.7 用rattle包進行數據挖掘 376
17.8 小結 381
第 18章 處理缺失數據的高 級方法 382
18.1 處理缺失值的步驟 383
18.2 識別缺失值 384
18.3 探索缺失值模式 385
18.3.1 列表顯示缺失值 385
18.3.2 圖形探究缺失數據 386
18.3.3 用相關性探索缺失值 389
18.4 理解缺失數據的來由和影響 391
18.5 理性處理不完整數據 391
18.6 完整實例分析(行刪除) 392
18.7 多重插補 394
18.8 處理缺失值的其他方法 397
18.8.1 成對刪除 398
18.8.2 簡單(非隨機)插補 398
18.9 小結 399
第五部分 技能拓展
第 19章 使用ggplot2進行高 級繪圖 402
19.1 R 中的四種圖形系統 402
19.2 ggplot2包介紹 403
19.3 用幾何函式指定圖的類型 407
19.4 分組 411
19.5 刻面 413
19.6 添加光滑曲線 416
19.7 修改ggplot2圖形的外觀 418
19.7.1 坐標軸 419
19.7.2 圖例 420
19.7.3 標尺 421
19.7.4 主題 423
19.7.5 多重圖 425
19.8 保存圖形 426
19.9 小結 426
第 20章 高 級編程 427
20.1 R語言回顧 427
20.1.1 數據類型 427
20.1.2 控制結構 433
20.1.3 創建函式 436
20.2 環境 437
20.3 面向對象的編程 439
20.3.1 泛型函式 439
20.3.2 S3模型的限制 441
20.4 編寫有效的代碼 442
20.5 調試 445
20.5.1 常見的錯誤來源 445
20.5.2 調試工具 446
20.5.3 支持調試的會話選項 448
20.6 深入學習 451
20.7 小結 451
第 21章 創建包 452
21.1 非參分析和npar 包 453
21.2 開發包 457
21.2.1 計算統計量 457
21.2.2 列印結果 460
21.2.3 匯總結果 461
21.2.4 繪製結果 463
21.2.5 添加樣本數據到包 464
21.3 創建包的文檔 466
21.4 建立包 467
21.5 深入學習 471
21.6 小結 471
第 22章 創建動態報告 472
22.1 用模版生成報告 474
22.2 用R和Markdown創建動態報告 475
22.3 用R和LaTeX創建動態報告 480
22.4 用R和Open Document創建動態報告 483
22.5 用R和Microsoft Word創建動態報告 485
22.6 小結 489
第 23章 使用lattice進行高 級繪圖 490
23.1 lattice包 490
23.2 調節變數 494
23.3 面板函式 495
23.4 分組變數 498
23.5 圖形參數 502
23.6 自定義圖形條帶 503
23.7 頁面布局 504
23.8 深入學習 507
附錄A 圖形用戶界面 508
附錄B 自定義啟動環境 511
附錄C 從R中導出數據 513
附錄D R中的矩陣運算 515
附錄E 本書中用到的擴展包 517
附錄F 處理大數據集 522
附錄G 更新R 526
後記:探索R的世界 528
參考文獻 530

相關詞條

熱門詞條

聯絡我們