《R語言之書:編程與統計》是2020年4月人民郵電出版社出版的圖書,作者是[紐西蘭]蒂爾曼·M·戴維斯(Tilman M·Davies)。
基本介紹
- 中文名:R語言之書:編程與統計
- 作者:[紐西蘭]蒂爾曼·M·戴維斯(Tilman M·Davies)
- 出版時間:2020年4月
- 出版社:人民郵電出版社
- 頁數:589 頁
- ISBN:9787115501899
- 定價:138 元
- 開本:16 開
- 裝幀:平裝
內容簡介,圖書目錄,
內容簡介
本書由淺入深、全面系統地介紹了R語言的編程和統計知識,為讀者了解現代數據科學的計算方法奠定了比較堅實的基礎。
本書包括語言、編程、統計學和機率、統計檢驗和建模、繪圖共5個部分,基本涵蓋了國外大學一、二年級的統計學課程。在講授知識的同時,本書注重學以致用,每章穿插了許多練習,方便讀者動手操作;每章結尾提供了本章講述的代碼匯總,方便讀者快速查閱。通過對本書循序漸進的學習,讀者可以逐步構建自己的知識體系,同時培養程式設計師的思維方式。本書適合R語言初學者從頭開始學習,有編程經驗的讀者也可以挑選自己感興趣的內容閱讀。
本書既可以用作R語言編程的社會培訓教材、自學教材,也可以用作高校師生,特別是統計學專業師生的輔導教材。
圖書目錄
第 一部分 語言
第 1章 新手入門 3
1.1 從CRAN獲取並安裝R 3
1.2 打開R之初體驗 3
1.2.1 控制台和編輯窗格 4
1.2.2 注釋 5
1.2.3 工作路徑 6
1.2.4 安裝和載入R包 6
1.2.5 幫助檔案和函式文檔 7
1.2.6 第三方編輯器 9
1.3 保存工作和退出R 9
1.3.1 工作空間 9
1.3.2 腳本 10
1.4 約定 10
1.4.1 編碼 11
1.4.2 引用數學函式和等式 11
1.4.3 練習 12
第 2章 數值、運算、賦值和向量 13
2.1 R在基礎數學上的套用 13
2.1.1 運算 13
2.1.2 對數和指數 14
2.1.3 科學計數法 15
2.2 分配對象 16
2.3 向量 17
2.3.1 創建向量 17
2.3.2 序列、重複、排序和長度 18
2.3.3 子集和元素的提取 21
2.3.4 面向向量的操作 25
第3章 矩陣和數組 30
3.1 定義一個矩陣 30
3.1.1 填充方式 31
3.1.2 合併行和列 31
3.1.3 矩陣的維度 32
3.2 構造子集 32
3.2.1 按行、列和對角線提取
元素 33
3.2.2 省略和改寫 34
3.3 矩陣運算和線性代數 36
3.3.1 矩陣的轉置 37
3.3.2 單位矩陣 37
3.3.3 矩陣的數乘 38
3.3.4 矩陣的加減法 38
3.3.5 矩陣的乘法 39
3.3.6 逆矩陣 40
3.4 多維數組 41
3.4.1 定義 42
3.4.2 子集、提取和替換 43
第4章 非數值型數據 47
4.1 邏輯值 47
4.1.1 TRUE還是FALSE 47
4.1.2 邏輯值的輸出:關係
運算符 48
4.1.3 多重比較:邏輯運算符 51
4.1.4 邏輯值也是數值 53
4.1.5 利用邏輯值提取子集 54
4.2 字元 58
4.2.1 創建一個字元串 58
4.2.2 連線 59
4.2.3 轉義序列 61
4.2.4 子集與匹配 62
4.3 因子 63
4.3.1 識別類別 63
4.3.2 水平的定義與排序 65
4.3.3 組合與分割 66
第5章 列表和數據框 70
5.1 列表對象 70
5.1.1 創建列表和訪問組件 70
5.1.2 命名 72
5.1.3 嵌套 73
5.2 數據框 75
5.2.1 創建數據框 75
5.2.2 添加數據列併合並數據框 77
5.2.3 利用邏輯值提取記錄的
子集 79
第6章 特殊值、類型和轉換 82
6.1 特殊值 82
6.1.1 無窮數 82
6.1.2 NaN 84
6.1.3 NA 86
6.1.4 NULL 88
6.2 類型、類別和轉換 91
6.2.1 屬性 91
6.2.2 對象類別 93
6.2.3 檢查對象函式is. 95
6.2.4 轉換函式as. 96
第7章 基本繪圖 102
7.1 使用plot調整坐標向量 102
7.2 圖形化參數 103
7.2.1 自動繪圖類型 104
7.2.2 標題和坐標軸標籤 104
7.2.3 顏色 105
7.2.4 點和線的外觀 106
7.2.5 繪圖區域限制 107
7.3 在已有圖中添加點、線和文本 107
7.4 ggplot2包 113
7.4.1 使用qplot進行快速繪圖 113
7.4.2 用geoms設定外觀常量 114
7.4.3 geoms的美學映射 116
第8章 讀寫檔案 119
8.1 R內置數據集 119
8.1.1 內置數據集 119
8.1.2 貢獻數據集 120
8.2 讀入外部數據檔案 121
8.2.1 表格格式 121
8.2.2 電子表格工作簿 124
8.2.3 基於網頁的檔案 125
8.2.4 其他檔案格式 126
8.3 寫出數據檔案和圖形 126
8.3.1 數據集 126
8.3.2 圖像和圖形檔案 127
8.4 特殊對象的讀/寫操作 130
第二部分 編程
第9章 調用函式 135
9.1 作用域 135
9.1.1 環境 135
9.1.2 搜尋路徑 137
9.1.3 名稱的保留和保護 139
9.2 參數匹配 140
9.2.1 準確性 140
9.2.2 局部匹配 141
9.2.3 位置 142
9.2.4 混合 142
9.2.5 省略號的用法 143
第 10章 條件和循環 145
10.1 if語句 145
10.1.1 獨立語句 145
10.1.2 else語句 148
10.1.3 基於元素水平使用ifelse 149
10.1.4 嵌套和堆疊語句 150
10.1.5 轉換函式 153
10.2 循環代碼 156
10.2.1 for循環 156
10.2.2 while循環 162
10.2.3 使用apply的隱式循環 165
10.3 其他控制流程機制 169
10.3.1 break或next聲明 169
10.3.2 repeat語句 171
第 11章 編寫函式 175
11.1 函式命令 175
11.1.1 創建函式 175
11.1.2 使用返回 178
11.2 參數 180
11.2.1 惰性計算 180
11.2.2 設定默認值 183
11.2.3 檢查缺失參數 184
11.2.4 省略號的處理 185
11.3 特殊函式 189
11.3.1 幫助函式 190
11.3.2 一次性函式 191
11.3.3 遞歸函式 192
第 12章 異常值、計時和可見性 196
12.1 異常值處理 196
12.1.1 正式聲明:錯誤和警告 196
12.1.2 使用try命令來捕獲錯誤 198
12.2 進度和計時 202
12.2.1 文本進度條:執行到
哪裡了 202
12.2.2 測量完成時間:執行需要多長
時間 203
12.3 隱藏 204
12.3.1 函式與對象的區別 205
12.3.2 區分數據框變數 207
第三部分 統計學與機率
第 13章 初級統計學 213
13.1 描述原始數據 213
13.1.1 數值型變數 213
13.1.2 分類變數 214
13.1.3 單變數和多變數數據 215
13.1.4 參數和統計量 216
13.2 統計概要 216
13.2.1 集中趨勢:均值、中位數、
眾數 217
13.2.2 計數、百分比和比例 220
13.2.3 四分位數、百分位數和五分位數
概括法 222
13.2.4 離散程度:方差、標準差和
四分位差 223
13.2.5 協方差和相關係數 226
13.2.6 異常值 230
第 14章 數據可視化基礎 233
14.1 條形圖和餅圖 233
14.1.1 繪製條形圖 233
14.1.2 餅圖簡介 236
14.2 直方圖 237
14.3 箱線圖 239
14.3.1 獨立箱線圖 239
14.3.2 並列箱線圖 240
14.4 散點圖 241
14.4.1 單一散點圖 242
14.4.2 散點圖矩陣 243
第 15章 機率 248
15.1 什麼是機率 248
15.1.1 事件和機率 248
15.1.2 條件機率 249
15.1.3 交集 249
15.1.4 並集 250
15.1.5 補集 250
15.2 隨機變數和機率分布 251
15.2.1 觀察值 251
15.2.2 離散隨機變數 252
15.2.3 連續隨機變數 254
15.2.4 形狀、偏態和峰態 260
第 16章 常見的機率分布 263
16.1 常見的機率質量函式 263
16.1.1 伯努利分布 263
16.1.2 二項分布 264
16.1.3 泊松分布 268
16.1.4 其他質量函式 271
16.2 常見的機率密度函式 271
16.2.1 均勻分布 271
16.2.2 常態分配 275
16.2.3 學生t分布 282
16.2.4 指數分布 284
16.2.5 其他密度函式 286
第四部分 統計檢驗與建模
第 17章 抽樣分布和置信度 291
17.1 抽樣分布 291
17.1.1 樣本均值的分布 292
17.1.2 樣品比例的分布 295
17.1.3 其他統計的抽樣分布 298
17.2 置信區間 298
17.2.1 平均值的置信區間 299
17.2.2 比例的置信區間 301
17.2.3 其他置信區間 301
17.2.4 對CI解釋的評論 302
第 18章 假設檢驗 304
18.1 假設檢驗的組件 304
18.1.1 假設 305
18.1.2 檢驗統計量 305
18.1.3 p值 305
18.1.4 顯著性水平 305
18.1.5 假設檢驗的拒絕域 306
18.2 檢驗均值 306
18.2.1 單個均值 306
18.2.2 兩個均值 309
18.3 檢驗比例 316
18.3.1 單個比例 316
18.3.2 兩個比例 318
18.4 檢驗分類變數 322
18.4.1 單個分類變數 322
18.4.2 兩個分類變數 325
18.5 錯誤與功效 329
18.5.1 假設檢驗錯誤 329
18.5.2 第Ⅰ類錯誤 330
18.5.3 第Ⅱ類錯誤 332
18.5.4 統計功效 335
第 19章 方差分析 340
19.1 單因素方差分析 340
19.1.1 假設和診斷檢驗 340
19.1.2 單因素方差分析表 343
19.1.3 用aov函式創建方差
分析表 344
19.2 雙因素方差分析 345
19.2.1 一系列假設 346
19.2.2 主效應和互動作用 347
19.3 Kruskal-Wallis檢驗 349
第 20章 簡單線性回歸 352
20.1 線性關係的一個示例 352
20.2 一般概念 353
20.2.1 模型的定義 354
20.2.2 估計截距和斜率的參數 354
20.2.3 用lm擬合線性模型 355
20.2.4 對殘差的說明 356
20.3 統計推斷 357
20.3.1 匯總擬合模型 357
20.3.2 回歸係數的顯著性檢驗 358
20.3.3 可決係數 359
20.3.4 其他匯總輸出 359
20.4 預測 360
20.4.1 置信區間還是預測區間 360
20.4.2 解釋區間 361
20.4.3 繪製區間 362
20.4.4 插值與外推 364
20.5 分類解釋變數 365
20.5.1 二元變數:k = 2 365
20.5.2 多元變數:k > 2 368
20.5.3 改變參考水平 372
20.5.4 將分類變數視為數字 372
20.5.5 單因素方差分析的等價 375
第 21章 多元線性回歸 377
21.1 相關術語 377
21.2 理論 378
21.2.1 將簡單模型擴展為多元
模型 378
21.2.2 矩陣形式的估計 378
21.2.3 一個基礎例子 379
21.3 在R中的實現和解釋 380
21.3.1 其他解釋變數 381
21.3.2 解釋邊際效應 383
21.3.3 可視化多元線性模型 383
21.3.4 查找置信區間 385
21.3.5 綜合的F檢驗 385
21.3.6 對多元線性模型進行預測 387
21.4 轉換數值變數 389
21.4.1 多項式 390
21.4.2 對數 395
21.4.3 其他變換 397
21.5 互動項 398
21.5.1 概念和動機 399
21.5.2 分類變數和連續變數 399
21.5.3 兩個分類 403
21.5.4 兩個連續 404
21.5.5 高階互動項 406
第 22章 線性模型選擇和診斷 409
22.1 擬合優度和複雜度 409
22.1.1 簡約原則 409
22.1.2 一般原則 409
22.2 模型選擇算法 410
22.2.1 嵌套比較:部分F檢驗 410
22.2.2 向前選擇 413
22.2.3 向後選擇 417
22.2.4 逐步AIC選擇 420
22.2.5 其他選擇算法 425
22.3 殘差診斷 425
22.3.1 檢查和解釋殘差 426
22.3.2 評估正態性 429
22.3.3 離群值、槓桿和影響 430
22.3.4 計算槓桿 433
22.3.5 庫克距離 434
22.3.6 以圖形方式組合殘差、槓桿和
庫克距離 437
22.4 共線性 441
22.4.1 潛在警告標誌 441
22.4.2 相關預測 442
第五部分 高級繪圖
第 23章 自定義高級繪圖 447
23.1 掌握圖形設備 447
23.1.1 手動打開新設備 448
23.1.2 在設備之間切換 448
23.1.3 關閉一個設備 449
23.1.4 一個設備中多個圖形 449
23.2 繪製區域和邊距 452
23.2.1 默認間距 452
23.2.2 自定義間距 453
23.2.3 剪下 454
23.3 點擊式坐標互動 456
23.3.1 獲取坐標 456
23.3.2 可視化所選坐標 456
23.3.3 專用注釋 457
23.4 自定義傳統R圖形 460
23.4.1 樣式和禁止的圖形參數 460
23.4.2 自定義框線 461
23.4.3 自定義坐標軸 462
23.5 專用文本和標籤符號 464
23.5.1 字型 464
23.5.2 希臘符號 465
23.5.3 數學表達式 466
23.6 完全注釋的散點圖 468
第 24章 進一步了解圖形 474
24.1 是使用ggplot還是qplot 474
24.2 平滑和陰影 475
24.2.1 添加LOESS趨勢 475
24.2.2 構建平滑密度估計 477
24.3 多個圖形和變數的分面 479
24.3.1 獨立圖形 479
24.3.2 一個分類變數的分面繪圖 481
24.4 ggvis包里的互動式工具 484
第 25章 在更高維上定義顏色和圖形 490
25.1 顏色的表示和使用 490
25.1.1 紅—綠—藍十六進制顏色
代碼 490
25.1.2 內置調色板 493
25.1.3 自定義調色板 494
25.1.4 使用調色板索引連續區 495
25.1.5 顏色圖例 498
25.1.6 不透明度 499
25.1.7 RGB的替代和更多功能 501
25.2 3D散點圖 503
25.2.1 基本語法 504
25.2.2 增強視覺 504
25.3 用於繪圖的曲面 507
25.3.1 構造估計格線 507
25.3.2 構造z矩陣 508
25.3.3 概念化的z矩陣 509
25.4 輪廓圖 510
25.4.1 畫輪廓線 510
25.4.2 彩色填充輪廓 515
25.5 像素圖像 518
25.5.1 一個格線點 = 一個像素 518
25.5.2 曲面截斷和空像素 521
25.6 透視圖 527
25.6.1 基本圖和角度調整 527
25.6.2 為平面著色 530
25.6.3 循環旋轉 532
第 26章 互動式3D圖形 537
26.1 點雲 537
26.1.1 基本3D雲 537
26.1.2 增強視覺和圖例 538
26.1.3 添加其他3D組件 539
26.2 雙變數曲面 543
26.2.1 基本透視曲面 543
26.2.2 附加組件 544
26.2.3 根據z坐標值著色 546
26.2.4 設定長寬比 547
26.3 三變數曲面 550
26.3.1 三維估計坐標 551
26.3.2 等值面 552
26.3.3 實例:非參數三元密度 556
26.4 參數方程 560
26.4.1 簡單矢量圖 560
26.4.2 數學抽象圖形 563
附錄A 安裝R和貢獻包 571
A.1 下載和安裝R 571
A.2 使用包 572
A.2.1 基礎包 573
A.2.2 擴展包 573
A.2.3 貢獻包 573
A.3 更新R和已安裝的包 578
A.4 使用其他鏡像和存儲庫 579
A.4.1 切換CRAN鏡像 579
A.4.2 其他包庫 579
A.5 引用和寫作包 580
A.5.1 引用R和幫助包 580
A.5.2 編寫我們自己的包 581
附錄B 使用RStudio 582
B.1 基本布局和用法 582
B.1.1 編輯器和外觀選項 583
B.1.2 自定義窗格 584
B.2 輔助工具 585
B.2.1 項目 585
B.2.2 包安裝程式和更新程式 586
B.2.3 支持調試 587
B.2.4 標記、文檔和圖形工具 587
譯後記 590