《R 4編程入門與數據科學實戰》是一本清華大學出版社出版的圖書,作者是[美]馬塔·威利(Matt Wiley)、[澳]喬舒亞·威利(Joshua F. Wiley),譯者是 孫雲華、郭濤。
基本介紹
- 中文名:R 4編程入門與數據科學實戰
- 作者:[美]馬塔·威利(Matt Wiley)、[澳]喬舒亞·威利(Joshua F. Wiley
- 譯者:孫雲華、郭濤
- 出版時間:2023年6月
- 出版社:清華大學出版社
- ISBN:9787302629382
- 定價:99.8 元
內容簡介,圖書目錄,作者簡介,
內容簡介
學習如何使用R 4,編寫和保存R腳本,讀入和寫出數據檔案,使用內置函式,並了解常用的統計方法。這本深入淺出的教程介紹了R 4的主要功能,包括圖表的新調色板、可用於大數據的增強的參考計數系統,以及文本的新數據導入設定和對基於文本的分類數據進行建模的統計方法。
書中每一章都以知識點清單開始,最後是對該章介紹的R函式的總結,以及用於測試新知識的練習。本書開篇介紹了R和CRAN軟體包在Windows和macOS上的實踐安裝,大部分內容是對統計方法的介紹(非驗證性的、套用性的統計),主要依靠R和R可視化來理解、激勵和進行統計測試和建模。本書展示了R在具體案例中的使用,如方差分析、多元回歸和調節回歸、數據可視化、假設檢驗等,並採取了一種基於實例的實踐方法,將**實踐與對所做統計的清晰解釋結合起來。
主要內容
◆ 獲取並安裝R和RStudio
◆ 從多種檔案格式導入和導出數據
◆ 分析數據並生成圖形(包括置信區間)
◆ 互動式地進行假設檢驗
◆ 對多元回歸和調節回歸解決方案進行編碼
圖書目錄
第1章 R語言的安裝 1
1.1 技術棧 2
1.2 作業系統升級 2
1.2.1 Windows 2
1.2.2 macOS 2
1.3 從CRAN下載並安裝R語言 3
1.3.1 Windows 3
1.3.2 macOS 3
1.4 下載並安裝RStudio軟體 4
1.4.1 Windows 4
1.4.2 macOS 5
1.5 RStudio的使用方法 5
1.6 R語言腳本的編寫 9
1.7 總結 13
1.8 練習與融會貫通 13
1.8.1 理論核查 13
1.8.2 練習題 14
第2章 程式包的安裝與使用 15
2.1 程式包的安裝 16
2.2.1 haven程式包 17
2.2.2 readxl程式包 17
2.2.3 writexl程式包 18
2.2.4 data.table程式包 18
2.2.5 extraoperators程式包 19
2.2.6 JWileymisc程式包 19
2.2.7 ggplot2程式包 19
2.2.8 visreg程式包 20
2.2.9 emmeans程式包 20
2.2.10 ez程式包 21
2.2.11 palmerpenguins程式包 21
2.2 程式包的使用說明 21
2.3 總結 22
2.4 練習與融會貫通 22
2.4.1 理論核查 23
2.4.2 練習題 23
第3章 數據的輸入與輸出 25
3.1 設定R語言 25
3.2 輸入 26
3.2.1 手動輸入 26
3.2.2 CSV格式檔案:.csv 27
3.2.3 Excel格式檔案:.xlsx或.xls 29
3.2.4 RDS格式檔案:.rds 30
3.2.5 其他專有格式 31
3.3 輸出 33
3.3.1 CSV格式檔案 33
3.3.2 Excel 格式檔案 33
3.3.3 RDS格式檔案 34
3.4 總結 34
3.5 練習與融會貫通 34
3.5.1 理論核查 35
3.5.2 練習題 35
第4章 數據的處理 37
4.1 設定R語言 37
4.2 數據樣式 39
4.3 data.table的工作方式 41
4.3.1 行操作的工作方式 41
4.3.2 列操作的工作方式 51
4.3.3 組操作的工作方式 57
4.4 示例 58
4.4.1 示例一:市區計數 58
4.4.2 示例二:都市統計區 59
4.4.3 示例三 60
4.5 總結 60
4.6 練習與融會貫通 62
4.6.1 理論核查 62
4.6.2 練習題 62
第5章 數據與樣本 63
5.1 設定R語言 63
5.2 總體與樣本 64
5.3 變數與數據 65
5.3.1 示例一 66
5.3.2 示例二 68
5.3.3 示例三 69
5.3.4 關於變數與數據的思考 69
5.4 統計思維 70
5.5 研究評估 70
5.6 樣本評估 71
5.6.1 便利抽樣 72
5.6.2 K抽樣 74
5.6.3 分群抽樣 77
5.6.4 分層抽樣 80
5.6.5 隨機抽樣 84
5.6.6 樣本知識回顧 86
5.7 頻數表 87
5.7.1 示例一 87
5.7.2 示例二 89
5.7.3 示例三 90
5.8 總結 93
5.9 練習與融會貫通 95
5.9.1 理論核查 95
5.9.2 練習題 95
第6章 描述性統計 97
6.1 設定R語言 97
6.2 可視化 98
6.2.1 柱狀圖 98
6.2.2 點圖/圖表 103
6.2.3 ggplot2繪圖包 105
6.3 集中趨勢 112
6.3.1 算術平均值 112
6.3.2 中位數 116
6.4 數據的分布 119
6.4.1 示例一 120
6.4.2 示例二 123
6.4.3 示例三 125
6.5 數據湍流(方差) 126
6.5.1 示例一 129
6.5.2 示例二 131
6.6 總結 132
6.7 練習與融會貫通 133
6.7.1 理論核查 134
6.7.2 練習題 134
第7章 機率與分布 137
7.1 設定R語言 137
7.2 機率 138
7.2.1 示例一:獨立性 140
7.2.2 示例二:補集 141
7.2.3 機率思維總結 142
7.3 常態分配 143
7.3.1 示例一 145
7.3.2 示例二 147
7.3.3 示例三 148
7.3.4 示例四 150
7.4 機率分布 154
7.4.1 示例一 156
7.4.2 示例二 158
7.5 中心極限定理 159
7.5.1 示例一 161
7.5.2 示例二 165
7.5.3 示例三 169
7.6 總結 172
7.7 練習與融會貫通 173
7.7.1 理論核查 173
7.7.2 練習題 174
第8章 相關與回歸 175
8.1 設定R語言 175
8.2 相關性 177
8.2.1 參數化 179
8.2.2 非參數化:斯皮爾曼 181
8.2.3 非參數化:肯德爾 183
8.2.4 相關性選擇 185
8.3 簡單的線性回歸關係 185
8.3.1 介紹 185
8.3.2 假設 189
8.3.3 方差R2的定義 193
8.3.4 R語言中的線性回歸 193
8.4 總結 202
8.5 練習與融會貫通 203
8.5.1 理論核查 203
8.5.2 練習題 204
第9章 置信區間 205
9.1 設定R語言 206
9.2 可視化置信區間 207
9.2.1 示例一:Sigma已知 210
9.2.2 示例二:Sigma未知 216
9.2.3 示例三 218
9.2.4 示例四 219
9.3 相似與不同數據的比較與理解 221
9.3.1 示例一 221
9.3.2 示例二 223
9.4 總結 224
9.5 練習與融會貫通 224
9.5.1 理論核查 225
9.5.2 練習題 225
第10章 假設檢驗 227
10.1 設定R語言 227
10.2 H0與H1的對比 228
10.2.1 示例一 229
10.2.2 示例二 229
10.3 第一類錯誤與第二類錯誤 230
10.3.1 示例一 231
10.3.2 示例二 232
10.3.3 示例三 232
10.4 Alpha與Beta的概念 232
10.5 假設 235
10.6 零假設顯著性檢驗 236
10.6.1 示例一 237
10.6.2 示例二 239
10.6.3 示例三 241
10.7 總結 243
10.8 練習與融會貫通 244
10.8.1 理論核查 244
10.8.2 練習題 244
第11章 多元回歸 245
11.1 設定R語言 245
11.2 線性回歸的Redux架構 247
11.3 多元回歸 254
11.3.1 多元預測模型的意義 254
11.3.2 R語言中的多元回歸 256
11.3.3 效應的範圍與格式 263
11.3.4 假設與清除 274
11.4 分類預測 279
11.4.1 示例一 282
11.4.2 示例二 285
11.5 總結 288
11.6 練習與融會貫通 289
11.6.1 理論核查 289
11.6.2 練習題 289
第12章 調節回歸 291
12.1 設定R語言 291
12.2 調節回歸理論 292
12.3 R語言中分類變數與連續變數的調節回歸 296
12.4 R語言中存在兩個連續變數的調節回歸 305
12.5 總結 313
12.6 練習與融會貫通 313
12.6.1 理論核查 313
12.6.2 練習題 313
第13章 方差分析 317
13.1 設定R語言 317
13.2 方差分析的背景 318
13.3 單因素方差分析 324
13.3.1 示例一 324
13.3.2 示例二 329
13.4 多因素方差分析 332
13.4.1 示例一 332
13.4.2 示例二 343
13.5 總結 347
13.6 練習與融會貫通 348
13.6.1 理論核查 348
13.6.2 練習題 348
參考文獻 351
作者簡介
Matt Wiley領導維多利亞大學的機構有效性、研究和評估部門,同時負責促進戰略和單位規劃、數據知情決策、州/地區/聯邦問責制度的發展。作為一名終身數學副教授,他曾在數學教育(加利福尼亞州)和學生參與(德克薩斯州)活動中獲獎。此外,Matt擁有加利福尼亞大學和德克薩斯A&M系統的計算機科學、商業和純數學學位。
除了學術成就,他還參與合著了三本關於流行的R程式語言的圖書,並擔任一家統計諮詢公司的管理合伙人近10年。他還擁有使用R、SQL、C 、Ruby、FORTRAN、JavaScript語言的編程經驗。
作為一名程式設計師、出版作家、數學家和變革型領導者,Matt總是將寫作的熱情同解決邏輯和數據科學問題的樂趣融為一體。無論是在會議室,還是在教室,他都喜歡採用動態的方式與跨學科和多元化的團隊進行合作,使複雜的想法和項目變得易於解決。
Joshua F. Wiley是莫納什大學腦與健康納以及心理科學學院的講師。他在加利福尼亞州大學洛杉磯分校獲得博士學位,並完成了初級保健和方面的博士後培訓。他的研究採用先進的定量方法來解釋心理社會因素、睡眠和其他與心理和身體健康有關的健康行為之間的動態關係。他獨立開發或與他人共同開發了許多R 語言程式包,包括用於運行貝葉斯尺度-位置結構方程模型的varian程式包;將R語言連結到商業Mplus軟體的MplusAutomation程式包;用於更快邏輯運算的額外運算符;用於診斷、效應大小和輕鬆顯示多級/混合效應模型結果的多級工具;輔助JWileymisc進行數據探索或者加速分析的函式。