R語言數據分析從入門到精通

《R語言數據分析從入門到精通》是2024年清華大學出版社出版的圖書,作者是明日科技。

基本介紹

  • 中文名:R語言數據分析從入門到精通
  • 作者:明日科技
  • 出版時間:2024年3月
  • 出版社:清華大學出版社
  • ISBN:9787302650508 
  • 定價:89.80 元
內容簡介,圖書目錄,

內容簡介

《R語言數據分析從入門到精通》從初學者角度出發,通過通俗易懂的語言、豐富多彩的實例,詳細介紹了R語言基礎知識、核心技術與高級套用。全書分為3篇,共16章,包括初識R語言、集成開發環境RStudio、R語言入門、數據結構、流程控制語句、日期和時間序列、獲取數據、數據處理與清洗、數據計算與分組統計、基本繪圖、ggplot2高級繪圖、lattice高級繪圖、基本統計分析、方差分析、回歸分析和時間序列分析等內容。所有知識都結合具體實例進行講解,涉及的程式代碼給出了詳細的注釋,還有部分代碼解析。

圖書目錄

第1篇 基礎知識
第1章 初識R語言 2
視頻講解:9分鐘
1.1 R語言概述 2
1.1.1 R語言簡介 2
1.1.2 為什麼要學習R語言 3
1.2 R開發環境的下載與安裝 3
1.2.1 下載R開發環境 3
1.2.2 安裝R開發環境 6
1.3 編寫第一個R語言程式 7
第2章 集成開發環境RStudio 9
視頻講解:12分鐘
2.1 RStudio概述 9
2.2 下載與安裝RStudio 9
2.2.1 下載RStudio 9
2.2.2 安裝RStudio 11
2.3 使用RStudio編寫R程式 12
2.4 詳解RStudio集成開發環境 16
2.4.1 RStudio編輯視窗 16
2.4.2 選單欄介紹 17
2.4.3 RStudio特色功能 18
2.4.4 RStudio常用的快捷鍵 18
第3章 R語言入門 19
視頻講解:46分鐘
3.1 R語言編碼規則 19
3.1.1 控制台規則 19
3.1.2 賦值語句的寫法 20
3.1.3 輸入的規則 20
3.2 R語言基礎 20
3.2.1 常用保留字 20
3.2.2 變數 21
3.2.3 基本數據類型 22
3.2.4 運算符 23
3.3 函式 27
3.3.1 內置函式 27
3.3.2 自定義函式的創建和調用 28
3.3.3 返回值 29
3.4 字元串 29
3.4.1 字元串規範 29
3.4.2 字元串常用函式 30
3.4.3 連線字元串 30
3.4.4 計算字元串長度 31
3.4.5 字元大小寫轉換 31
3.4.6 截取字元串 32
3.4.7 查詢字元串 32
3.5 包的安裝與使用 33
3.5.1 查看包 33
3.5.2 包的安裝 34
3.5.3 包的使用 35
3.6 R語言幫助文檔 35
3.6.1 help選單命令 35
3.6.2 幫助函式 36
3.7 要點回顧 37
第4章 數據結構 38
視頻講解:104分鐘
4.1 向量 38
4.1.1 創建向量 38
4.1.2 向量索引 42
4.1.3 向量操作 43
4.1.4 向量運算 44
4.1.5 向量排序 45
4.1.6 向量合併 47
4.2 矩陣 48
4.2.1 創建矩陣 48
4.2.2 矩陣索引 50
4.2.3 矩陣編輯 51
4.2.4 矩陣運算 52
4.3 數組 56
4.3.1 認識數組 56
4.3.2 創建數組 57
4.3.3 數組索引 58
4.3.4 修改數組 59
4.4 數據框 60
4.4.1 創建數據框 60
4.4.2 查看數據框信息 61
4.4.3 獲取指定數據 63
4.4.4 數據的處理 64
4.5 因子 66
4.5.1 因子的概念及套用 67
4.5.2 創建因子 67
4.5.3 調整因子水平 68
4.6 列表 68
4.6.1 創建列表 69
4.6.2 列表的索引 69
4.7 要點回顧 70
第5章 流程控制語句 71
視頻講解:26分鐘
5.1 程式結構 71
5.2 選擇語句 72
5.2.1 if語句 72
5.2.2 if...else語句 73
5.2.3 if...else if...else語句 74
5.2.4 多分支swich語句 75
5.2.5 向量化的ifelse語句 76
5.3 循環語句 77
5.3.1 repeat語句 77
5.3.2 while語句 77
5.3.3 for語句 78
5.3.4 replication()函式 79
5.4 跳轉語句 79
5.4.1 next語句 79
5.4.2 break語句 80
5.5 要點回顧 80
第6章 日期和時間序列 81
視頻講解:86分鐘
6.1 日期和時間函式 81
6.1.1 返回系統當前日期和時間 81
6.1.2 時間函式as.POSIXlt()和as.POSIXct() 82
6.2 日期格式轉換 83
6.2.1 as.Date()函式 83
6.2.2 format()函式 85
6.2.3 其他函式 85
6.3 生成日期時間 86
6.3.1 生成日期序列 86
6.3.2 生成時間序列 87
6.3.3 創建時間序列對象 87
6.4 日期時間運算 88
6.4.1 日期直接相減 88
6.4.2 使用difftime()函式計算時間差 89
6.5 日期時間處理包—lubridate包 89
6.5.1 提取日期和時間 89
6.5.2 解析日期和時間 90
6.5.3 時間日期計算 92
6.5.4 時間間隔 93
6.5.5 時區的操作 93
6.6 時間序列基礎包—zoo包 94
6.6.1 創建時間序列 95
6.6.2 類型轉換 96
6.6.3 數據操作 97
6.7 時間序列擴展包—xts包 100
6.7.1 創建時間序列 100
6.7.2 xts包的基本操作 100
6.7.3 按時間統計數據 102
6.7.4 更改時間周期 103
6.8 要點回顧 104
第2篇 核心技術
第7章 獲取數據 106
視頻講解:39分鐘
7.1 手動輸入數據 106
7.1.1 數據編輯器 106
7.1.2 在代碼中直接輸入數據 107
7.2 讀取外部數據 108
7.2.1 讀取文本檔案、CSV檔案 108
7.2.2 讀取Excel檔案 110
7.2.3 讀取SPSS檔案 111
7.2.4 讀取Stata檔案 112
7.2.5 讀取SAS檔案 113
7.2.6 導入資料庫中的數據 114
7.2.7 讀取XML檔案 117
7.3 R語言自帶的數據集 118
7.3.1 數據集介紹 118
7.3.2 mtcars數據集 120
7.4 要點回顧 120
第8章 數據處理與清洗 121
視頻講解:73分鐘
8.1 查看數據概況 121
8.1.1 查看數據的基本信息 121
8.1.2 查看摘要信息 123
8.1.3 查看數據整體概況 123
8.2 數據清洗 124
8.2.1 缺失值的檢測與處理 124
8.2.2 重複值的檢測與處理 126
8.2.3 異常值的檢測與處理 127
8.2.4 數據排序 128
8.2.5 數據抽樣 130
8.3 字元串處理—stringr包 131
8.3.1 stringr包中的字元串處理函式 131
8.3.2 字元串替換函式str_sub() 132
8.3.3 字元串分割函式str_split() 133
8.3.4 正則表達式的套用 134
8.4 數據合併與拆分 136
8.4.1 數據合併 136
8.4.2 數據拆分 139
8.4.3 數據分段 140
8.5 數據轉換與重塑 141
8.5.1 將數據轉換為數字格式 141
8.5.2 數據轉置 142
8.5.3 數據整合 142
8.6 要點回顧 143
第9章 數據計算與分組統計 144
視頻講解:58分鐘
9.1 數據計算 144
9.1.1 求和 144
9.1.2 求均值 147
9.1.3 求最大值 148
9.1.4 求最小值 148
9.1.5 求中位數 149
9.1.6 求眾數 149
9.1.7 求方差 150
9.1.8 求標準差 151
9.1.9 求分位數 152
9.1.10 求多個計算結果 152
9.2 數據分組統計 153
9.2.1 apply()、tapply()、sapply()、lapply()函式 153
9.2.2 分組統計函式aggregate() 154
9.2.3 分組函式group_by() 156
9.3 數據透視表 156
9.3.1 dcast()函式 157
9.3.2 gather()函式 158
9.3.3 spread()函式 158
9.4 要點回顧 159
第10章 基本繪圖 160
視頻講解:88分鐘
10.1 圖表的常用設定 160
10.1.1 基本繪圖函式plot() 160
10.1.2 設定畫布 164
10.1.3 設定坐標軸 164
10.1.4 添加文本標籤 166
10.1.5 設定標題和圖例 167
10.1.6 設定參考線 169
10.1.7 保存圖表 169
10.2 基礎圖表的繪製 170
10.2.1 折線圖 170
10.2.2 柱形圖 171
10.2.3 餅形圖 173
10.3 統計分布圖的繪製 175
10.3.1 直方圖 176
10.3.2 散點圖 177
10.3.3 箱形圖 178
10.4 多子圖的繪製 182
10.4.1 par()函式 182
10.4.2 layout()函式 184
10.5 要點回顧 186
第11章 ggplot2高級繪圖 187
視頻講解:95分鐘
11.1 ggplot2入門 187
11.1.1 ggplot2概述 187
11.1.2 安裝ggplot2 188
11.1.3 ggplot2繪圖流程 188
11.1.4 ggplot2基本語法 189
11.1.5 ggplot2常用繪圖函式 189
11.2 ggplot2繪圖的基本設定 191
11.2.1 標題 191
11.2.2 坐標軸 192
11.2.3 添加文本標籤 193
11.2.4 圖例 194
11.2.5 更改字型大小 196
11.2.6 主題 197
11.2.7 保存圖形 199
11.3 使用ggplot2繪製圖表 199
11.3.1 折線圖 199
11.3.2 散點圖 203
11.3.3 柱形圖 205
11.3.4 直方圖 208
11.3.5 箱形圖 209
11.3.6 面積圖 210
11.3.7 密度圖 211
11.3.8 小提琴圖 213
11.4 使用ggplot2繪製分面圖 214
11.4.1 facet_grid()函式 214
11.4.2 facet_wrap()函式 216
11.5 要點回顧 218
第12章 lattice高級繪圖 219
視頻講解:60分鐘
12.1 lattice入門 219
12.2 使用lattice繪製圖表 220
12.2.1 散點圖 220
12.2.2 散點圖矩陣 222
12.2.3 條形圖 222
12.2.4 箱形圖 224
12.2.5 點圖 225
12.2.6 直方圖 225
12.2.7 核密度圖 226
12.2.8 條紋圖 227
12.2.9 平行坐標圖 227
12.2.10 3D繪圖 227
12.3 lattice繪圖的常用設定 229
12.3.1 lattice繪圖的組成部分 229
12.3.2 標題設定 229
12.3.3 坐標軸設定 230
12.3.4 圖例設定 230
12.3.5 顏色符號和線條設定 232
12.3.6 條件變數 233
12.3.7 分組變數 234
12.3.8 面板設定 234
12.4 使用lattice繪製多子圖 236
12.4.1 plot()函式 236
12.4.2 ggarrange()函式 237
12.5 要點回顧 237
第13章 基礎統計分析 238
視頻講解:65分鐘
13.1 描述性統計分析 238
13.1.1 summary()函式 238
13.1.2 describe()函式 239
13.1.3 stat.desc()函式 240
13.1.4 分組計算描述性統計量 241
13.2 機率與數據分布 243
13.2.1 機率 243
13.2.2 數據分布概述 243
13.2.3 常態分配 245
13.2.4 二項分布 246
13.2.5 泊松分布 246
13.3 列聯表和頻數表 247
13.3.1 table()函式 247
13.3.2 ftable()函式 248
13.3.3 xtab()函式 248
13.4 獨立性檢驗 248
13.4.1 卡方檢驗 249
13.4.2 Fisher精確檢驗 249
13.4.3 Cochran-Manel-Haenszel檢驗 250
13.5 相關性分析 250
13.5.1 相關係數 251
13.5.2 相關性分析 253
13.6 t檢驗 255
13.6.1 獨立樣本的t檢驗 255
13.6.2 非獨立樣本的t檢驗 256
13.7 要點回顧 257
第3篇 高級套用
第14章 方差分析 260
視頻講解:43分鐘
14.1 方差分析概述 260
14.1.1 方差分析的概念 260
14.1.2 常見術語 260
14.1.3 方差分析表 261
14.2 方差分析的基本流程 262
14.3 aov()函式 262
14.4 單因素方差分析 263
14.4.1 正態性檢驗 264
14.4.2 方差齊性檢驗 267
14.4.3 單因素方差分析案例 268
14.5 雙因素方差分析 271
14.5.1 主效應分析 271
14.5.2 互動效應分析 273
14.6 要點回顧 273
第15章 回歸分析 274
視頻講解:35分鐘
15.1 回歸分析概述 274
15.1.1 什麼是回歸分析 274
15.1.2 回歸分析的套用 275
15.2 回歸分析的基本流程 275
15.3 假設檢驗 276
15.3.1 線性關係 276
15.3.2 評估模型性能 277
15.3.3 多重共線性檢驗 278
15.4 一元線性回歸 278
15.4.1 lm()函式 279
15.4.2 predict()函式 280
15.4.3 一元線性回歸案例 280
15.4.4 predict()函式錯誤調試 282
15.5 多元線性回歸 283
15.5.1 相關係數矩陣 283
15.5.2 散點圖矩陣 284
15.5.3 多元線性回歸案例 285
15.6 要點回顧 290
第16章 時間序列分析 291
視頻講解:73分鐘
16.1 時間序列分析概述 291
16.1.1 什麼是時間序列分析 291
16.1.2 時間序列分析的套用領域 292
16.2 時間序列的基本操作 292
16.2.1 轉換時間序列 292
16.2.2 繪製時間序列圖 293
16.3 平穩性檢驗 294
16.3.1 時序圖 294
16.3.2 自相關圖與acf()函式 295
16.3.3 偏自相關圖與pacf()函式 297
16.3.4 單位根檢驗 298
16.4 差分 300
16.4.1 什麼是差分 300
16.4.2 計算差分函式ndiffs() 300
16.4.3 差分函式diff() 301
16.5 純隨機性檢驗 302
16.6 ARMA模型—自回歸移動平均模型 302
16.6.1 什麼是ARMA模型 302
16.6.2 ARMA建模流程 303
16.6.3 模型判定 303
16.6.4 建模函式arima() 304
16.6.5 自動定階建模函式auto.arima() 304
16.6.6 模型檢驗 305
16.6.7 預測函式forecast() 306
16.6.8 尼羅河流量分析案例 306
16.7 ARIMA模型—自回歸差分移動平均模型 310
16.7.1 什麼是ARIMA模型 310
16.7.2 ARIMA模型的套用 310
16.7.3 大氣中CO2含量趨勢分析案例 310
16.8 非平穩時間序列分析 312
16.8.1 非平穩時間序列概述 312
16.8.2 分解時間序列函式decompose() 312
16.8.3 指數平滑模型HoltWinters() 315
16.8.4 基於指數平滑模型預測銷售額 315
16.9 要點回顧 317

相關詞條

熱門詞條

聯絡我們