《R語言編程:基於tidyverse》是2023年人民郵電出版社出版的圖書,作者是張敬信。
基本介紹
- 中文名:R語言編程:基於tidyverse
- 作者:張敬信
- 出版時間:2023年2月
- 出版社:人民郵電出版社
- ISBN:9787115603807
- 開本:16 開
- 裝幀:平裝
內容簡介,作者簡介,圖書目錄,
這是一本基於 tidyverse 入門 R 語言編程的書,本書從基本的編程語法講起,適合編程零基礎的讀者閱讀。本書結合新的 R 語言編程範式,讓讀者學習更高效率的 R 編程,尤其是真正用整潔優雅的數據化編程思維解決一系列數據問題,包括數據清洗、數據處理、數據可視化、統計建模、文檔溝通等,並在附錄中將透視表、網路爬蟲、高性能計算、機器學習等典型套用囊括其中,為讀者提供了豐富的R實用編程案例,也可作為一本 R 語言語法大全的工具書。
本書面向熱愛R語言編程的讀者,適合統計學、數據分析、數據可視化等領域的讀者閱讀參考,也可以作為高等院校相關專業的 R 語言教材。
張敬信,哈爾濱工業大學基礎數學博士,哈爾濱商業大學數學與套用數學系主任、副教授、套用統計碩導、數學建模主教練。主研方向為數據挖掘、數學建模等,熱愛編程、擅長R語言。常駐知乎平台。發表SCI論文4篇,主持黑龍江省社科項目1項。
1 基礎語法 1
1 1 搭建 R 環境及常用操作 1
1 1 1 搭建 R 環境 1
1 1 2 常用操作 3
1 2 數據結構:向量、矩陣、
多維數組 8
1 2 1 向量(一維數據) 8
1 2 2 矩陣(二維數據) 12
1 2 3 多維數組(多維數據) 14
1 3 數據結構:列表、數據框、因子 15
1 3 1 列表 15
1 3 2 數據框(數據表) 17
1 3 3 因子 22
1 4 數據結構:字元串、日期時間 26
1 4 1 字元串 26
1 4 2 日期時間 30
1 4 3 時間序列 34
1 5 正則表達式 36
1 5 1 基本語法 36
1 5 2 若干實例 38
1 6 控制結構 40
1 6 1 分支結構 40
1 6 2 循環結構 42
1 7 自定義函式 50
1 7 1 自定義函式 50
1 7 2 R 自帶的函式 54
2 數據操作 60
2 1 tidyverse 簡介與管道 61
2 1 1 tidyverse 包簡介 61
2 1 2 管道操作 62
2 2 數據讀寫 63
2 2 1 用於數據讀寫的包與函式 63
2 2 2 數據讀寫實例 64
2 2 3 連線資料庫 68
2 2 4 關於中文編碼 70
2 3 數據連線 73
2 3 1 合併行與合併列 74
2 3 2 根據值匹配合併數據框 75
2 3 3 集合運算 78
2 4 數據重塑 78
2 4 1 什麼是整潔的數據 78
2 4 2 寬表變長表 80
2 4 3 長表變寬表 82
2 4 4 拆分列與合併列 85
2 4 5 方形化 87
2 5 數據操作 89
2 5 1 選擇列 89
2 5 2 修改列 95
2 5 3 篩選行 99
2 5 4 對行排序 104
2 5 5 分組操作 104
2 6 其他數據操作 109
2 6 1 按行匯總 109
2 6 2 視窗函式 111
2 6 3 滑窗疊代 113
2 6 4 整潔計算 114
2 7 數據處理神器:data table 包 119
2 7 1 通用語法 119
2 7 2 數據讀寫 121
2 7 3 數據連線 121
2 7 4 數據重塑 122
2 7 5 數據操作 123
2 7 6 分組操作 126
3 可視化與建模技術 128
3 1 ggplot2 基礎語法 128
3 1 1 ggplot2 概述 128
3 1 2 數據、映射、幾何對象 129
3 1 3 標度 133
3 1 4 統計變換、坐標系、位置
調整 142
3 1 5 分面、主題、輸出 146
3 2 ggplot2 圖形示例 149
3 2 1 類別比較圖 150
3 2 2 數據關係圖 151
3 2 3 數據分布圖 152
3 2 4 時間序列圖 154
3 2 5 局部整體圖 154
3 2 6 地理空間圖 155
3 2 7 動態互動圖 156
3 3 統計建模技術 157
3 3 1 整潔模型結果 157
3 3 2 輔助建模 159
3 3 3 批量建模 162
4 套用統計 168
4 1 描述性統計 170
4 1 1 統計量 170
4 1 2 統計圖 172
4 1 3 列聯表 176
4 2 參數估計 177
4 2 1 點估計與區間估計 177
4 2 2 最小二乘估計 180
4 2 3 最大似然估計 183
4 3 假設檢驗 187
4 3 1 假設檢驗原理 187
4 3 2 基於理論的假設檢驗 189
4 3 3 基於重排的假設檢驗 194
4 4 回歸分析 196
4 4 1 線性回歸 197
4 4 2 回歸診斷 198
4 4 3 多元線性回歸實例 202
4 4 4 梯度下降法 208
5 探索性數據分析 212
5 1 數據清洗 212
5 1 1 缺失值 213
5 1 2 異常值 219
5 2 特徵工程 223
5 2 1 特徵縮放 223
5 2 2 特徵變換 225
5 2 3 特徵降維 227
5 3 探索變數間的關係 228
5 3 1 兩個分類變數 228
5 3 2 分類變數與連續變數 229
5 3 3 兩個連續變數 230
6 文檔溝通 232
6 1 R Markdown 233
6 1 1 Markdown 簡介 233
6 1 2 R Markdown 基礎 235
6 1 3 表格輸出 240
6 2 R 與 Latex 互動 243
6 2 1 Latex 開發環境 243
6 2 2 Latex 嵌入 Rmd 244
6 2 3 期刊論文、幻燈片、書籍
模板 245
6 3 R 與 Git 版本控制 249
6 3 1 Git 版本控制 249
6 3 2 RStudio 與 Git GitHub
互動 250
6 4 R Shiny 256
6 4 1 Shiny 基本語法 256
6 4 2 回響表達式 259
6 4 3 案例:探索性數據展板 262
6 5 開發 R 包 264
6 5 1 準備開發環境 264
6 5 2 編寫 R 包工作流 264
6 5 3 發布到 CRAN 269
6 5 4 推廣包(可選) 272
附錄 A R6 類面向對象編程簡單實例 273
附錄 B 錯誤與調試 275
B 1 解決報錯的一般策略 275
B 2 錯誤調試技術 275
B 3 異常處理 278
附錄 C 用 R 實現 Excel 中的 VLOOKUP 與
透視表 282
C 1 VLOOKUP 查詢 282
C 2 數據透視表 284
附錄 D 非等連線與滾動連線 286
D 1 非等連線 286
D 2 滾動連線 287
附錄 E R 與網路爬蟲 290
E 1 rvest 爬取靜態網頁 290
E 2 用 httr 包爬取動態網頁 292
附錄 F R 與高性能計算 296
F 1 並行計算 296
F 2 運行 C++代碼 296
F 3 對超出記憶體容量的數據集進行
處理 297
F 4 大型矩陣運算 298
附錄 G R 機器學習框架 300
G 1 mlr3verse 300
G 2 tidymodels 301