R語言基礎與數據科學套用

R語言基礎與數據科學套用

《R語言基礎與數據科學套用》是2019年7月人民郵電出版社出版的圖書,作者是沈剛。

基本介紹

  • 書名:R語言基礎與數據科學套用
  • 作者:沈剛
  • ISBN:9787115483027
  • 定價:49.8元
  • 出版社:人民郵電出版社
  • 出版時間:2019年7月
  • 裝幀:平裝
  • 開本:16開
內容簡介,圖書目錄,

內容簡介

本書是為初學者學習R語言基礎以及在數據科學中的套用而編寫的。全書內容包括三個部分,分別介紹了R語言的編程基礎知識,數據處理、可視化和統計分析的實用技術,以及在機器學習、神經網路和深度學習中的具體套用。讀者可以通過本書了解和體驗R語言的風格特點和強大功能。本書中所有程式均在R 3.4.3環境下調試通過。

圖書目錄

第 1章 引言 1
1.1 R的起源與發展 2
1.1.1 R的產生與演化 2
1.1.2 R的特點 3
1.2 安裝與運行R系統 6
1.2.1 R的獲取與安裝 7
1.2.2 運行R 7
1.3 安裝與使用包 10
1.3.1 什麼是包 10
1.3.2 安裝包 12
1.3.3 載入、使用、卸載包 12
1.3.4 包的命名空間 13
1.4 工作空間管理 14
1.5 R語言的集成開發環境
RStudio 16
1.5.1 什麼是集成開發環境 16
1.5.2 RStudio的使用方法 16
1.6 使用幫助系統 18
1.7 R語言與數據科學 19
1.7.1 R與大數據平台 19
1.7.2 R在數據科學中的套用 22
習題 23
第 2章 數據與運算 25
2.1 基礎知識 26
2.1.1 向量 26
2.1.2 對象 27
2.1.3 函式 29
2.1.4 標識符與保留字 30
2.2 數據類型與數據表示 31
2.2.1 基本數據類型 31
2.2.2 變數 34
2.2.3 常量 34
2.2.4 特殊值 35
2.3 基本運算 36
2.3.1 運算符 36
2.3.2 算術運算 37
2.3.3 關係運算 37
2.3.4 邏輯運算 38
2.3.5 賦值運算 39
2.4 數據類型轉換與R中常見的數據
結構 40
2.4.1 數據類型轉換 41
2.4.2 常見的數據結構 43
習題 45
第3章 程式設計基礎 47
3.1 控制流 48
3.1.1 順序結構 48
3.1.2 分支結構 49
3.1.3 循環結構 51
3.1.4 選擇結構 53
3.2 函式設計 54
3.2.1 聲明、定義與調用 54
3.2.2 返回值 56
3.2.3 函式中的輸入/輸出 57
3.2.4 環境與範圍 59
3.2.5 遞歸函式 62
3.3 編程規範與性能最佳化 65
3.3.1 使用腳本檔案 65
3.3.2 編程規範 66
3.3.3 性能最佳化 67
習題 68
第4章 類與對象 70
4.1 面向對象程式設計方法 71
4.1.1 結構化程式設計方法回顧 71
4.1.2 對象與類的概念 71
4.1.3 面向對象程式設計的特點 72
4.1.4 R中類的體系 73
4.2 S3類 74
4.2.1 S3類的定義 74
4.2.2 創建S3類對象 74
4.2.3 S3類的泛型函式 76
4.2.4 定義S3類的方法 77
4.2.5 編寫S3類的泛型函式 78
4.3 S4類 79
4.3.1 S4類的定義 79
4.3.2 創建S4類對象 81
4.3.3 訪問插槽 82
4.3.4 S4類的泛型函式 83
4.3.5 定義S4類的方法 84
4.4 引用類 84
4.4.1 定義引用類 84
4.4.2 創建引用類對象 85
4.4.3 訪問與修改引用類對象的域 86
4.4.4 引用類的方法 88
4.5 繼承 90
4.5.1 S3類中的繼承 90
4.5.2 S4類中的繼承 91
4.5.3 引用類中的繼承 92
4.5.4 多重繼承 93
習題 94
第5章 數據結構與數據處理 96
5.1 向量 97
5.1.1 創建向量 97
5.1.2 使用索引訪問向量元素 98
5.1.3 循環補齊 99
5.1.4 向量的比較 100
5.1.5 按條件提取元素 101
5.2 矩陣與數組 101
5.2.1 創建矩陣 102
5.2.2 線性代數運算 103
5.2.3 使用矩陣索引 105
5.2.4 apply函式族 106
5.2.5 多維數組 107
5.3 數據框 108
5.3.1 創建數據框 108
5.3.2 訪問數據框中的元素 109
5.3.3 使用SQL語句查詢數據框 110
5.4 因子 111
5.5 列表 112
5.6 數據導入與導出 113
5.6.1 數據檔案的讀寫 113
5.6.2 rio包 116
5.6.3 數據編輯器 118
5.7 數據清洗 118
5.7.1 數據排序 119
5.7.2 數據清洗的一般方法 120
5.7.3 mice包 122
習題 127
第6章 繪圖與數據可視化 128
6.1 基本圖形與繪圖函式 129
6.1.1 基礎圖形的創建 129
6.1.2 新增繪圖視窗 131
6.1.3 導出圖形 131
6.2 調整繪圖參數 133
6.2.1 自定義特徵 133
6.2.2 調整符號與線條 134
6.2.3 調整顏色 135
6.2.4 調整標籤與標題文本 137
6.3 其他自定義元素 140
6.3.1 坐標軸 140
6.3.2 次要刻度線 140
6.3.3 格線線 141
6.3.4 疊加繪圖 143
6.3.5 圖例 144
6.3.6 標註 145
6.4 描述性統計圖 146
6.4.1 柱狀圖 146
6.4.2 餅圖 149
6.4.3 直方圖 150
6.4.4 箱形圖 151
6.4.5 三維繪圖 152
6.5 動態圖形 155
6.5.1 保存為GIF格式 155
6.5.2 gganimate包 157
習題 160
第7章 統計與回歸分析 162
7.1 定性數據與定量數據 163
7.1.1 定性數據 163
7.1.2 定量數據 166
7.2 數據的數值度量 173
7.2.1 均值 173
7.2.2 中位值 173
7.2.3 四分位數 173
7.2.4 百分位數 174
7.2.5 變化範圍 174
7.2.6 四分位距 174
7.2.7 方差與標準差 175
7.2.8 協方差 175
7.2.9 相關係數 176
7.3 機率分布與假設檢驗 176
7.3.1 二項式分布 177
7.3.2 泊松分布 178
7.3.3 連續均勻分布 178
7.3.4 指數分布 179
7.3.5 常態分配 180
7.3.6  2分布 181
7.3.7 學生t分布 182
7.3.8 統計假設檢驗 182
7.4 回歸分析 187
7.4.1 簡單線性回歸 187
7.4.2 多元線性回歸 192
7.4.3 邏輯回歸 196
習題 199
第8章 統計機器學習 201
8.1 特徵空間與距離 203
8.1.1 距離的定義 203
8.1.2 KNN分類 207
8.2 聚類算法 209
8.2.1 k均值聚類 209
8.2.2 層次聚類 211
8.2.3 密度聚類 216
8.3 分類算法 219
8.3.1 決策樹 219
8.3.2 樸素貝葉斯方法 225
8.3.3 支持向量機 229
8.4 集成學習 233
8.4.1 基本方法 233
8.4.2 隨機森林 234
8.4.3 堆疊式集成學習 238
習題 245
第9章 神經網路與深度學習 247
9.1 基本原理 249
9.1.1 神經元 249
9.1.2 多層感知器模型 250
9.1.3 反向傳播算法 251
9.2 感知器模型 252
9.2.1 neuralnet包 252
9.2.2 非線性回歸 254
9.2.3 分類 256
9.3 深度神經網路 261
9.3.1 深度神經網路的形式 261
9.3.2 MXNetR包 264
9.3.3 keras包 272
習題 280
附錄1 常用函式速查表 281
附錄2 《R語言基礎與數據科學
套用》配套實驗課程方案簡介 285
參考文獻 286

相關詞條

熱門詞條

聯絡我們