R語言程式設計

《R語言程式設計》是2023年清華大學出版社出版的圖書,作者是周圍、崔瀕月。

基本介紹

  • 中文名:R語言程式設計
  • 作者:周圍、崔瀕月
  • 出版時間:2023年3月1日
  • 出版社清華大學出版社
  • ISBN:9787302626503
  • 定價:59 元
內容簡介,圖書目錄,

內容簡介

本書分為基礎篇、進階篇、拓展篇三個模組,共9個章節,包括R語言基礎知識、常用模型和特色套用。同時,本書將R語言和數據科學相結合,講解了數據獲取、數據描述、數據預處理、數據分析、數據挖掘、數據可視化的理論知識以及R語言的實現方法。除第9章外,每章配有綜合實驗,引導學生解決套用問題。 本書是學習R語言、數據科學類課程的基礎教材,配有完備的教學資料,支持多種教學模式,可作為各類高等院校開設R語言、數據科學類課程的通識基礎教材,也可供數據科學、R語言愛好者自學使用。

圖書目錄

基礎篇
第1章R語言概述3
1.1認識R語言3
1.1.1R語言是什麼3
1.1.2R語言與數據科學3
1.1.3R語言與計算思維4
1.2第一個R語言會話4
1.2.1開發環境配置4
1.2.2程式編寫運行6
1.3R語言包9
1.3.1包的含義9
1.3.2包的安裝和使用9
1.4R語言數據集9
1.5綜合實驗10
1.5.1實驗1: R語言軟體安裝10
1.5.2實驗2: RStudio安裝15
1.5.3實驗3: 編寫“Hello World!”程式19
1.5.4實驗4: 工作空間的管理和使用20
1.5.5實驗5: 使用rmarkdown包22
思考與練習25
第2章數據對象27
2.1數據類型27
2.1.1數據類型分類27
2.1.2數據類型的轉換27
2.1.3數據類型的查看28
2.2數據結構292.3向量30
2.3.1創建向量30
2.3.2向量的運算31
2.3.3向量的索引32
2.3.4向量的排序34
2.4矩陣34
2.4.1創建矩陣34
2.4.2矩陣的合併35
2.4.3矩陣的運算36
2.4.4矩陣的索引37
2.5數組38
2.6數據框39
2.6.1創建數據框40
2.6.2數據框的索引40
2.7列表41
2.7.1創建列表41
2.7.2列表的索引41
2.8因子42
2.8.1創建因子42
2.8.2創建有規律的因子44
2.9綜合實驗44
2.9.1實驗1: 熟悉向量的計算44
2.9.2實驗2: 靈活使用矩陣45
2.9.3實驗3: 綜合運用數據框50
2.9.4實驗4: 熟悉因子52
思考與練習53
〖3〗R語言程式設計目錄〖3〗第3章數據管理55
3.1控制結構55
3.1.1分支結構55
3.1.2循環結構56
3.1.3控制語句58
3.2函式59
3.2.1數學運算函式59
3.2.2字元處理函式62
3.2.3日期處理函式64
3.2.4自定義函式66
3.2.5函式的嵌套68
3.3apply函式族68
3.3.1函式族68
3.3.2apply( )函式69
3.3.3tapply( )函式70
3.3.4lapply( )函式71
3.3.5sapply( )函式71
3.4數據輸入與輸出71
3.4.1數據輸入71
3.4.2數據輸出72
3.5綜合實驗73
3.5.1實驗1: 編寫自定義函式73
3.5.2實驗2: 百分製成績換算75
3.5.3實驗3: 兩種方法實現數據處理76
3.5.4實驗4: 實現爬蟲功能77
思考與練習78
第4章數據可視化79
4.1繪圖基礎79
4.1.1高級繪圖函式79
4.1.2低級繪圖函式83
4.1.3繪製圖形89
4.2繪圖進階93
4.2.1ggplot2繪圖包93
4.2.2使用qplot( )函式繪圖94
4.2.3使用ggplot( )函式繪圖94
4.3繪製更豐富的圖形96
4.4綜合實驗98
4.4.1實驗1: 繪製鳶尾花數據圖形98
4.4.2實驗2: 繪製汽車數據圖形100
4.4.3實驗3: 繪製互動式圖形106
思考與練習110
進階篇
第5章數據探索113
5.1數據描述113
5.1.1數據的類別113
5.1.2數據的集中趨勢114
5.1.3數據的離散程度114
5.1.4數據的分布特徵115
5.1.5數據的相似性117
5.2數據清洗118
5.2.1處理缺失數據118
5.2.2處理異常數據119
5.2.3處理重複數據121
5.3數據集成121
5.3.1數據集的合併121
5.3.2數據子集的獲取122
5.3.3數據的分組匯總123
5.3.4數據的頻數計算124
5.3.5使用SQL語句125
5.4數據規範125
5.5數據重構126
5.6綜合實驗128
5.6.1實驗1: 對mtcars數據集的初步探索128
5.6.2實驗2: 處理數據集中的缺失值130
5.6.3實驗3: 對mtcars數據集的標準化132
5.6.4實驗4: 數據重構133
思考與練習135
第6章數據分析137
6.1隨機數模擬137
6.1.1生成隨機數137
6.1.2特定分布的隨機數137
6.1.3隨機抽樣138
6.2假設檢驗139
6.2.1假設檢驗的方法139
6.2.2均值檢驗139
6.2.3相關性檢驗141
6.3方差分析142
6.4線性回歸143
6.4.1變數間關係144
6.4.2一元線性回歸144
6.4.3多項式回歸146
6.4.4多元線性回歸147
6.5廣義線性模型149
6.5.1廣義線性模型概況149
6.5.2Logistic回歸150
6.5.3泊松回歸153
6.6綜合實驗154
6.6.1實驗1: 假設檢驗的套用154
6.6.2實驗2: 方差分析155
6.6.3實驗3: 一元線性回歸分析160
6.6.4實驗4: 多項式回歸分析162
6.6.5實驗5: 泊松回歸分析164
6.6.6實驗6: Logistics回歸分析166
思考與練習172
第7章數據挖掘174
7.1相關概念174
7.1.1數據分析與數據挖掘174
7.1.2數據挖掘與機器學習175
7.1.3數據驅動為核心的機器學習175
7.1.4模型評估176
7.2分類與回歸178
7.2.1決策樹178
7.2.2隨機森林178
7.2.3KNN178
7.2.4樸素貝葉斯179
7.2.5支持向量機179
7.2.6人工神經網路180
7.3聚類分析180
7.3.1K均值聚類180
7.3.2主成分分析181
7.4可視化挖掘工具181
7.5綜合實驗181
7.5.1實驗1: 決策樹181
7.5.2實驗2: 隨機森林183
7.5.3實驗3: KNN186
7.5.4實驗4: 樸素貝葉斯187
7.5.5實驗5: 支持向量機189
7.5.6實驗6: 人工神經網路192
7.5.7實驗7: KMeans聚類194
7.5.8實驗8: 主成分分析196
思考與練習199
拓展篇
第8章高級特性203
8.1面向對象的編程203
8.1.1面向對象的含義203
8.1.2R語言與面向對象編程204
8.1.3S3類206
8.1.4S4類207
8.2程式調試209
8.2.1程式調試介紹209
8.2.2R語言如何調試209
8.3性能提升210
8.3.1向量化210
8.3.2語句最佳化212
8.4並行計算212
8.5綜合實驗213
思考與練習217
第9章套用拓展219
9.1R語言與數學219
9.1.1微積分219
9.1.2線性代數219
9.1.3機率論與數理統計220
9.1.4多元統計分析220
9.1.5數值計算220
9.2R語言的套用拓展220
9.2.1關聯規則220
9.2.2智慧型推薦221
9.2.3時間序列221
9.2.4深度學習222
思考與練習222
附錄A本書使用的函式223
參考文獻229

相關詞條

熱門詞條

聯絡我們