《循序漸進學習商業分析:使用SAS與R語言》是2021年清華大學出版社出版圖書,作者是蘇巴西尼·夏瑪·特里帕蒂。
基本介紹
- 中文名:循序漸進學習商業分析:使用SAS與R語言
- 作者:[印]蘇巴西尼·夏瑪·特里帕蒂
- 譯者:吳驊
- 出版社:清華大學出版社
- 出版時間:2021年2月1日
- 定價:89.00 元
- ISBN:9787302570806
內容簡介,圖書目錄,
內容簡介
《循序漸進學習商業分析:使用SAS與R語言》詳細闡述了與SAS和R語言商業分析相關的解決方案,主要內容包括了解SAS和R、使用SAS和R進行數據處理、使用SAS和R發現有關數據的基本信息、可視化、機率、樣本和抽樣分布、分析的置信區間和正確性等。此外,本書還提供了豐富的示例及代碼,以幫助讀者進一步理解相關方案的實現過程。本書適合作為高等院校計算機及相關專業的教材和教學參考書,也可作為相關開發人員的自學教材和參考手冊。
圖書目錄
第1章 分析的過程 1
1.1 分析的定義 1
1.1.1 簡單的分析示例 2
1.1.2 典型日常工作 3
1.1.3 適合數據分析師職業的個人特質 3
1.2 分析的演變 4
1.2.1 質量運動 5
1.2.2 第二次世界大戰 7
1.2.3 統計的影響和涉及面 7
1.3 商業智慧型的曙光 8
第2章 了解SAS和R 11
2.1 選擇SAS和R的原因 11
2.1.1 市場概況 11
2.1.2 高級分析的定義 12
2.2 SAS和R的歷史 13
2.2.1 SAS的歷史 14
2.2.2 關於EG 15
2.2.3 獲得SAS Enterprise Guide軟體的方式 15
2.2.4 R的歷史 15
2.2.5 關於R的命名 16
2.2.6 關於R 16
2.2.7 關於RStudio 16
2.2.8 關於CRAN 18
2.2.9 關於R的附加軟體包 19
2.2.10 微軟公司收購Revolution Analytics的意義 20
2.3 安裝SAS和R 20
2.3.1 獲得SAS 20
2.3.2 SAS University Edition 21
2.3.3 SAS OnDemand for Academics 26
2.3.4 Education Analytical Suite 29
2.3.5 安裝R 29
第3章 使用SAS和R進行數據處理 33
3.1 定義:數據處理之前的階段 33
3.2 常見業務問題的基本理解 34
3.2.1 數據來源 36
3.2.2 使用基準創建最佳定義陳述 36
3.3 從ERP到業務分析SaaS的數據流 37
3.3.1 主鍵 38
3.3.2 關係資料庫 38
3.4 數據完整性檢查 39
3.5 SAS案例研究1 39
3.5.1 問題陳述 40
3.5.2 導入數據 41
3.5.3 查看數據 42
3.5.4 收集和組織數據 44
3.5.5 可視化 47
3.5.6 執行分析 50
3.6 R案例研究1 52
3.6.1 問題陳述 52
3.6.2 導入數據 53
3.6.3 查看數據 53
3.6.4 收集和組織數據 56
3.6.5 可視化 63
3.6.6 執行分析 68
第4章 使用SAS和R發現有關數據的基本信息 73
4.1 關於描述性統計 73
4.1.1 有關推論和描述統計的更多信息 74
4.1.2 表格和描述性統計 75
4.1.3 關於頻率分布 76
4.2 SAS案例研究2 78
4.2.1 問題陳述 78
4.2.2 導入數據 79
4.2.3 查看數據 80
4.2.4 關於單變數過程 82
4.2.5 收集和組織數據 85
4.2.6 可視化 90
4.2.7 執行分析 91
4.3 R案例研究2 92
4.3.1 問題陳述 92
4.3.2 導入數據 93
4.3.3 查看數據 93
4.3.4 收集和組織數據 95
4.3.5 可視化 102
4.3.6 執行分析 102
4.4 使用描述性統計 104
4.4.1 集中趨勢的度量 104
4.4.2 散布的度量 105
4.4.3 差異分析 106
4.4.4 方差 107
第5章 可視化 111
5.1 可視化的定義 111
5.2 當今世界的數據可視化 113
5.3 進行數據可視化的理由 113
5.4 常見的圖形和圖表類型 115
5.5 SAS案例研究3 116
5.5.1 關於數據 116
5.5.2 數據內容 116
5.5.3 定義 116
5.5.4 問題陳述 117
5.5.5 SAS解決方案 117
5.6 SAS代碼和解決方案 118
5.6.1 導入數據 118
5.6.2 查看內容並了解變數 121
5.6.3 保留所需的變數 121
5.6.4 創建所需的欺詐指標變數 122
5.6.5 組織和整理數據 123
5.6.6 可視化y變數 125
5.7 R案例研究3 129
5.7.1 關於數據 129
5.7.2 數據內容 130
5.7.3 定義 130
5.7.4 問題陳述 130
5.7.5 R中的解決方案 130
5.8 R代碼和解決方案 131
5.8.1 導入數據 131
5.8.2 查看內容並了解變數 132
5.8.3 保留所需的變數 134
5.8.4 創建所需的欺詐指標變數 135
5.8.5 組織和整理數據 136
5.8.6 可視化y變數 137
5.9 相關性和協方差 141
5.10 對相關性的解釋 142
第6章 機率 143
6.1 機率的定義 143
6.2 獨立事件的機率:兩個或多個事件的機率 144
6.3 條件事件的機率:兩個或多個事件的機率 144
6.4 使用機率的原因 145
6.5 使用貝葉斯定理計算機率 146
6.5.1 貝葉斯定理的似然性 146
6.5.2 從條件機率推導貝葉斯定理 147
6.5.3 決策樹:用它來理解貝葉斯定理 148
6.6 計算機率的頻率 148
6.6.1 離散變數 148
6.6.2 連續變數 149
6.6.3 常態分配 149
6.6.4 變數不是常態分配的情形 150
6.7 SAS案例研究4 151
6.7.1 問題陳述 151
6.7.2 導入數據 152
6.7.3 查看數據 152
6.7.4 定義業務問題 153
6.7.5 可視化 154
6.7.6 查看變數的基本統計信息 156
6.7.7 組織和整理數據 158
6.7.8 SAS練習1 160
6.7.9 SAS練習2 165
6.8 R案例研究4 165
6.8.1 問題陳述 165
6.8.2 導入數據 166
6.8.3 查看數據 166
6.8.4 定義業務問題 167
6.8.5 可視化 168
6.8.6 查看變數的基本統計信息 169
6.8.7 組織和整理數據 170
6.8.8 執行分析 173
6.8.9 R練習 179
第7章 樣本和抽樣分布 181
7.1 了解樣本 181
7.2 抽樣分布 185
7.2.1 離散均勻分布 187
7.2.2 二項分布 188
7.2.3 連續均勻分布 189
7.2.4 泊松分布 190
7.2.5 機率分布的使用 190
7.3 中心極限定理 190
7.4 大數定律 191
7.5 使用統計數據進行業務決策 192
7.6 參數檢驗 193
7.7 非參數檢驗 194
7.8 SAS案例研究5 195
7.8.1 問題陳述 195
7.8.2 導入數據 195
7.8.3 查看數據 196
7.8.4 組織和整理數據 197
7.8.5 執行分析 201
7.9 R案例研究5 204
7.9.1 問題陳述 204
7.9.2 導入數據 204
7.9.3 收集和組織數據 204
7.9.4 可視化 205
7.9.5 執行分析 207
第8章 分析的置信區間和正確性 213
8.1 確定統計結果的方式 213
8.2 關於P值 216
8.3 假設檢驗中的錯誤 218
8.4 SAS案例研究6 219
8.4.1 問題陳述 219
8.4.2 導入數據 219
8.4.3 查看數據 220
8.4.4 組織和整理數據 221
8.4.5 執行分析 222
8.5 R案例研究6 223
8.5.1 問題陳述 223
8.5.2 導入數據 223
8.5.3 查看數據 223
8.5.4 組織和整理數據 225
8.5.5 執行分析 226
第9章 結論和見解 229
9.1 關於見解 229
9.1.1 描述統計 230
9.1.2 圖表 231
9.1.3 推斷統計 231
9.1.4 差異統計 232
9.2 SAS案例研究7 232
9.2.1 問題陳述 233
9.2.2 導入數據 233
9.2.3 查看數據 233
9.2.4 組織和整理數據 233
9.2.5 可視化 234
9.2.6 執行分析 239
9.3 R案例研究7 240
9.3.1 問題陳述 240
9.3.2 導入數據 241
9.3.3 查看數據 241
9.3.4 組織和整理數據 241
9.3.5 可視化 242
9.3.6 執行分析 244