R語言數據挖掘:實用項目解析

《R語言數據挖掘:實用項目解析》是2017年機械工業出版社出版的圖書。

基本介紹

  • 中文名:R語言數據挖掘:實用項目解析
  • 出版時間:2017年5月1日
  • 出版社:機械工業出版社
  • ISBN:9787111565208
內容簡介,圖書目錄,

內容簡介

本書將闡述數據挖掘的一些主題,如數學表述、在軟體中的實現,以及如何據此來解決商業問題。本書旨在讓讀者可以從數據管理技術、探索性數據分析、數據可視化等內容著手學習,循序漸進,直至建立高級預測模型。本書也從數據科學、分析學、統計建模以及可視化等角度對數據挖掘這一概念進行了綜述。

圖書目錄

譯者序
前言
第1章 使用R內置數據進行數據處理 1
1.1 什麼是數據挖掘 2
1.2 R語言引論 4
1.2.1 快速入門 4
1.2.2 數據類型、向量、數組與矩陣 4
1.2.3 列表管理、因子與序列 7
1.2.4 數據的導入與導出 8
1.3 數據類型轉換 10
1.4 排序與合併數據框 11
1.5 索引或切分數據框 15
1.6 日期與時間格式化 16
1.7 創建新函式 17
1.7.1 用戶自定義函式 17
1.7.2 內置函式 18
1.8 循環原理——for循環 18
1.9 循環原理——repeat循環 19
1.10 循環原理——while循環 19
1.11 apply原理 19
1.12 字元串操作 21
1.13 缺失值(NA)的處理 22
小結 23
第2章 汽車數據的探索性分析 24
2.1 一元分析 24
2.2 二元分析 30
2.3 多元分析 31
2.4 解讀分布和變換 32
2.4.1 常態分配 32
2.4.2 二項分布 34
2.4.3 泊松分布 34
2.5 解讀分布 34
2.6 變數分段 37
2.7列聯表、二元統計及數據正態性檢驗 37
2.8 假設檢驗 41
2.8.1 總體均值檢驗 42
2.8.2 雙樣本方差檢驗 46
2.9 無參數方法 48
2.9.1 Wilcoxon符號秩檢驗 49
2.9.2 Mann-Whitney-Wilcoxon檢驗 49
2.9.3 Kruskal-Wallis檢驗 49
小結 50
第3章 可視化diamond數據集 51
3.1 使用ggplot2可視化數據 54
3.1.1 條狀圖 64
3.1.2 盒狀圖 65
3.1.3 氣泡圖 65
3.1.4 甜甜圈圖 66
3.1.5 地理製圖 67
3.1.6 直方圖 68
3.1.7 折線圖 68
3.1.8 餅圖 69
3.1.9 散點圖 70
3.1.10 堆疊柱形圖 75
3.1.11 莖葉圖 75
3.1.12 詞雲 76
3.1.13 鋸齒圖 76
3.2 使用plotly 78
3.2.1 氣泡圖 78
3.2.2 用plotly畫條狀圖 79
3.2.3 用plotly畫散點圖 79
3.2.4 用plotly畫盒狀圖 80
3.2.5 用plotly畫極坐標圖 82
3.2.6 用plotly畫極坐標散點圖 82
3.2.7 極坐標分區圖 83
3.3 創建地理製圖 84
小結 84
第4章 用汽車數據做回歸 85
4.1 回歸引論 85
4.1.1 建立回歸問題 86
4.1.2 案例學習 87
4.2 線性回歸 87
4.3 通過逐步回歸法進行變數選取 98
4.4 Logistic回歸 99
4.5 三次回歸 105
4.6 懲罰回歸 106
小結 109
第5章 基於產品數據的購物籃分析 110
5.1 購物籃分析引論 110
5.1.1 什麼是購物籃分析 111
5.1.2 哪裡會用到購物籃分析 112
5.1.3 數據要求 112
5.1.4 前提假設/要求 114
5.1.5 建模方法 114
5.1.6 局限性 114
5.2 實際項目 115
5.2.1 先驗算法 118
5.2.2 eclat算法 121
5.2.3 可視化關聯規則 123
5.2.4 實施關聯規則 124
小結 126
第6章 聚類電商數據 127
6.1 理解客戶分類 128
6.1.1 為何理解客戶分類很重要 128
6.1.2 如何對客戶進行分類 128
6.2 各種適用的聚類方法 129
6.2.1 K均值聚類 130
6.2.2 層次聚類 135
6.2.3 基於模型的聚類 139
6.2.4 其他聚類算法 140
6.2.5 聚類方法的比較 143
參考文獻 143
小結 143
第7章 構建零售推薦引擎 144
7.1 什麼是推薦 144
7.1.1 商品推薦類型 145
7.1.2 實現推薦問題的方法 145
7.2 前提假設 147
7.3 什麼時候採用什麼方法 148
7.4 協同過濾的局限 149
7.5 實際項目 149
小結 157
第8章 降維 158
8.1 為什麼降維 158
8.2 降維實際項目 161
8.3 有參數法降維 172
參考文獻 173
小結 173
第9章 神經網路在醫療數據中的套用 174
9.1 神經網路引論 174
9.2 理解神經網路背後的數學原理 176
9.3 用R語言實現神經網路 177
9.4 套用神經網路進行預測 180
9.5 套用神經網路進行分類 183
9.6 套用神經網路進行預測 185
9.7 神經網路的優缺點 187
參考文獻 187
小結 187

相關詞條

熱門詞條

聯絡我們