數據分析與挖掘——R語言

數據分析與挖掘——R語言

《數據分析與挖掘——R語言》是2021年電子工業出版社出版的圖書,作者是蔡銀英、韋鵬程。

基本介紹

  • 中文名:數據分析與挖掘——R語言
  • 作者:蔡銀英、韋鵬程
  • 出版社:電子工業出版社
  • 出版時間:2021年
  • 頁數:200 頁
  • 定價:52 元
  • 開本:16 開 
  • ISBN:9787121415388
目錄,內容簡介,

目錄

第1章 R語言簡介 1
1.1 獲取R 1
1.2 R使用入門 4
1.2.1 R操作界面 4
1.2.2 RStudio視窗介紹 5
1.2.3 R的常用操作 6
1.3 R的簡單操作 8
1.3.1 基本數學運算 8
1.3.2 變數 8
1.3.3 數據結構 9
1.4 R數據分析包 12
1.5 小結 12
參考文獻 13
第2章 數據挖掘基礎 14
2.1 數據挖掘的定義 14
2.2 數據探索及預處理 15
2.2.1 髒數據分析 15
2.2.2 數據特徵分析 19
2.2.3 數據預處理 23
2.3 模型簡介 27
2.3.1 聚類模型 27
2.3.2 回歸模型 31
2.3.3 決策樹 34
2.3.4 人工神經網路 35
2.3.5 關聯規則分析模型 38
2.4 小結 42
參考文獻 42
第3章 數據挖掘網站用戶行為分析及網頁智慧型推薦 44
3.1 背景與挖掘目標 44
3.2 用戶分群 47
3.2.1 用戶分群的分析方法 47
3.2.2 數據的抽取 48
3.2.3 數據的預處理與探索分析 49
3.2.4 用戶分群結果 57
3.2.5 用戶分群的套用 66
3.3 網頁智慧型推薦 66
3.3.1 網頁智慧型推薦的分析方法 66
3.3.2 數據的預處理 67
3.3.3 組合推薦模型 68
3.3.4 組合推薦結果 78
3.4 總結 78
3.4.1 相關結論及套用 78
3.4.2 相關的問題思考 78
參考文獻 79
第4章 生活服務點評網站客戶分群 80
4.1 背景與挖掘目標 80
4.2 分析方法與過程 81
4.2.1 數據抽取 82
4.2.2 數據探索 82
4.2.3 數據預處理 94
4.2.4 模型構建 102
4.3 小結 113
第5章 水冷中央空調系統的最佳化控制策略 114
5.1 背景及挖掘目標 114
5.2 分析的方法及流程 115
5.3 數據預處理 118
5.3.1 變數選取 118
5.3.2 數據探索 120
5.3.3 數據變換 130
5.4 最佳化控制模型 131
5.4.1 總耗電量與可控變數 132
5.4.2 冷卻負載與可控變數 140
5.5 模型求解 144
5.5.1 工作日模型求解 144
5.5.2 確定狀態值 148
5.6 總結 155
參考文獻 156
第6章 電商評價文本的主題特徵詞分析 157
6.1 背景與挖掘目標 157
6.2 分析的方法及過程 158
6.2.1 評論數據採集 159
6.2.2 文本數據預處理 161
6.2.3 基於LDA主題模型的特徵詞分析 167
6.3 小結 169
參考文獻 169
第7章 均線投資策略 171
7.1 背景及投資策略介紹 171
7.1.1 移動平均線相關理論介紹 172
7.1.2 名詞及概念介紹 175
7.2 基於移動平均線的投資策略 176
7.2.1 單均線投資策略 177
7.2.2 雙均線投資策略 177
7.3 雙均線投資策略實際套用 178
7.3.1 雙均線投資策略總體流程 178
7.3.2 數據獲取 178
7.3.3 簡單的K線圖實現 179
7.3.4 均線模型 180
7.3.5 其他雙均線策略的收益 188
7.4 主要結論及展望 189
7.4.1 結論 189
7.4.2 後續策略的展望 190
參考文獻 191
致謝 192

內容簡介

本書以R語言簡介、數據挖掘基礎為開篇,旨在讓讀者對所用工具及數據挖掘方法有所了解。隨後的章節藉助實際案例(數據挖掘網站用戶行為分析及網頁智慧型推薦、生活服務點評網站客戶分群、水冷中央空調系統的最佳化控制策略、電商評價文本的主題特徵詞分析、均線投資策略等),從數據預處理、模型選擇、算法介紹、R語言實現、結論分析及評價等方面進行詳盡的論述,希望讀者既可以了解數據分析與挖掘的一般流程及方法,又能對常用的算法及模型有所了解。每個案例分析都是一篇完整的論文,初學者通過它們可以了解數據分析與挖掘的一般流程及方法,有一定基礎的讀者可以思考算法的優劣與選擇。不管是對數據分析與挖掘感興趣的入門者,還是希望獲得實踐經驗的初學者,都可以從本書中獲得支持。

相關詞條

熱門詞條

聯絡我們