R語言機器學習:實用案例分析

《R語言機器學習:實用案例分析》是2017年機械工業出版社出版的圖書。

基本介紹

  • 中文名:R語言機器學習:實用案例分析
  • 出版時間:2017年6月1日
  • 出版社:機械工業出版社
  • ISBN:9787111565901
內容簡介,圖書目錄,

內容簡介

數據科學和機器學習是當今技術領域中的流行語。本書將帶您進行一次數據驅動的旅程,從基礎的R和機器學習開始,逐步建立用於解決實際問題的項目的概念。本書共8章。第1章介紹R及其相關的基礎知識,並簡單介紹了機器學習的概念。第2章深入研究機器學習,介紹各種類型的學習算法,以及一些現實世界的案例。第3章使用市場購物籃分析和關聯規則挖掘進行電子商務產品推薦、預測和模式分析。第4章分析不同用戶對電子商務產品的評論和評級,使用算法和技術(例如用戶協同過濾器)設計一個推薦系統。第5章將機器學習套用於信用風險檢測和預測中。第6章使用多種機器學習算法檢測和預測哪些客戶具有潛在信用風險,介紹了多種有監督學習算法並比較它們的性能。第7章介紹社交媒體和通過TwitterAPI收集數據的過程。第8章根據TwitterAPI的知識建立一個項目,基於該項目分析推文中的情感。

圖書目錄

譯者序
前言
關於作者
關於審稿人
第1章 開始使用R語言和機器學習 1
1.1 探究R的基本內容 2
1.1.1 使用R作為科學計算器 2
1.1.2 向量運算 3
1.1.3 特殊值 5
1.2 R的數據結構 5
1.2.1 向量 6
1.2.2 數組和矩陣 8
1.2.3 列表 13
1.2.4 數據框 16
1.3 使用函式 20
1.3.1 內置函式 20
1.3.2 用戶自定義函式 20
1.3.3 以參數形式傳遞函式 21
1.4 控制代碼流 22
1.4.1 使用if、if-else和ifelse語句 22
1.4.2 使用switch語句 23
1.4.3 循環 23
1.5 高級結構 24
1.5.1 lapply和sapply函式 25
1.5.2 apply函式 26
1.5.3 tapply函式 27
1.5.4 mapply函式 28
1.6 進一步使用R 29
1.6.1 獲得幫助 29
1.6.2 處理添加包 30
1.7 機器學習基礎 30
1.7.1 機器學習——真正的含義是什麼 30
1.7.2 機器學習——如何套用於現實世界 31
1.7.3 機器學習算法的類型 32
1.8 總結 33
第2章 讓我們進行機器學習 34
2.1 理解機器學習 35
2.2 機器學習算法 35
2.3 算法家族 40
2.3.1 有監督學習算法 41
2.3.2 無監督學習算法 52
2.4 總結 57
第3章 套用市場購物籃分析預測顧客購買趨勢 58
3.1 檢測和預測趨勢 59
3.2 市場購物籃分析 60
3.2.1 市場購物籃分析的真正含義 60
3.2.2 核心概念和定義 60
3.2.3 用於分析的技術 62
3.2.4 制定數據驅動的決策 63
3.3 評估產品列聯矩陣 63
3.3.1 獲取數據 64
3.3.2 分析和可視化數據 65
3.3.3 整體推薦 66
3.3.4 高級列聯矩陣 67
3.4 頻繁項集的生成 69
3.4.1 開始 69
3.4.2 數據檢索和轉換 69
3.4.3 建立項集關聯矩陣 70
3.4.4 建立頻繁項集生成工作流 72
3.4.5 檢測購物趨勢 74
3.5 關聯規則挖掘 75
3.5.1 載入添加包和數據 76
3.5.2 探索性分析 76
3.5.3 檢測和預測購物趨勢 77
3.5.4 關聯規則可視化 80
3.6 總結 80
第4章 建立產品推薦系統 82
4.1 理解推薦系統 83
4.2 推薦系統存在的問題 83
4.3 協同過濾器 84
4.3.1 核心概念和定義 84
4.3.2 協同過濾算法 85
4.4 建立推薦引擎 87
4.4.1 矩陣分解 88
4.4.2 算法實現 90
4.4.3 解釋結果 94
4.5 產品推薦引擎實戰 95
4.5.1 提取、轉換並分析數據 96
4.5.2 模型準備和預測 99
4.5.3 模型評價 100
4.6 總結 102
第5章 信用風險檢測和預測——描述分析 103
5.1 分析的類型 104
5.2 我們將要面臨的挑戰 104
5.3 什麼是信用風險 105
5.4 獲取數據 105
5.5 數據處理 107
5.5.1 處理缺失值 107
5.5.2 數據類型轉換 108
5.6 數據分析和變換 109
5.6.1 建立分析實用函式 110
5.6.2 分析數據集 113
5.6.3 保存變換後的數據集 130
5.7 接下來的步驟 130
5.7.1 建立特徵集 130
5.7.2 選擇機器學習算法 131
5.8 總結 131
第6章 信用風險檢測和預測——預測分析 133
6.1 預測分析 134
6.2 如何預測信用風險 135
6.3 預測模型中的重要概念 137
6.3.1 準備數據 137
6.3.2 建立預測模型 137
6.3.3 評估預測模型 138
6.4 獲取數據 140
6.5 數據處理 141
6.6 特徵選擇 142
6.7 套用邏輯回歸建立模型 144
6.8 套用支持向量機建立模型 148
6.9 套用決策樹建立模型 156
6.10 套用隨機森林建立模型 161
6.11 套用神經網路建立模型 165
6.12 模型比較和選擇 169
6.13 總結 171
第7章 社交媒體分析:分析Twitter數據 172
7.1 社交網路(Twitter) 172
7.2 數據挖掘與社交網路 174
7.2.1 挖掘社交網路數據 175
7.2.2 數據和可視化 176
7.3 從Twitter API開始 179
7.3.1 概覽 179
7.3.2 註冊套用 180
7.3.3 連結/認證 181
7.3.4 提取推文示例 182
7.4 Twitter數據挖掘 183
7.4.1 常用辭彙和關聯 186
7.4.2 廣泛使用的設備 191
7.4.3 層次聚類 192
7.4.4 主題建模 194
7.5 社交網路數據挖掘帶來的挑戰 197
7.6 參考文獻 198
7.7 總結 198
第8章 Twitter數據的情感分析 200
8.1 理解情感分析 201
8.1.1 情感分析的關鍵概念 201
8.1.2 方法 204
8.1.3 套用 205
8.1.4 挑戰 206
8.2 推文中的情感分析 206
8.2.1 極性分析 208
8.2.2 基於分類的算法 212
8.3 總結 223

相關詞條

熱門詞條

聯絡我們