R 語言數據分析項目精解:理論、方法、實戰

R 語言數據分析項目精解:理論、方法、實戰

《R 語言數據分析項目精解:理論、方法、實戰》是2017年8月電子工業出版社出版的書籍,作者是羅榮錦。

基本介紹

  • 中文名:R 語言數據分析項目精解:理論、方法、實戰
  • 作者:羅榮錦
  • 出版社:電子工業出版社
  • 出版時間:2017年8月
  • 頁數:352 頁
  • 定價:69 元
  • 開本:16 開
  • ISBN: 9787121315732
內容提要,目錄,

內容提要

《R 語言數據分析項目精解:理論、方法、實戰》以網際網路電商企業為背景,抽象出工作中常見的數據分析問題,利用R 語言和統計學列出了詳細的解決方案和過程。《R 語言數據分析項目精解:理論、方法、實戰》共9 章,前兩章分別為總論和R 語言入門知識,之後各章分別介紹了運營指標的建立、指標監控系統、假設檢驗及AB 測試、變數篩選技術、用戶畫像系統、尋找優質用戶和文本挖掘等內容。本書涉及到的統計方法有:指標增長幅度量化方法、層次分析法時間序列模型、基於常態分配的一元離群點檢驗、傅立葉譜分析、假設檢驗、主成分分析、因子分析、模糊聚類、無監督下連續型變數離散化、邏輯回歸模型和文本挖掘等。另外,《R 語言數據分析項目精解:理論、方法、實戰》提供了所有實例的R 語言實現代碼,總計33 個自定義函式和數千行代碼。
《R 語言數據分析項目精解:理論、方法、實戰》適合數據分析從業人員、產品運營人員、統計專業學生和R 語言愛好者閱讀。

目錄

第1 章 網際網路+統計學+R 語言1
1.1 網際網路中的統計學 1
1.1.1 “網際網路+”的發展 1
1.1.2 統計學的發展 2
1.1.3 大數據時代的統計學 2
1.2 R 語言——網際網路與統計學的橋樑 3
1.3 本書結構5
第2 章 R 語言基礎7
2.1 安裝R 語言 7
2.1.1 獲取和安裝R 語言 7
2.1.2 安裝RStudio 9
2.1.3 R 包 10
2.1.4 幫助 12
2.2 R 語言基本對象 12
2.2.1 數據類型12
2.2.2 向量 12
2.2.3 矩陣和數組19
2.2.4 列表 27
2.2.5 數據框 29
2.2.6 因子 32
2.2.7 數據類型的辨別和轉換 39
2.2.8 數據類型和對象關係 39
2.3 工作空間和查看對象 40
2.3.1 工作空間和工作目錄 40
2.3.2 遍歷、創建、刪除資料夾41
2.3.3 查看對象的方法 42
2.4 數據導入和導出 43
2.4.1 數據導入43
2.4.2 數據導出49
2.5 操作符和函式 51
2.5.1 操作符 51
2.5.2 函式 54
2.6 數據集操作59
2.6.1 變數操作60
2.6.2 數據集操作63
2.6.3 數據集連線67
2.6.4 數據匯總68
2.7 控制流71
2.7.1 重複和循環71
2.7.2 條件執行73
2.7.3 next 和break 74
2.8 自定義函式75
第3 章 網際網路運營指標的建立 77
3.1 項目背景、目標及方案78
3.1.1 項目背景78
3.1.2 項目目標78
3.1.3 項目方案78
3.2 項目技術理論簡介78
3.2.1 骨灰級流量指標 78
3.2.2 登錄和激活80
2.2.3 訪問深度和吸引力81
3.2.4 訂單指標85
3.2.5 網站或APP 性能指標 86
3.2.6 轉化率 87
3.2.7 層次分析法87
3.3 項目實踐 92
3.3.1 搭建運營指標系統92
3.3.2 製作對比型指標及趨勢線97
3.3.3 創建用戶價值和活躍度指標101
第4 章 指標監控系統111
4.1 項目背景、目標及方案111
4.1.1 項目背景.111
4.1.2 項目目標.111
4.1.3 項目方案 112
4.2 項目技術理論簡介 112
4.2.1 時間序列基本統計量112
4.2.2 數據觀測與描述性統計 113
4.2.3 隨機性 115
4.2.4 周期性 115
4.2.5 節假日模式識別 115
4.2.6 建模數據集的建立 118
4.2.7 指標監控方法(不含節假日) 125
4.2.8 節假日指標監控方法134
4.2.9 R 語言實例代碼 135
4.3 項目實踐 141
4.3.1 數據概覽 142
4.3.2 節假日模式識別 145
4.3.3 模型數據集的建立 155
4.3.4 指標監控(非節假日) 160
4.3.5 節假日指標監控 176
4.3.6 總結181
第5 章 用數據驅動業務——AB 測試182
5.1 項目背景、目標和方案 182
5.1.1 項目背景 182
5.1.2 項目目標 183
5.1.3 項目方案 183
5.2 項目技術理論簡介 183
5.2.1 自動化分流策略 183
5.2.2 整體評估指標185
5.2.3 機率論預備知識 186
5.2.4 假設檢驗 191
5.2.5 三個問題 197
5.3 項目實踐 197
第6 章 變數篩選技術 204
6.1 項目背景、目標和方案 204
6.1.1 項目背景 204
6.1.2 項目目標 205
6.1.3 項目方案 205
6.2 項目技術理論簡介 205
6.2.1 變數相關性 206
6.2.2 變數篩選 209
6.2.3 變數降維 215
6.2.4 R 語言實例代碼 225
6.3 項目實踐 237
6.3.1 變數篩選 238
6.3.2 變數降維 243
第7 章 構建用戶畫像系統 247
7.1 項目背景、目標和方案 247
7.1.1 項目背景 247
7.1.2 項目目標 248
7.1.3 項目方案 248
7.2 項目技術理論簡介 248
7.2.1 用戶畫像的基本概念248
7.2.2 用戶畫像套用領域 249
7.2.3 用戶畫像分類250
7.2.4 用戶畫像構建250
7.2.5 用戶畫像標籤的數值處理方法 254
7.3 項目實踐 256
第8 章 從數據中尋找優質用戶 261
8.1 項目背景、目標和方案 261
8.1.1 項目背景 261
8.1.2 項目目標 262
8.1.3 項目方案 262
8.2 項目技術理論簡介 262
8.2.1 邏輯回歸的基本概念262
8.2.2 建模流程 266
8.2.3 模型開發階段269
8.2.4 模型驗證階段279
8.2.5 模型測試階段285
8.2.6 商業套用流程288
8.2.7 R 語言實例代碼 288
8.3 項目實踐 295
8.3.1 數據探索 295
8.3.2 數據處理 297
8.3.3 建立模型 302
8.3.4 模型驗證 304
8.3.5 總結308
第9 章 文本挖掘——點評數據展示策略309
9.1 項目背景、目標和方案 310
9.1.1 項目背景 310
9.1.2 項目目標 311
9.1.3 項目方案 311
9.2 項目技術理論簡介 312
9.2.1 評論文本質量量化指標模型312
9.2.2 用戶相似度模型 313
9.2.3 情感性分析 316
9.2.4 R 語言實例代碼 321
9.3 項目實踐 326
9.3.1 若干自定義函式 326
9.3.2 文本質量量化指標模型 329
9.3.3 用戶相似度模型 334
9.3.4 情感性分析 335
9.3.5 總結340

相關詞條

熱門詞條

聯絡我們