圖書目錄
第1 篇 數據思維
第1 章 數據思維是什麼 1
1.1 從數據治理流程淺談數據思維 1
1.1.1 什麼是數據治理 2
1.1.2 數據治理流程介紹 2
1.1.3 從數據治理流程談數據部門崗位職責 . 3
1.1.4 數據分析師在數據治理流程中所需要的數據思維 . 4
1.2 數據思維到底是什麼 5
1.2.1 套用數據思維的工作 5
1.2.2 數據思維是可以培養的 .. 6
1.3 數據思維最直觀的解釋 6
1.3.1 構建有效的監控體系和客觀的評價標準 . 7
1.3.2 用合理的分析方法探究原因以及評價效果 . 7
1.3.3 綜合運用統計學知識對活動效果進行預估 . 8
第2 章 為什麼數據思維如此重要 . 9
2.1 數據思維是數據分析師必備的技能 9
2.1.1 數據分析師必備的硬技能 9
2.1.2 數據分析師必備的軟技能 10
2.1.3 為什麼軟技能比硬技能重要 10
2.2 數據思維是數據分析師成長晉升的必備技能 11
2.3 數據思維能幫助數據分析師建立影響力 11
第3 章 數據思維如何培養 14
3.1 熟悉常用的數據分析方法 14
3.1.1 三大分析思維 14
3.1.2 不同生命周期的分析方法 15
3.2 樹立目標意識,尋找潛在分析點 16
3.2.1 為什麼需要樹立目標意識 17
3.2.2 通過多問“為什麼”,樹立目標意識 . 18
3.3 不預設立場,通過客觀的標準代替主觀的判斷 19
3.3.1 不預設立場才能做到客觀 19
3.3.2 預設立場與假設檢驗的區別 20
3.4 基於數據分析結果為業務方提出切實可行的解決方案 21
3.4.1 數據分析師提出合理建議需要經歷的三個階段 21
3.4.2 數據分析師需要避免的幾種提建議的方式 23
第2 篇 數據指標體系
第4 章 數據埋點 . 27
4.1 數據埋點簡介 27
4.1.1 從數據產生流程淺談數據埋點 28
4.1.2 為什麼需要進行數據埋點 29
4.1.3 數據埋點能夠採集哪些用戶數據 29
4.1.4 數據埋點與隱私保護 30
4.2 數據埋點分類及主流的數據上報技術 30
4.2.1 數據埋點的分類及方式 30
4.2.2 主流的數據上報技術 31
4.3 數據埋點方案設計 32
4.3.1 數據埋點流程 33
4.3.2 通過六個步驟實現數據埋點設計 34
4.3.3 以電商成交為例實現數據埋點設計 35
第5 章 數據標籤體系 . 38
5.1 數據標籤體系與用戶畫像 38
5.1.1 什麼是數據標籤體系 38
5.1.2 數據標籤體系的作用 39
5.1.3 數據標籤的分類 39
5.1.4 用戶數據標籤的層級分類 40
5.1.5 數據標籤體系與用戶畫像的關係 41
5.2 如何構建數據標籤體系 42
5.2.1 數據標籤體系構建的流程 42
5.2.2 數據分析師在標籤體系構建過程中承擔的角色 43
5.2.3 以某App 付費用戶的數據標籤體系的構建為例,淺析數據標籤體系構建過程 44
5.3 數據標籤體系的套用場景 47
5.3.1 數據標籤體系輔助運營人員進行決策分析 . 48
5.3.2 數據標籤體系可提升數據分析師的分析效率 . 48
第6 章 數據指標體系 49
6.1 從中國人口數據初識指標體系構建 49
6.1.1 什麼是指標體系 49
6.1.2 為什麼需要指標體系 50
6.1.3 指標體系的評價標準及注意事項. 53
6.2 用四個模型梳理數據指標體系構建的方法論 53
6.2.1 構建數據指標體系的方法 54
6.2.2 用三個步驟、四個模型梳理數據指標體系的方法 . 54
6.2.3 以GMV 為例搭建數據指標體系 . 57
6.3 如何搭建一套通用的指標體系並快速落地套用 60
6.3.1 多部門配合搭建數據指標體系的流程 . 60
6.3.2 搭建通用的指標體系 61
6.4 定位異動因素 65
6.4.1 數據波動多少才能稱為數據異動. 65
6.4.2 數據波動分析的方法論 65
6.4.3 從數據埋點到指標體系再到指標異動的閉環 . 70
第3 篇 數據分析方法論
第7 章 對比思維 . 71
7.1 利用對比分析得出結論 71
7.1.1 對比分析的作用 71
7.1.2 確定對比的對象 72
7.1.3 如何對比 72
7.1.4 對比分析的可比性原則 77
7.2 A/B 試驗設計及容易忽略的誤區 . 78
7.2.1 什麼是A/B 試驗 . 78
7.2.2 A/B 試驗能解決什麼問題 . 78
7.2.3 A/B 試驗的流程 . 79
7.2.4 A/B 試驗常見的誤區 82
7.3 A/B 試驗背後涉及的統計學原理 . 87
7.3.1 什麼是抽樣 87
7.3.2 樣本為什麼可以代表總體 88
7.3.3 通過假設檢驗判斷A、B 兩組樣本是否存在差異 . 90
7.3.4 如何通過樣本估計總體 91
7.3.5 如何確定足夠的樣本量,以達到所希望的邊際誤差 92
7.3.6 如何衡量試驗效果 94
7.3.7 多重比較中P 值修正的三方法 96
7.4 Python 實戰:A/B 試驗在廣告方案選擇中的套用 96
7.4.1 試驗背景 96
7.4.2 數據基本情況探索 97
7.4.3 A/B 試驗結果分析 98
第8 章 分群思維 . 102
8.1 從用戶生命周期淺談分群思維 102
8.1.1 什麼是分群思維 102
8.1.2 為什麼需要用戶分群 104
8.1.3 用戶分群方法論 106
8.2 用數據分箱進行結構化分析 107
8.2.1 結構化分析是什麼 107
8.2.2 如何更加高效地做結構化分析 109
8.3 同期群分析解讀用戶生命周期,剖析真實用戶行為和價值 110
8.3.1 同期群分析是什麼 111
8.3.2 做同期群分析的意義 112
8.3.3 數據分析師如何快速地做同期群分析 113
8.4 Python 實戰:基於RFM 模型及K-Means 算法實現用戶分群 . 115
8.4.1 RFM 模型與K-Means 算法介紹 116
8.4.2 RFM 模型實現用戶分群 . 118
8.4.3 K-Means 算法實現用戶分群 123
第9 章 相關與因果 . 133
9.1 相關性分析簡介 133
9.1.1 相關性分析與相關係數 133
9.1.2 常用的三種相關係數 134
9.1.3 相關係數實戰 136
9.2 因果推斷方法論 138
9.2.1 相關性不等於因果性的示例 139
9.2.2 從辛普森悖論談因果推斷 139
9.2.3 因果推斷的三個層級 141
9.2.4 因果推斷的方法 141
9.2.5 因果推斷常用的框架 144
9.3 Python 實戰:利用DoWhy 框架實現因果推斷 . 144
9.3.1 DoWhy 因果推斷框架簡介 . 145
9.3.2 數據來源及預處理 145
9.3.3 數據相關性探索 148
9.3.4 因果推斷實現 149
第4 篇 數據分析案例實戰
第10 章 用戶流失分析 159
10.1 用戶流失分析方法論 159
10.1.1 用戶流失分析總體方法論 160
10.1.2 定義流失用戶的方法 161
10.1.3 分析用戶流失的原因 164
10.1.4 生成流失用戶標籤 164
10.1.5 預測潛在流失用戶 165
10.1.6 分層運營及用戶召回 165
10.2 案例分析:用5W2H 方法分析遊戲用戶流失原因 165
10.2.1 情景介紹 165
10.2.2 5W2H 方法介紹 . 166
10.2.3 以遊戲用戶流失為例,詳解5W2H 方法 167
10.3 用5 個理論模型構建外部因素分析框架 170
10.3.1 通過SWOT 模型全面認識產品 . 171
10.3.2 PEST 模型分析外部巨觀環境的四個視角 171
10.3.3 用波特五力模型分析競品的五個維度 . 172
10.3.4 用4P 理論指導競品分析 173
10.3.5 用戶體驗五要素模型最佳化產品功能,減少用戶流失 . 174
10.3.6 幾個模型之間的關聯 175
10.4 如何設計問卷驗證用戶流失的原因 176
10.4.1 問卷可以做什麼 176
10.4.2 如何設計問卷 176
10.4.3 問卷的投放 180
10.4.4 數據分析及報告撰寫 181
10.4.5 通過問卷獲取信息可能存在的問題 181
10.5 Python 實戰:通過生存分析預測用戶流失周期 182
10.5.1 生存分析 182
10.5.2 數據基本情況探索 184
10.5.3 探索變數之間的相關性 188
10.5.4 用KM 模型分析用戶留存率 189
10.5.5 Cox 風險比例模型 190
第11 章 用戶轉化與付費分析 197
11.1 用戶轉化與付費分析概述 197
11.1.1 從用戶轉化談數據分析師的職責 197
11.1.2 用戶轉化與付費常用的分析方法介紹 198
11.2 貝葉斯公式在用戶轉化中的套用 198
11.2.1 貝葉斯公式簡介 199
11.2.2 用貝葉斯公式預估特定群體的轉化率 199
11.3 案例分析:用漏斗模型分析某電商平台換貨業務,提升用戶轉化率 201
11.3.1 什麼是漏斗分析 201
11.3.2 漏斗分析的核心步驟 202
11.3.3 以某電商平台逆向上門取件換貨業務為例,詳解漏斗分析法. 203
11.4 用行銷增益模型實現用戶分群,輔助運營人員識別行銷敏感人群 208
11.4.1 什麼是行銷增益模型 208
11.4.2 為什麼需要行銷增益模型 209
11.4.3 行銷增益模型的建模方法 210
11.4.4 行銷增益模型的評價指標 211
11.5 Python 實戰:利用行銷增益模型識別行銷敏感人群 212
11.5.1 數據初步探索 212
11.5.2 數據預處理及數據可視化 214
11.5.3 構建行銷增益模型 216
附錄A 縮略詞及中英文對照 . 219
參考文獻 . 221
作者簡介
李渝方,網名森夏恩,復旦大學碩士,生物醫學專業轉行網際網路數據分析,先後就職於游族網路、 阿里巴巴,現就職於某網際網路大廠擔任數據分析師。知乎數據分析話穎的優秀回答者, 公眾號“數據萬花筒”運營者,累計創作 “100+”篇數據分析原創文章,原創文章在全網累計閱讀量超過百萬
所獲榮譽
2022年5月,入選《全國新書目》5月薦書單。