客戶留存數據分析與預測

客戶留存數據分析與預測

客戶留存數據分析與預測是2023年清華大學出版社出版的圖書,作者是 [美]卡爾·戈爾德 (Carl Gold),譯者是殷海英。

基本介紹

  • 中文名: 客戶留存數據分析與預測
  • 作者:[美]卡爾·戈爾德 (Carl Gold)
  • 譯者:殷海英
  • 出版社:清華大學出版社
  • 出版時間:2023年6月1日
  • 開本:16 開
  • 裝幀:平裝
  • ISBN: 9787302630807
內容簡介,圖書目錄,作者簡介,

內容簡介

對於任何依賴經常性收入和重複銷售的企業來說,讓客戶保持活躍並持續購買是必不可少的。客戶流失(或“流失”),這種代價高昂且令人沮喪的事情是可以預防的。通過使用本書中介紹的技術,你可以識別客戶流失的預警信號,並學會在客戶離開之前識別並挽留他們。
《客戶留存數據分析與預測》向開發人員和數據科學家傳授經過實踐證明的技術與方法,可以在客戶流失發生之前阻止其發生。本書包含很多來自現實中的示例,介紹如何將原始數據轉換為可衡量的行為指標、計算客戶生命周期價值,並使用人口統計數據改進客戶流失預測。通過遵循 Zuora 首席數據科學家 Carl Gold 的方法,你將獲得高客戶留存率帶來的優勢。
主要內容
● 計算流失指標
● 通過客戶行為預測客戶流失
● 使用客戶細分策略減少客戶流失
● 將客戶流失分析技術套用於其他業務領域
● 使用人工智慧技術進行準確的客戶流失預測

圖書目錄

第Ⅰ部分 構建自己的“裝備庫”
第1章 客戶流失 3
1.1 為什麼閱讀本書 4
1.1.1 典型的客戶流失場景 5
1.1.2 本書主要內容 6
1.2 對抗客戶流失 6
1.2.1 減少客戶流失的干預措施 7
1.2.2 為什麼客戶流失難以對抗 8
1.2.3 有效的客戶指標:防止客戶流失的利器 11
1.3 本書為何與眾不同 13
1.3.1 實用且透徹 13
1.3.2 模擬案例研究 14
1.4 具有重複用戶互動性的產品 15
1.4.1 支付消費品的費用 16
1.4.2 B2B服務 16
1.4.3 客戶流失與媒體廣告 17
1.4.4 消費者訂閱 17
1.4.5 免費增值商業模式 18
1.4.6 App內購買模式 18
1.5 非訂閱服務的客戶流失場景 18
1.5.1 將“不活躍”看作“流失” 18
1.5.2 免費試用轉換 19
1.5.3 upsell和down sell 19
1.5.4 其他“是/否”客戶預測 19
1.5.5 用戶行為預測 20
1.5.6 其他與客戶流失不同的用例 20
1.6 消費者行為數據 20
1.6.1 常見客戶事件 20
1.6.2 最重要的事件 23
1.7 對抗客戶流失的案例分享 24
1.7.1 Klipfolio 24
1.7.2 Broadly 25
1.7.3 Versature 26
1.7.4 社交網路模擬 27
1.8 使用最佳客戶指標進行案例研究 27
1.8.1 利用率 28
1.8.2 成功率 30
1.8.3 單位成本 31
1.9 本章小結 34
第2章 測量流失率 35
2.1 定義流失率 38
2.1.1 計算流失率和留存率 39
2.1.2 流失率和留存率的關係 40
2.2 訂閱資料庫 40
2.3 基本的客戶流失計算:淨留存率 42
2.3.1 淨留存率計算 42
2.3.2 使用SQL計算淨留存率 44
2.3.3 解釋淨留存率 47
2.4 標準流失率計算:基於客戶數量的流失 49
2.4.1 標準流失率定義 49
2.4.2 用於計算流失率的外連線 50
2.4.3 使用SQL計算標準流失率 51
2.4.4 何時使用標準流失率 53
2.5 基於事件的非訂閱產品流失率 53
2.5.1 通過事件確定活躍客戶和流失客戶 54
2.5.2 使用SQL計算基於客戶活躍度的流失率 54
2.6 高階流失率:MRR流失率 56
2.6.1 MRR流失率的定義和計算 57
2.6.2 使用SQL計算MRR流失率 58
2.6.3 MRR流失率、客戶數流失率與淨流失率 60
2.7 流失率測量轉換 61
2.7.1 倖存者分析(高級) 61
2.7.2 流失率轉換 63
2.7.3 通過SQL對任意時間視窗內的流失率進行轉換 64
2.7.4 選擇流失率測量視窗 65
2.7.5 季節性和流失率 66
2.8 本章小結 67
第3章 客戶指標計量 69
3.1 從事件到指標 71
3.2 事件數據倉庫模式 72
3.3 統計某個時間段內的事件 74
3.4 指標周期定義的詳細信息 76
3.4.1 行為周期 76
3.4.2 用於指標測量的時間戳 77
3.5 在不同時間點測量 78
3.5.1 重疊測量視窗 78
3.5.2 時序指標測量 81
3.5.3 保存測量指標 81
3.5.4 保存模擬示例的指標 83
3.6 測量事件屬性的總數和平均值 84
3.7 指標質量保證 85
3.7.1 測量指標如何隨時間變化 85
3.7.2 QA案例研究 88
3.7.3 檢查指標覆蓋率 90
3.8 事件QA 92
3.8.1 檢查事件如何隨時間變化 92
3.8.2 檢查每個賬戶的事件 95
3.9 選擇行為測量的測量周期 97
3.10 測量賬戶使用期 99
3.10.1 賬戶使用期定義 99
3.10.2 賬戶使用期的遞歸CTE 101
3.10.3 賬戶使用期SQL程式 103
3.11 測量MRR和其他訂閱指標 106
3.11.1 計算MRR並作為指標 106
3.11.2 特定數量的訂閱 108
3.11.3 計算訂閱單元數量並作為指標 109
3.11.4 計算計費周期並作為指標 110
3.12 本章小結 112
第4章 觀察續訂與流失 115
4.1 數據集介紹 116
4.2 如何觀察客戶 117
4.2.1 提前進行觀察 117
4.2.2 觀察續訂和流失的順序 119
4.2.3 創建訂閱數據集 120
4.3 從訂閱中識別活躍期 121
4.3.1 活躍期 121
4.3.2 用於存儲活躍期的模式 122
4.3.3 尋找正在進行的活躍期 123
4.3.4 找到以客戶流失為結束的活躍期 124
4.4 識別非訂閱產品的活躍期 128
4.4.1 活躍期定義 128
4.4.2 從事件生成數據集的過程 129
4.4.3 用於計算活躍周的SQL 130
4.5 選擇觀察日期 132
4.5.1 平衡流失和非流失觀察 132
4.5.2 選擇觀察日期的算法 133
4.5.3 計算觀察日期的SQL程式 134
4.6 探索客戶流失數據集 137
4.7 導出當前客戶進行細分 141
4.7.1 選擇活躍賬戶和指標 141
4.7.2 通過指標來細分客戶 143
4.8 本章小結 143
第Ⅱ部分 動手實踐
第5章 通過指標理解客戶流失和
客戶行為 147
5.1 指標佇列分析 149
5.1.1 佇列分析背後的思想 150
5.1.2 使用Python進行佇列分析 152
5.1.3 產品使用佇列 155
5.1.4 賬戶使用期佇列 157
5.1.5 計費周期的佇列分析 159
5.1.6 最小佇列規模 160
5.1.7 顯著和不顯著的佇列差異 161
5.1.8 具有大量零客戶指標的指標佇列 162
5.1.9 因果關係:指標是否會導致客戶流失 163
5.2 總結客戶行為 164
5.2.1 了解指標的分布 164
5.2.2 用Python計算數據集匯總統計信息 166
5.2.3 篩選罕見指標 168
5.2.4 邀請業務人員共同保證數據質量 168
5.3 指標分數 169
5.3.1 指標分數背後的想法 169
5.3.2 指標分數算法 170
5.3.3 使用Python計算指標分數 171
5.3.4 使用評分指標進行佇列分析 173
5.3.5 MRR的佇列分析 175
5.4 刪除無效的觀察 176
5.4.1 從流失分析中刪除非付費客戶 177
5.4.2 在Python中根據指標閾值刪除觀察 178
5.4.3 從罕見指標分析中刪除零測量值 179
5.4.4 脫離行為:與流失率增加相關的指標 180
5.5 使用佇列分析細分客戶 182
5.5.1 細分過程 182
5.5.2 選擇細分標準 182
5.6 本章小結 183
第6章 客戶行為之間的關係 185
6.1 行為之間的相關性 186
6.1.1 “指標對”之間的相關性 186
6.1.2 使用Python計算相關性 190
6.1.3 使用相關性矩陣了解指標集之間的相關性 191
6.1.4 案例研究的相關性矩陣 193
6.1.5 在Python中計算相關性矩陣 194
6.2 對行為指標組計算平均值 196
6.2.1 為什麼要計算相關性指標分數的平均值 196
6.2.2 使用載荷矩陣(權重矩陣)計算平均分數 197
6.2.3 載荷矩陣的案例研究 198
6.2.4 在Python中套用載荷矩陣 200
6.2.5 基於指標組平均分數的流失佇列分析 202
6.3 發現相關性指標組 204
6.3.1 通過聚類對指標進行相關性分組 204
6.3.2 在Python中計算聚類相關性 206
6.3.3 將分數的平均值作為分數載荷矩陣的權重 211
6.3.4 運行指標分組及分組佇列分析列表 212
6.3.5 為聚類選擇相關性閾值 213
6.4 向業務人員解釋相關性指標組 215
6.5 本章小結 217
第7章 使用高級指標對客戶進行細分 219
7.1 比率指標 221
7.1.1 何時以及為什麼使用比率指標 221
7.1.2 如何計算比率指標 224
7.1.3 比率指標案例研究 229
7.1.4 模擬社交網路的其他比率指標 231
7.2 指標占比 232
7.2.1 計算指標占比 232
7.2.2 案例研究:帶有兩個指標的總指標百分比 235
7.2.3 帶有多個指標的總指標百分比案例研究 237
7.3 衡量變化的指標 238
7.3.1 衡量活躍水平的變化 238
7.3.2 具有極端異常值(肥尾)的指標分數 242
7.3.3 測量自上次活躍事件發生以來的時間 246
7.4 縮放指標時間段 249
7.4.1 將較長周期的指標轉換為較短的引用周期指標 250
7.4.2 估算新賬戶的指標 253
7.5 用戶指標 258
7.5.1 測量活躍用戶 258
7.5.2 活躍用戶指標 260
7.6 比率選擇 262
7.6.1 為什麼使用比率,還有什麼選擇 262
7.6.2 使用哪些比率 263
7.7 本章小結 264
第Ⅲ部分 特殊技巧與方法
第8章 預測客戶流失 269
8.1 通過模型預測流失 270
8.1.1 用模型進行機率預測 270
8.1.2 客戶參與和留存率 271
8.1.3 參與度和客戶行為 272
8.1.4 偏移量將觀察到的流失率與S曲線相匹配 274
8.1.5 邏輯回歸機率計算 275
8.2 審查數據準備 276
8.3 擬合客戶流失模型 279
8.3.1 邏輯回歸的結果 279
8.3.2 邏輯回歸代碼 281
8.3.3 解釋邏輯回歸結果 284
8.3.4 邏輯回歸案例分析 286
8.3.5 模型校準和歷史流失機率 288
8.4 預測客戶流失機率 289
8.4.1 準備當前客戶數據集以進行預測 289
8.4.2 準備當前客戶數據用於客戶細分 294
8.4.3 使用保存的模型進行預測 294
8.4.4 案例學習:預測 297
8.4.5 預測校準和預測漂移 298
8.5 流失預測的陷阱 300
8.5.1 相關性指標 300
8.5.2 異常值 302
8.6 客戶生命周期價值 306
8.6.1 CLV的含義 306
8.6.2 從客戶流失到預期客戶生命周期 308
8.6.3 CLV公式 309
8.7 本章小結 310
第9章 預測準確性和機器學習 313
9.1 衡量客戶流失預測的準確性 314
9.1.1 為什麼不使用標準準確度測量來衡量流失率 314
9.1.2 使用AUC衡量客戶流失預測的準確性 317
9.1.3 使用提升測量客戶流失預測的準確性 319
9.2 歷史準確性模擬:回測 323
9.2.1 什麼是回測以及為什麼進行回測 324
9.2.2 回測代碼 325
9.2.3 回測注意事項和陷阱 327
9.3 回歸控制參數 328
9.3.1 控制回歸權重的強度和數量 328
9.3.2 帶有控制參數的回歸 329
9.4 通過測試選擇回歸參數(交叉驗證) 331
9.4.1 交叉驗證 331
9.4.2 交叉驗證代碼 332
9.4.3 回歸交叉驗證案例研究 336
9.5 使用機器學習預測客戶流失風險 336
9.5.1 XGBoost學習模型 337
9.5.2 XGBoost 交叉驗證 338
9.5.3 比較XGBoost與回歸的準確度 341
9.5.4 高級指標和基本指標的比較 342
9.6 利用機器學習預測對客戶進行細分 344
9.7 本章小結 346
第10章 客戶流失的人口統計特徵和企業統計特徵 347
10.1 人口統計和企業統計數據集 348
10.1.1 人口統計學和企業統計數據的類型 348
10.1.2 社交網路模擬的賬戶數據模型 349
10.1.3 人口統計數據集的SQL 350
10.2 具有人口統計和企業統計類別的流失佇列 353
10.2.1 人口統計類別的流失率佇列 353
10.2.2 流失率置信區間 354
10.2.3 將人口統計佇列與置信區間進行比較 355
10.3 對人口統計類別進行分組 361
10.3.1 用映射字典表示分組 361
10.3.2 分組類別的佇列分析 362
10.3.3 設計類別分組 364
10.4 基於日期和數字的人口統計數據的流失分析 366
10.5 利用人口統計數據進行流失率預測 367
10.5.1 將文本欄位轉換為虛擬變數 367
10.5.2 僅用分類虛擬變數預測流失率 370
10.5.3 將虛擬變數與數值數據相結合 372
10.5.4 結合人口統計數據和指標以預測客戶流失 375
10.6 使用人口統計數據細分當前客戶 378
10.7 本章小結 383
第11章 對抗客戶流失 385
11.1 計畫你自己的對抗客戶流失策略 385
11.1.1 數據處理和分析代碼清單 387
11.1.2 用於與業務人員溝通的檢查清單 389
11.2 使用你自己的數據運行本書的代碼清單 391
11.2.1 將數據載入到本書的數據schema中 391
11.2.2 在你自己的數據上運行程式 392
11.3 將本書的程式移植到不同的環境中 393
11.3.1 移植SQL程式 393
11.3.2 移植Python程式 393
11.4 了解更多並保持聯絡 394
11.4.1 作者的部落格網站和社交媒體 394
11.4.2 客戶流失基準信息的來源 394
11.4.3 有關客戶流失的其他信息來源 395
11.4.4 幫助減少客戶流失的產品 395
11.5 本章小結 395

作者簡介

Carl Gold是Zuora,Inc.的首席數據科學家。Zuora是一個綜合訂閱管理平台和新上市的矽谷獨角獸公司,在全球擁有1000多家客戶。Zuora的客戶來自眾多行業,包括軟體(軟體即服務,SaaS)、媒體、旅遊服務、消費包裝商品、雲服務、物聯網(Internet of Things,IoT)和電信運營商。Zuora在訂閱和經常性收入方面是公認的領導者。Carl於2015年加入Zuora,擔任首席數據科學家,並為Zuora的客戶分析產品Zuora Insights開發了預測分析系統。

相關詞條

熱門詞條

聯絡我們