《數據分析咖哥十話從思維到實踐促進運營增長》是2022年人民郵電出版社出版的圖書,作者是黃佳。
基本介紹
- 中文名:數據分析咖哥十話從思維到實踐促進運營增長
- 作者:黃佳
- 出版時間:2022年8月
- 出版社:人民郵電出版社
- ISBN:9787115583895
- 類別:圖書>計算機/網路>資料庫>資料庫理論
- 開本:128 開
- 裝幀:平裝-膠訂
內容簡介,圖書目錄,作者簡介,
內容簡介
本書以案例的形式,介紹從思維模型分析到場景實踐的數據分析方法。全書圍繞“數據分析”與“運營增長”兩大關鍵要素,在系統介紹數據分析思維、數據分析方法、數據採集技能、數據清洗技能等基礎知識的同時,以問題為導向,解讀運營與增長的關鍵性業務內容,在獲客、激活、留存、變現、自傳播循環等各個核心運營環節展開數據分析實戰。
本書提供案例相關數據集與源碼包,適合數據分析、產品運營、市場行銷等行業有數據分析具體業務需求的人士閱讀,也適合相關專業的師生閱讀。
圖書目錄
引子 小雪求職記
基礎篇 數據分析師的錦囊
一、欲善其事先利器:數據分析技能進階圖譜
二、深入業務尋價值:價值源於深度理解場景
三、積跬步以察千里:數據的採集與治理
四、瀝盡狂沙方見金:數據的清洗與可視化
五、營運之道無定法:數據分析的核心方法
六、增長踐行成於思:數據分析的關鍵思維
實踐篇 數據運營分析十話
卷一 獲客
話 橫看成嶺側成峰:用戶畫像揭示秘密
1.1 問題:這款推廣海報好不好
1.2 概念:用戶畫像
1.3 工具: Python 數據分析編程基礎
1.3.1 Python 的極簡說明
1.3.2 Python 中的序列數據類型
1.3.3 數學計算工具包 NumPy
1.3.4 數據處理工具包 Pandas
1.3.5 數據可視化工具包 Matplotlib和Seaborn
1.4 實戰:哪一類人才是真正的買家
1.4.1 數據讀入及簡單分析
1.4.2 用戶整體畫像
1.4.3 購買眼影盤用戶的畫像
1.5 結論
第二話 遠近高低各不同:聚類實現RFM細分
2.1 問題:如何通過細分用戶指導運營
2.2 概念:用戶細分
2.2.1 用戶畫像是了解用戶的步
2.2.2 用用戶行為數據指導精細化運營
2.2.3 進行同期群分析揭示獲客時的秘密
2.2.4 根據特徵和價值進行用戶分組
2.3 工具:RFM分析和聚類算法
2.3.1 RFM 分析
2.3.2 聚類算法
2.4 實戰:基於RFM模型的用戶細分
2.4.1 整體思路
2.4.2 數據讀入和可視化
2.4.3 根據R值為用戶新近度分層
2.4.4 根據F值為用戶消費頻率分層
2.4.5 根據M值為用戶消費金額分層
2.4.6 匯總 3 個維度,確定用戶價值分層
2.5 結論
2.6 彩蛋:看看誰是有價值的用戶
第三話 獲客成本何其高:回歸預測用戶LTV
3.1 問題:我能從用戶身上賺多少錢
3.2 概念:用戶生命周期價值
3.3 工具:回歸分析
3.3.1 機器學習中的回歸分析
3.3.2 訓練集、驗證集和測試集
3.3.3 如何將預測的損失小化
3.4 實戰:預測電商用戶的生命周期價值
3.4.1 整體思路
3.4.2 數據讀入和數據清洗
3.4.3 構建機器學習數據集
3.4.4 預測未來一年的LTV
3.5 結論
3.6 彩蛋:還有哪些機器學習算法
卷二 激活
第四話 百川爭流終歸海:動態歸因最佳化渠道
4.1 問題:哪個渠道給力
4.2 概念:渠道分析和歸因模型
4.2.1 渠道和渠道分析
4.2.2 歸因和歸因模型
4.3 工具:馬爾可夫鏈歸因模型
4.3.1 記錄推廣路徑
4.3.2 顯示用戶旅程
4.3.3 統計狀態間的轉換機率
4.3.4 計算整體激活率
4.3.5 計算移除效應係數
4.4 實戰:通過馬爾可夫鏈模型來計算渠道價值
4.4.1 整體思路
4.4.2 構建每一個用戶的旅程
4.4.3 根據狀態構建通道字典
4.4.4 計算狀態間的轉換機率
4.4.5 計算渠道移除效應係數
4.5 結論
4.6 彩蛋 :夏普利值歸因
第五話 行銷貴在激活時:漏斗模型聚焦轉化
5.1 問題:促銷活動中的哪個環節需最佳化
5.2 概念:漏斗和轉化率
5.3 工具:Plotly 包中的漏斗圖
5.4 實戰:通過漏斗分析看促銷效果
5.4.1 整體思路
5.4.2 數據導入
5.4.3 基本漏斗圖
5.4.4 細分漏斗圖
5.5 結論
卷三 留存
第六話 溫故知新惜舊客:通過行為分析提升留存
6.1 問題:如何留住江里撈的老用戶
6.2 概念:留存與流失
6.2.1 老用戶的留存至關重要
6.2.2 流失率的定義與流失原因
6.2.3 數據驅動下的用戶管理
6.3 工具:生存分析工具包和邏輯回歸算法
6.3.1 用生命線庫進行留存分析
6.3.2 用邏輯回歸算法預測用戶流失
6.4 實戰:分析用戶的留存和流失
6.4.1 整體思路
6.4.2 數據導入和數據清洗
6.4.3 使用Kaplan-Meier 生存模型輸出留存曲線
6.4.4 通過留存曲線比較各因子對流失率的影響
6.4.5 使用 Cox 危害係數模型分析流失影響因子
6.4.6 通過機器學習方法預測用戶流失率
6.5 結論
第七話 千呼萬喚求爆款:從內容分析發現價值
7.1 問題:什麼樣的視頻會成為爆款
7.2 概念:產品分析
7.2.1 產品分析和拼多多的案例
7.2.2 產品熱度的時間序列曲線
7.2.3 產品銷售的總量和增速矩陣
7.2.4 與內容相關的典型流量指標
7.3 工具:自然語言處理
7.3.1 自然語言處理中的基本概念
7.3.2 自然語言工具包NLTK
7.4 實戰:某網站視頻流量、熱度和情感屬性分析
7.4.1 整體思路
7.4.2 導入數據
7.4.3 瀏覽量高的視頻類型
7.4.4 熱度持續趨勢分析
7.4.5 視頻情感屬性分析
7.5 結論
7.6 彩蛋:深度學習和循環神經網路RNN
卷四 變現
第八話 勸君更盡一杯酒:通過推薦系統找到好物
8.1 問題:如何從零搭建推薦系統
8.2 概念:相關性與推薦系統
8.2.1 關聯規則
8.2.2 相關性的度量指標:相關係數
8.2.3 推薦系統及其所解決的問題
8.3 工具:協同過濾算法
8.3.1 基於用戶的協同過濾算法
8.3.2 基於商品的協同過濾算法
8.3.3 構建共現矩陣
8.3.4 相似性的確定
8.4 實戰:簡單的遊戲推薦系統實現
8.4.1 整體思路
8.4.2 導入數據
8.4.3 構建用戶/遊戲相關矩陣
8.4.4 基於玩家相似度的協同過濾系統
8.4.5 構建相似度矩陣
8.4.6 找到推薦列表
8.4.7 基於遊戲相似度的協同過濾系統
8.5 結論
第九話 君向瀟湘我向秦:用A/B測試助力促銷
9.1 問題:兩個頁面,哪個更好
9.2 概念:A/B測試
9.2.1 確認實驗目標
9.2.2 設計實驗
9.2.3 實驗上線與監控
9.2.4 結果復盤
9.3 工具:統計學知識
9.3.1 對照實驗
9.3.2 假設檢驗
9.3.3 樣本的數量
9.4 實戰:通過A/B測試找到頁面
9.4.1 整體思路
9.4.2 數據導入與數據可視化
9.4.3 查看轉化率的增量
9.4.4 檢驗測試結果的統計學意義
9.4.5 細分樣本後重新檢驗
9.5 結論
卷五 自傳播循環
第十話 一二三生千萬物:裂變驅動增長循環
10.1 問題:哪種裂變方案更有效
10.2 概念:增長黑客和裂變
10.2.1 增長黑客的本質
10.2.2 各種各樣的裂變
10.3 工具:增長模型
10.4 實戰:用增長實驗確定折扣方案
10.4.1 整體思路
10.4.2 數據導入及數據可視化
10.4.3 比較兩種裂變方案帶來的轉化率增量
10.4.4 用XGBoost判斷特定用戶的分類機率
10.4.5 比較兩種裂變帶來的轉化增量
10.5 結論
寄語
作者簡介
黃佳,筆名:咖哥,人工智慧研究員,終身學習者。在IT界耕耘二十載,曾撰寫《SAP程式設計》和《零基礎學機器學習》等書。近期參與的項目:使用機器學習和數據分析技術精準定位客戶群體、食品質譜數據中有效成分的分析與鑑定、醫學視覺圖像數據分析、針對青少年壓力問題的聊天對話機器人的自然語言處理等。在科研和學習過程中每有收穫,便記錄好每一個從不懂到懂的過程和細節,期待著與大家分享。