商業策略數據分析

商業策略數據分析

《商業策略數據分析》是電子工業出版社於2023年出版的書籍,作者是CDA 數據科學研究院。

基本介紹

  • 書名:商業策略數據分析
  • 作者:CDA 數據科學研究院
  • 出版社:電子工業出版社
  • 出版時間:2023年2月
  • 頁數:468 頁
  • 定價:119.0 元
  • 開本:16 開
  • 裝幀:平裝
  • ISBN:9787121449451
  • 正文字數:570000 字
內容簡介,作者簡介,圖書目錄,

內容簡介

本書作為 CDA LEVEL Ⅱ考試教材,打破傳統的知識整合模式,從 EDIT(探索、診斷、指導和工具)數位化工作模型的角度進行講解,在介紹知識概念的同時,還講解了在進行商業策略數據分析時應遵循的整體思維和思考方式,以達到業務巨觀分析與用戶微觀洞察相結合、使用科學的方式進行數據分析的教學目標。

作者簡介

CDA數據科學研究院簡介2013年,大數據行業方興未艾,CDA數據科學研究院孕育而生,是國內率先成立的專注於數據科學領域的專業研究團隊。CDA數據科學研究院匯集數據行業專家,團隊具有專業的學術素養、精湛的研究水平、紮實的企業實戰經驗,豐富的行業資源,通過對各類企業、社會組織等進行全面、系統、深入的調查和訪問,從而獲得緊跟技術發展的經驗與數據,並結合數據行業的未來發展方向進行系統的研究,不斷研發新的知識體系和技術套用。

圖書目錄

第1 章 EDIT 模型概述. 1
1.1 探索階段 4
1.2 診斷階段 5
1.3 指導階段 8
1.4 工具支持 9
1.5 本章練習題 10
第2 章 數據處理 12
2.1 使用pandas 讀取結構化數據 .13
2.1.1 讀取數據 .14
2.1.2 寫出數據 .17
2.2 數據整合 17
2.2.1 行、列操作 .17
2.2.2 條件查詢 .21
2.2.3 橫向連線 .24
2.2.4 縱向合併 .27
2.2.5 排序 .30
2.2.6 分組匯總 .31
2.2.7 拆分列 .35
2.2.8 賦值與條件賦值 .36
2.3 數據清洗 39
2.3.1 重複值處理 .39
2.3.2 缺失值處理 .40
2.4 本章練習題 43
第3 章 指標體系與數據可視化. 45
3.1 Python 可視化 45
3.1.1 Matplotlib 繪圖庫 .45
3.1.2 Seaborn 繪圖庫.54
3.2 描述性統計分析與繪圖 60
3.2.1 描述性統計進行數據探索 .60
3.2.2 製作報表與統計製圖 .69
3.2.3 製圖的步驟 .76
3.3 指標體系 81
3.3.1 建立指標標準 .82
3.3.2 什麼是指標體系 .83
3.3.3 構建指標體系的意義 .85
3.3.4 構建指標庫 .86
3.3.5 搭建管理分析視圖和指標套用模式 .89
3.4 本章練習題 90
第4 章 數據採集與數據預處理. 92
4.1 數據採集方法 92
4.1.1 市場研究中的數據 .92
4.1.2 機率抽樣方法 .93
4.1.3 非機率抽樣方法 .99
4.1.4 機率抽樣和非機率抽樣的比較 .101
4.2 市場調研和數據錄入 101
4.2.1 市場調研流程 .101
4.2.2 市場調研目標設定 .102
4.2.3 市場調研前的準備工作 .102
4.2.4 實施調研 .109
4.3 數據預處理基礎 110
4.3.1 數據預處理基本步驟 .110
4.3.2 錯誤數據識別與處理 .111
4.3.3 連續型變數離群值識別與處理 .116
4.3.4 分類型變數概化處理 .117
4.3.5 缺失值處理 .118
4.3.6 連續型變數分布形態轉換 .122
4.3.7 連續型變數中心標準化或歸一化 .122
4.3.8 變數降維 .123
4.3.9 WoE 轉換 124
4.4 本章練習題 125
第5 章 巨觀業務分析方法 129
5.1 矩陣分析法 129
5.2 連續型變數降維 134
5.2.1 方法概述 .135
5.2.2 變數篩選 .136
5.2.3 維度歸約 .136
5.3 主成分分析法 137
5.3.1 主成分分析簡介 .137
5.3.2 主成分分析原理 .138
5.3.3 主成分分析的運用 .141
5.3.4 實戰案例:在Python 中實現主成分分析 .142
5.3.5 基於主成分的冗餘變數篩選 .145
5.4 因子分析 146
5.4.1 因子分析模型 .146
5.4.2 因子分析算法 .148
5.4.3 實戰案例:在Python 中實現因子分析 .151
5.5 多維尺度分析 155
5.6 本章練習題 159
第6 章 用戶標籤體系與用戶畫像 165
6.1 標籤體系的整體框架 167
6.2 標籤的分類 168
6.2.1 從研究客體的數據類型角度分類 .168
6.2.2 從標籤的時態角度分類 .170
6.2.3 從標籤的加工角度分類 .171
6.2.4 業務指標與用戶標籤的關係 .175
6.3 用戶畫像 181
6.3.1 細分市場與STP 模型 182
6.3.2 快速入手用戶畫像 .182
6.3.3 用戶分群的發展歷程 .185
6.3.4 用戶的決策進程 .186
6.3.5 馬斯洛需求理論 .187
6.3.6 用戶消費的成本與收益 .187
6.3.7 用戶細分的方法 .188
6.3.8 基於用戶分群的精準行銷 .190
6.3.9 標籤與數據科學的過程 .191
6.4 實戰案例:用Python 實現用戶畫像 .192
6.4.1 使用Python 進行用戶畫像的基礎知識 .192
6.4.2 用戶畫像在診斷階段中的套用 .192
6.4.3 樣本數據集介紹 .193
6.4.4 使用SQL 語句進行數據處理 .195
6.4.5 使用Python 進行用戶畫像 .198
6.5 本章練習題 202
第7 章 使用統計學方法進行變數有效性測試 205
7.1 假設檢驗 205
7.1.1 假設檢驗的基本概念 .206
7.1.2 假設檢驗中的兩類錯誤 .207
7.1.3 假設檢驗與區間估計的聯繫 .209
7.1.4 假設檢驗的基本步驟 .209
7.1.5 配對樣本t 檢驗211
7.2 方差分析 211
7.2.1 單因素方差分析 .212
7.2.2 多因素方差分析 .217
7.3 列聯表分析與卡方檢驗 220
7.3.1 列聯表 .220
7.3.2 卡方檢驗 .222
7.4 線性回歸 224
7.4.1 簡單線性回歸 .225
7.4.2 多元線性回歸 .227
7.4.3 多元線性回歸的變數篩選 .236
7.4.4 線性回歸模型的經典假設 .239
7.4.5 建立線性回歸模型的基本步驟 .248
7.5 Logistic 回歸 249
7.5.1 邏輯回歸的相關關係分析 .252
7.5.2 邏輯回歸模型及實現 .253
7.5.3 邏輯回歸的極大似然估計 .264
7.5.4 模型評估 .266
7.5.5 因果推斷模型 .274
7.6 本章練習題 278
第8 章 使用時間序列分析方法做預報. 294
8.1 認識時間序列 294
8.2 效應分解法 295
8.2.1 時間序列的效應分解 .296
8.2.2 時間序列3 種效應的組合方式 .296
8.3 平穩時間序列分析ARMA 模型 297
8.3.1 平穩時間序列 .297
8.3.2 ARMA 模型 298
8.3.3 在Python 中進行AR 建模 304
8.4 非平穩時間序列分析ARIMA 模型 .310
8.4.1 差分與ARIMA 模型 .310
8.4.2 在Python 中進行ARIMA 建模 313
8.5 ARIMA 建模方法總結 322
8.6 本章練習題 323
第9 章 用戶分群方法 327
9.1 用戶細分與聚類 327
9.1.1 用戶細分的重要意義 .327
9.1.2 用戶細分的不同商業主題 .328
9.2 聚類分析的基本概念 335
9.3 聚類模型的評估 336
9.3.1 輪廓係數 .336
9.3.2 平方根標準誤差 .337
9.3.3 R2 .337
9.3.4 ARI 338
9.4 層次聚類 338
9.4.1 層次聚類的算法描述 .338
9.4.2 層次聚類分群數量的確定 .342
9.4.3 層次聚類套用案例 .343
9.4.4 層次聚類的特點 .347
9.5 K-means 聚類算法 .347
9.5.1 K-means 聚類算法描述 .347
9.5.2 K-means 聚類算法的套用:用戶細分 .348
9.6 聚類事後分析:決策樹套用 356
9.6.1 決策樹的基本概念 .356
9.6.2 決策樹解讀用戶分群後的特徵 .357
9.7 本章練習題 359
第10 章 業務流程分析與流程最佳化 364
10.1 價值流程圖 364
10.2 對比測試 366
10.2.1 轉換漏斗 .366
10.2.2 對比測試 .367
10.3 本章練習題 371
第11 章 運籌最佳化模型 373
11.1 線性規劃 373
11.2 整數規劃 380
11.3 二次規劃 386
11.4 本章練習題 .390
第12 章 數據治理 393
12.1 數據治理的驅動因素 393
12.2 數據治理體系 394
12.2.1 數據治理域 .395
12.2.2 數據管理域 .397
12.2.3 數據套用域 .401
12.3 如何開展數據治理 404
12.3.1 準確的定位數據治理 .404
12.3.2 明確數據套用方向 .405
12.3.3 多層級全方位進行治理 .406
12.4 本章練習題 406
第13 章 數據模型管理 408
13.1 數據分類 408
13.2 數據建模 411
13.2.1 數據架構的基本概念 .411
13.2.2 數據模型介紹 .413
13.2.3 數據建模基礎 .413
13.2.4 主題域分類 .414
13.2.5 概念模型 .414
13.2.6 邏輯模型 .415
13.2.7 物理模型 .416
13.3 數據建模案例 416
13.4 數據倉庫體系和ETL 419
13.5 本章練習題 423
第14 章 智慧型對話分析與預測 426
14.1 導入數據 430
14.2 數據探索 430
14.2.1 缺失值 .430
14.2.2 重複值 .431
14.2.3 異常值 .431
14.2.4 相關分析 .432
14.3 可視化展示 434
14.3.1 多變數圖 .434
14.3.2 回歸擬合圖 .434
14.3.3 聯合分布圖 .436
14.4 邏輯回歸模型 436
14.4.1 劃分數據集 .436
14.4.2 初步建模 .437
14.4.3 模型最佳化 .438
14.4.4 模型預測與評估 .439

相關詞條

熱門詞條

聯絡我們