增強型分析:AI驅動的數據分析、業務決策與案例實踐

增強型分析:AI驅動的數據分析、業務決策與案例實踐

《增強型分析:AI驅動的數據分析、業務決策與案例實踐》是2019年機械工業出版社出版的圖書,作者是彭鴻濤、張宗耀、聶磊。

基本介紹

  • 書名:增強型分析:AI驅動的數據分析、業務決策與案例實踐
  • 作者:彭鴻濤、張宗耀、聶磊
  • 出版社:機械工業出版社
  • ISBN:9787111634164
內容簡介,圖書目錄,

內容簡介

增強型分析是數據科學的未來,本書講解了如何通過前沿的大數據技術和AI技術實現智慧型的數據分析和業務決策,即增強型分析。
本書的三位作者是來自德勤、前華為和前IBM的資深數據科學家,在大數據和AI領域至少都有10年以上的工作經驗,他們將各自多年來在“構建數據挖掘模型,解決實際業務問題”方面積累的經驗全部總結在了這本書中。
全書的內容由兩條主線貫穿:
技術主線:一方面講解了預測模型、序列分析、預測分析、Prescriptive分析等前沿數據處理技術,一方面講解了CNN、RNN和GNN等前沿的AI技術如何為數據分析賦能。
業務主線:在數位化轉型的大時代背景下,如何通過數據分析實現智慧行銷、智慧風險管控,實現由初級的“主動行銷”到“被動行銷”,再到“全渠道協同行銷”等行銷手段的升級套用。
本書的重點聚焦在本質內容上,即數據處理、算法及模型、“模型洞見到業務決策”的分析等。
全書共8章:
第1章:作者結合自己的從業經驗介紹了數據科學家的職業生涯發展、工作模式和工作方法要點等內容,為有志成為數據科學家的讀者指明了道路和方向;
第2章:從描述性分析的角度講解了數據探索、數據預處理衍生指標加工方面的技巧;
第3章:介紹了預測類模型構建時的新方法、新思路、新工具;
第4章:講解了序列分析的相關內容,包括序列模式、序列規則、序列預測等的挖掘與套用,用實例的方式說明了算法的原理、特點和使用技巧;
第5章:介紹了人工智慧下一個階段的重點領域,即如何套用數據分析做出優決策;
第6~8章:通過與傳統模型的對比,介紹了CNN、RNN、GNN等算法的原理,通過大量的實例說明了這些AI技術在數據分析與決策領域的用法和實際效果。

圖書目錄

推薦序一
推薦序二
前言
第1章 數據科學家的成長之路 1
1.1 算法與數據科學家 1
1.1.1 數據科學、人工智慧、機器學習等 2
1.1.2 室內活動還是室外活動 3
1.2 數據科學家不斷成長的幾個階段 3
1.2.1 算法——如何構建數據分析模型 5
1.2.2 用法——如何回頭看模型 6
1.2.3 業務——如何產生更大價值 7
1.2.4 戰略——如何更廣 8
1.3 數據科學家的工作模式與組織結構 9
1.3.1 數據驅動還是業務驅動 9
1.3.2 數據科學家團隊的組織結構 9
1.4 數據科學家的工作方法要點 10
第2章 大數據探索及預處理 13
2.1 大數據探索 13
2.1.1 數值類型 13
2.1.2 連續型數據的探索 14
2.1.3 分類型數據的探索 19
2.1.4 示例:數據探索 20
2.2 數據預處理 26
2.2.1 數據清洗 26
2.2.2 數據變換 29
2.2.3 數據歸約 41
2.3 衍生指標的加工 44
2.3.1 衍生指標概述 45
2.3.2 將數值轉化為百分位數 45
2.3.3 把類別變數替換為數值 46
2.3.4 多變數組合 47
2.3.5 從時間序列中提取特徵 47
第3章 預測模型的新技術 49
3.1 集成學習 49
3.1.1 Averaging方法 49
3.1.2 Boosting方法 51
3.2 Gradient Tree Boosting介紹 53
3.2.1 梯度與梯度下降 53
3.2.2 Gradient Tree Boosting算法的原理 55
3.3 Gradient Tree Boosting的改進方向 57
3.3.1 Gradient Tree Boosting的使用要點 57
3.3.2 Regularization 59
3.3.3 XGBoost介紹 60
3.4 模型的最佳參數設定 60
3.5 投票決定最終預測結果 65
3.6 讓模型在訓練結束後還能被更新 66
3.6.1 熱啟動 67
3.6.2 增量學習 67
3.7 多輸出預測 68
3.7.1 Binary Relevance 69
3.7.2 Classifier Chain 70
3.7.3 Ensemble Classifier Chain 70
3.8 案例:如何給客戶從數百個產品中尋找合適的產品 71
3.8.1 問題提出 72
3.8.2 建模思路 72
3.8.3 模型訓練及套用 73
第4章 序列分析 76
4.1 通過客戶行為研究做出服務策略 76
4.2 頻繁項集、關聯規則的挖掘 77
4.2.1 基本概念 77
4.2.2 頻繁或稀疏項集的挖掘 78
4.2.3 關聯規則的挖掘 86
4.3 序列模式的挖掘以及套用 88
4.3.1 換種視角觀察項間的順序 88
4.3.2 “事無巨細”還是“事有巨細” 89
4.3.3 序列挖掘的相關算法介紹 92
4.3.4 示例:挖掘購買物品的序列模式 96
4.4 序列規則的挖掘以及套用 101
4.4.1 將頻繁序列通過業務解讀轉換為行動指南 101
4.4.2 序列規則的挖掘實現行動指南 102
4.4.3 序列規則的挖掘算法 102
4.4.4 示例:通過客戶購買產品的序列推薦合適的產品 104
4.5 序列預測的挖掘以及套用 107
4.5.1 序列規則與序列預測的關係 107
4.5.2 序列預測算法的介紹 108
4.5.3 示例:客戶下一步會做什麼 110
第5章 套用數據分析做出最優決策 114
5.1 Prescriptive分析概述 114
5.1.1 業務分析的3個層次 115
5.1.2 為什麼需要Prescriptive分析 116
5.1.3 什麼時候需要Prescriptive分析 117
5.2 確定因素和非確定因素下的決策分析 118
5.3 What-If分析和Goal Seeking分析 121
5.4 最佳化技術介紹 122
5.4.1 數據挖掘算法中常用的最佳化技術 122
5.4.2 最佳化問題求解工具介紹 127
5.4.3 CVXPY最佳化工具在機器學習算法中的套用 130
5.4.4 套用最佳化技術尋找最優產品推薦 134
5.5 仿真分析 135
5.5.1 蒙特卡洛的介紹 135
5.5.2 採用蒙特卡洛方法進行重採樣 137
5.6 馬爾可夫鏈及馬爾可夫決策過程 143
5.6.1 馬爾可夫過程及馬爾可夫鏈 145
5.6.2 馬爾可夫決策過程及套用工具 148
5.6.3 套用馬爾可夫決策過程研究行銷策略及客戶生命周期價值 151
第6章 深入探討CNN 155
6.1 換個角度討論CNN 155
6.1.1 卷積是在做什麼 156
6.1.2 人臉檢測與人臉識別 159
6.1.3 深度學習意味著什麼 165
......

相關詞條

熱門詞條

聯絡我們