基本介紹
- 書名:洞見數據價值:大數據挖掘要案紀實
- 作者:畢馬威中國大數據團隊
- 出版社:清華大學出版社
- 出版時間:2018年2月
- 定價:69 元
- ISBN:9787302491804
內容簡介,圖書目錄,
內容簡介
《洞見數據價值:大數據挖掘要案紀實》是國際知名諮詢公司畢馬威的大數據團隊的集大成之作,內容豐富,觀點新穎,貼近大眾生活、工作與學習實際場景,內容不拘泥於技術闡釋,通過寓教於樂的方式,以豐富翔實的案例來解析大數據挖掘,儘量通過常見的場景來闡述數據的價值與意義。
第1章介紹大數據在銀行業、徵信業、審計、傳統製造業、網際網路行業、輿情監控、影視業、環保產業以及體育產業等多個領域的套用方案和前景。第2章重點介紹大數據分析在商業工作和行銷推廣中的作用。第3章介紹大數據挖掘過程中涉及的數據的前期準備工作,重點介紹數據準備工作的要點和訣竅。第4章結合業務、生活、娛樂,寓教於樂,介紹大數據的實際套用方式。附錄部分介紹一位數據工作者的成長之路,向感興趣的讀者介紹從事數據工作應該具備的素質和掌握的技能。
《洞見數據價值:大數據挖掘要案紀實》可作為企業管理人員、行銷主管、分析人員、IT 人員等理解大數據、套用大數據為企業創造價值的指引,同時,《洞見數據價值:大數據挖掘要案紀實》也可供統計學、套用數學及計算機專業學者和研究人員參考學習。
圖書目錄
第1章 大數據在各行各業 // 001
1.1 什麼是大數據? // 002
1.1.1 非常流行的大數據概念 // 002
1.1.2 不那么流行的大數據概念 // 006
1.1.3 也許會帶給你靈感的大數據概念 // 007
1.2 大數據在銀行業 // 029
1.2.1 業界展望:大數據,銀行業未來的核心動力 // 029
1.2.2 創新方向:大數據助力銀行網點實現轉型 // 036
1.3 大數據在徵信業 // 041
1.3.1 業界展望:FICO 評分與芝麻信用,傳統徵信向大數據徵信的轉變 // 042
1.3.2 創新方向一:從拒絕推斷看個人徵信業的大有可為 // 046
1.3.3 創新方向二:論大中型客戶數位化授信的可行性 // 054
1.4 大數據在審計業 // 057
1.4.1 業界展望:大數據分析如何支撐審計工作 // 057
1.4.2 創新方向:大數據能否代替傳統審計? // 061
1.5 大數據在傳統製造業 // 065
業界展望:數位化企業進階指南 // 066
1.6 大數據在網際網路行業 // 069
創新方向:從滴滴收購優步看壟斷企業的馬太效應 // 069
1.7 大數據在輿情行業 // 076
創新方向:數據分析幫你掌握話語權 // 077
1.8 大數據在汽車行業 // 086
業界展望:征服汽車後市場,大數據與你同行 // 086
1.9 大數據在影視業 // 089
創新方向:星期几上映的電影最具有票房號召力? // 090
1.10 大數據在環保產業 // 098
創新方向:北京治霾,能為你做點什麼? // 098
1.11 大數據在體育產業 // 104
創新方向:歐洲杯,跟著西班牙隊學數據挖掘! // 105
小結 // 109
第2章 大數據在商業領域的套用 // 111
2.1 推薦算法在傳統銷售渠道中的套用模式 // 112
2.2 巧用運籌最佳化,提升整合行銷管理水平 // 116
2.3 關聯規則的套用 // 121
2.3.1 小談關聯規則 // 121
2.3.2 購物籃分析:絕不只是“啤酒與尿布” // 124
2.3.3 創新方向:靠關聯規則重獲新生的東北小館 // 128
2.4 智慧型薦食模型:大數據告訴你今天吃什麼 // 133
智慧型薦食模型 // 134
2.5 顧客時空模型:其實天下沒有免費的 WiFi // 138
2.5.1 無處不在的免費 WiFi // 138
2.5.2 顧客時空模型 // 139
2.5.3 進一步挖掘 // 141
2.6 社會網路分析法,助力信貸反欺詐 // 142
2.7 數據可視化利器:SAS Visual Analytics // 145
2.7.1 為什麼需要數據可視化? // 145
2.7.2 數據可視化的幾個常見例子 // 146
2.8 文本挖掘,幫你識別網購評論是真是假 // 151
2.9 路徑最佳化:如何改良快遞送貨路線? // 156
第3章 數據前期準備 // 171
3.1 從抗日武裝的發展談到數據治理 // 172
3.1.1 數據質量問題 // 173
3.1.2 數據套用問題 // 174
3.1.3 實施策略和路徑問題 // 176
3.2 如何生成你需要的基礎數據? // 182
3.3 如何利用數據倉庫最佳化數據分析? // 189
3.4 二分類變數的數據缺失插補 // 193
3.5 數據離散化,如何避免丟失信息? // 201
3.6 如何避免數據離散化影響自變數的重要性? // 204
3.7 二分類模型中如何應對分類自變數取值過多? // 206
第4章 技術案例 // 211
4.1 建模變數太多怎么辦? // 212
4.2 信用評級模型怎么評估? // 215
4.3 觀察視窗怎么選? // 219
4.4 K折交叉驗證怎么做? // 223
4.5 如何衡量變數之間的相關性? // 230
4.6 決策樹算法真的越複雜越好嗎? // 235
4.7 如何精選分類模型指標? // 245
4.8 當數據分析遇上超級奶爸 // 250
4.9 深度挖掘,你的工資拖後腿了嗎? // 253
4.10 用分位數回歸看你的工資水平 // 258
附錄A 一位數據工作者的成長之路 // 265
A.1 數據分析師入門攻略 // 266
A.2 如何做一名“稱職”的數據專家? // 269
A.3 一個數據倉庫轉型者眼中的數據挖掘 // 271
A.4 預測科學:三點經驗談實際套用 // 276
A.5 數據模型多了,應該怎么管? // 277
A.6 手握數據挖掘模型,你一定要知道怎么用 // 281
A.7 淺談以史為鑑與數據分析 // 286
後記 // 297