內容簡介
大數據與金融企業之間的關係可以用“勢在必行”、“得天獨厚”來形容。金融企業內部積累了豐富的用戶數據和交易數據,是企業數據資產構成的核心內容;
大數據技術的出現使企業可用的數據資產得到極大的擴展。本書分為三篇,分別從金融企業的
大數據戰略規劃、場景實例以及常見問題與應對機制三個方面對金融企業在大數據時代面臨的機遇與挑戰做了深刻的分析,並給出了具體的實踐思路。
《金融大數據》提出了
金融四大要素人、資金、交易和環境之間在網際網路時代的笛卡爾乘積關係的重要觀點,並以此作為大數據思維的重要出發點來指導金融企業的轉型之路。
《金融大數據》適合大數據、金融領域的相關從業者閱讀,同時也是相關企業管理人員釐清思路、洞察數據和金融本質的一本不可多得的參考著作。
內容提要
大數據與金融企業之間的關係可以用“勢在必行”、“得天獨厚”來形容。金融企業內部積累了豐富的用戶數據和交易數據,是企業數據資產構成的核心內容;大數據技術的出現使企業可用的數據資產得到極大的擴展。本書分為三篇,分別從金融企業的大數據戰略規劃、場景實例以及常見問題與應對機制三個方面對金融企業在大數據時代面臨的機遇與挑戰做了深刻的分析,並給出了具體的實踐思路。
《金融大數據》提出了金融四大要素人、資金、交易和環境之間在網際網路時代的笛卡爾乘積關係的重要觀點,並以此作為大數據思維的重要出發點來指導金融企業的轉型之路。
《金融大數據》適合大數據、金融領域的相關從業者閱讀,同時也是相關企業管理人員釐清思路、洞察數據和金融本質的一本不可多得的參考著作。
作者簡介
陳利強,1999年畢業於中國人民大學後就職於
中國人壽保險公司,先後在信息技術部軟體開發處、運行管理處、套用管理處、核心開發處、項目管理處、開發一處等處室擔任主要技術人員和負責人,現任中國人壽保險股份有限公司研發中心總經理助理。
目錄
第 1 篇 大數據戰略規劃
1 背景 2
1.1 大數據是什麼 2
1.2 大數據關鍵推動事件6
1.3 國家相關政策意見 7
1.4 金融大數據應運而生 8
1.5 金融大數據的現狀與前瞻 10
1.6 金融大數據的衡量標準 12
2 金融大數據的戰略定位 15
2.1 必要性16
2.2 可行性22
2.3 主要問題 23
2.4 大數據價值所在26
2.5 大數據思維轉變 31
2.6 大數據戰略行動 33
3 金融企業大數據套用規劃構建 35
3.1 制定規劃原則 36
3.2 選擇規劃方法 39
3.3 制定目標藍圖 43
3.4 識別規劃風險 46
3.5 明確數據規劃 47
3.6 制定目標計畫 50
3.7 明確組織規劃 51
3.8 選擇技術方案 52
3.9 確定人才規劃 53
3.10 回顧實施風險 54
4 大數據的技術解決方案 57
4.1 應對場景 57
4.2 當前主要的大數據技術模型 59
4.3 深入分析 Hadoop 62
4.5 大數據硬體技術規劃 68
4.6 未來推薦技術模型 71
4.7 數據資產治理 74
5 大數據可視化 77
5.1 背景 77
5.1.1 發展歷程 78
5.1.2 可視化分析的能力要素 79
5.1.3 可視化分析與傳統分析的差異 80
5.2 可視化分析的過程及方法 80
5.3 可視化分析套用場景 81
5.3.1 社交網路分析 81
5.3.2 矢量地圖分析 82
5.3.3 詞雲分析 83
5.3.4 流量流向(桑基圖)分析 84
5.3.5 客戶全網畫像 84
第 2 篇 場景實例詳解
6 客戶大數據實例:客戶全景視圖套用 90
6.1 客戶全景視圖的網際網路基因 91
6.2 客戶全景視圖是金融大數據套用的基礎 94
6.3 關鍵技術設計96
6.3.1 NoSQL 資料庫的選擇 96
6.3.2 Hbase 的模型設計 99
6.3.3 源表數據的增量導出 102
6.3.4 數據寫入 HBase 的方法 103
6.4 主要技術實現 104
6.4.1 架構設計 105
6.4.2 環境搭建 106
6.4.3 數據的抽取和整合 106
6.4.4 保單視圖查詢 110
6.5 擴展分析 112
6.5.1 回顧 112
6.5.2 擴展 113
6.5.4 風險防範 114
7 網站大數據實例:點擊流分析與套用 116
7.1 點擊流分析的業務目標 117
7.2 關鍵技術 118
7.2.1 數據的獲取 118
7.2.2 數據的預處理 119
7.2.3 用戶行為數據的建模120
7.3. 案例:某保險公司電商網站點擊流分析 121
7.3.1 數據獲取及預處理 121
7.3.2 會話識別 122
7.3.3 網頁基本情況分析 123
7.5 輿情分析套用簡介 128
7.5.1 確定挖掘算法 128
7.5.2 網路爬蟲技術 129
7.5.3 主要實現過程 131
8 健康大數據實例:醫療費用監控套用 132
8.1 國內外醫療保險欺詐和監管情況 132
8.2 醫保欺詐類型介紹 133
8.3 醫保欺詐監控技術介紹 134
8.4 基於數據分析風險審核實現136
8.4.1 日平均醫療費用合規度分析 136
8.4.2 單病種治療方法分析 138
8.4.3 單病種非常規治療方法篩選 145
8.5 數據分析監控技術挑戰 147
9 語音大數據實例:電銷中心質檢套用 149
9.1 呼叫中心業務現狀 150
9.2 語音識別與語音分析 150
9.3 語音分析業務模型 152
9.3.1 自動質檢 152
9.3.2 業務分析 156
9.4 技術實現過程 160
9.4.1 邏輯架構設計 160
9.4.2 項目實施指引 161
9.5 效果和風險總結 163
9.5.1 預期效果 163
9.5.2 實施風險 163
1 0 影像大數據實例:影像數據遷移套用 165
10.1 企業內容管理的概念及套用 165
10.2 基於大數據技術的內容管理平台 166
10.3 內容管理平台的套用案例:影像系統 167
10.3.1 業務背景 167
10.3.2 技術關鍵 168
10.3.3 實現過程 172
10.3.4 案例的業務價值分析 174
1 1 日誌大數據實例:日誌備份查詢套用 175
11.1 日誌數據的類型 175
11.2 日誌數據管理 176
11.2.1 日誌的記錄和產生 176
11.2.2 日誌的採集和傳輸 178
11.2.3 日誌的存儲 180
11.2.4 日誌的套用 181
11.3 關鍵技術設計 181
11.3.1 日誌數據的存儲技術 182
11.3.2 採集傳輸技術 183
11.3.3 數據分析技術 185
11.4 日誌管理系統的案例 186
11.4.1 系統建設目標 186
11.4.2 使用 Flume 建立日誌傳輸管道 187
11.4.3 日誌檔案的保存和 HBase 日誌索引的創建 188
11.4.4 關於日誌規範 189
11.5 日誌管理的價值分析 189
11.5.1 系統運行監控 189
11.5.2 違規分析 189
11.5.3 用戶行為分析 190
第 3 篇 常見問題與應對機制
1 2 大數據安全 193
12.1 數據安全事件回顧 194
12.2 安全體系 196
12.1.2 伺服器安全 197
12.1.3 數據安全 198
12.2 法律安全 198
12.3 可用性 199
1 3 大數據來源 201
13.1 內部數據源 202
13.2 政府數據源 204
13.3 外部大數據 207
13.4 現狀與趨勢 210
1 4 關乎勝負與生死的決戰 212
14.1 客戶價值之戰 213
14.2 企業利潤之戰 214
14.3 管理平台之戰 214
14.4 人才隊伍之爭 215
14.5 決戰場景推演一 215
14.6 決戰場景推演二 216
1 5 大數據的人才需求與培育路線 220
15.1 人才需求 220
15.2 選人 223
15.2.1 人員類型 223
15.2.2 人員水平 224
15.3 育人 226
15.4 用人 227
15.5 留人 229
1 6 大數據的合作資源 231
16.1 產業鏈整體情況 231