Python金融大數據風控建模實戰

Python金融大數據風控建模實戰

《Python金融大數據風控建模實戰:基於機器學習》一書由機械工業出版社出版發行。

基本介紹

  • 中文名:Python金融大數據風控建模實戰:基於機器學習 
  • 作者:王青天 孔越
  • 出版社機械工業出版社
  • 出版時間:2020年6月
  • 頁數:376 頁
  • 定價:119 元
  • 開本:16 開
  • 裝幀:平裝
  • ISBN:9787111655794
內容簡介,圖書目錄,作者簡介,

內容簡介

本書是一本基於Python語言的金融大數據風控建模入門讀物。書中結合人工智慧領域流行的機器學習算法進行信用評分卡模型構建,從而解決金融領域最為核心的風險控制問題。本書共19章,分為4篇。第1篇“智慧型風控背景”,旨在由淺入深地引領讀者走進金融科技領域,帶領他們了解智慧型風控的相關知識,並全面、系統地認識評分卡;第2篇“評分卡理論與實戰基礎”,圍繞評分卡構建的完整流程,向讀者一一講述每個環節的理論知識,並進行代碼實踐,幫助讀者獲得從0到1構建評分卡模型的工程能力;第3篇“評分卡理論與實戰進階”,旨在從建模中可能遇到的問題出發,提供一些解決問題或提升模型效果的思路,使建立的評分卡具有更好的業務適應能力及預測能力;第4篇“LendingClub數據集實戰”,結合真實信貸場景的數據集,帶領讀者完成從數據分析到評分卡生成的各個流程,旨在讓讀者體驗真實的場景,掌握評分卡實戰技能,同時為讀者在實際工作中構建評分卡提供參考。本書適合有一定Python語言基礎的金融風控從業人員閱讀,也適合想要學習人工智慧如何套用於金融場景中的開發人員及業務人員閱讀。另外,金融、計算機等相關專業的學生,以及金融科技從業人員及相關培訓學員也可將本書作為教材或者興趣讀物閱讀。

圖書目錄

第1篇 智慧型風控背景
第1章 金融科技介紹 2
1.1 金融科技的前世今生 2
1.2 金融科技正深刻地改變和塑造著金融業態 4
1.3 新興科技不斷強化金融科技的套用能力 5
1.4 金融風險控制面臨著前所未有的挑戰 7
1.5 智慧型風控和評分卡 8
1.6 評分卡模型的開發流程 11
第2章 機器學習介紹 17
2.1 機器學習的概念 17
2.2 機器學習的分類 17
2.3 機器學習與人工智慧的關係 20
2.4 機器學習與數學的關係 20
2.5 機器學習與深度學習 22
第3章 評分卡模型介紹 25
3.1 申請評分卡 25
3.2 行為評分卡 36
3.3 催收評分卡 40
3.4 反欺詐模型 42
第2篇 評分卡理論與實戰基礎
第4章 數據清洗與預處理 48
4.1 數據集成 49
4.2 數據清洗 50
4.3 探索性數據分析 52
4.4 Python代碼實踐 54
第5章 變數編碼方法 66
5.1 無監督編碼 66
5.2 有監督編碼 70
5.3 Python代碼實踐 75
第6章 變數分箱方法 89
6.1 變數分箱流程 91
6.2 最優Chi-merge卡方分箱方法 92
6.3 Best-KS分箱方法 94
6.4 最優IV分箱方法 95
6.5 基於樹的最優分箱方法 95
6.6 Python代碼實踐 98
第7章 變數選擇 109
7.1 過濾法變數選擇 109
7.2 包裝法變數選擇 112
7.3 嵌入法變數選擇 113
7.4 Python代碼實踐 115
第8章 Logistic回歸模型 123
8.1 Logistic回歸模型原理 123
8.2 過擬合與欠擬合 128
8.3 Python代碼實踐 130
第9章 模型的評估指標 136
9.1 正負樣本的選擇 137
9.2 標準評估指標 139
9.3 機率密度評估指標 141
9.4 機率分布評估指標 144
9.5 Python代碼實踐 153
第10章 評分卡分數轉化 157
10.1 由機率到分數的轉換 157
10.2 變數的分值計算 159
10.3 評分卡性能評估 161
10.4 Python代碼實踐 163
第11章 模型線上監控 169
11.1 穩定性監控 169
11.2 單調性監控 172
11.3 性能監控指標173
11.4 Python代碼實踐 174
第3篇 評分卡理論與實戰進階
第12章 樣本不均衡處理 180
12.1 數據層下採樣樣本不均衡的處理方法 181
12.2 數據層上採樣樣本不均衡的處理方法 188
12.3 算法層樣本不均衡的處理方法 190
12.4 模型評估層樣本不均衡的處理方法 191
12.5 Python代碼實踐 191
第13章 特徵工程進階 206
13.1 數據層特徵工程 206
13.2 算法層特徵工程 211
13.3 Python代碼實踐 219
第14章 決策樹模型 229
14.1 決策樹模型的原理 229
14.2 決策樹學習 229
14.3 決策樹與過擬合 234
14.4 Python代碼實踐 236
第15章 神經網路模型 241
15.1 神經元模型 241
15.2 神經網路的網路結構 242
15.3 神經網路的學習策略 247
15.4 Python代碼實踐 253
第16章 支持向量機模型 257
16.1 感知器模型 257
16.1.1 感知器模型的原理 257
16.1.2 感知器與支持向量機模型260
16.2 線性可分支持向量機 261
16.3 線性支持向量機 267
16.4 非線性支持向量機 272
16.5 感知器相關模型比較 278
16.6 Python代碼實踐 280
第17章 集成學習 286
17.1 Bagging與Boosting對比 286
17.2 Random Forest模型原理 288
17.3 Adaboost模型原理 289
17.4 GBDT模型原理 292
17.5 Xgboost模型原理 297
17.6 Python代碼實踐 304
第18章 模型融合 317
18.1 Blending方法原理317
18.2 Stacking方法原理320
18.3 Python代碼實踐 322
第4篇 Lending Club數據集實戰
第19章 完整的模型開發實現 330
19.1 數據源介紹 330
19.2 數據的獲取與預處理 331
19.3 特徵工程 341
19.4 模型構建與評估 351
19.5 評分卡生成 353
附錄A 主要符號表 357
附錄B 開發環境簡介 358
參考文獻 362

作者簡介

王青天 碩士,曾任某網際網路金融公司機器學習研究工程師,從事風控建模工作。對機器學習、風控建模、工業網際網路等方向有濃厚的興趣和廣泛的研究。
孔越 博士,曾留學英國劍橋大學。涉獵金融風控和“AI+藥物研發”等多個人工智慧套用領域。曾參與多項國家自然科學基金項目和歐洲科研基金項目,發表多篇SCI論文。

相關詞條

熱門詞條

聯絡我們