《集成學習入門與實戰:原理、算法與套用》是化學工業出版社於2022年出版的書籍,作者是(印度)阿洛克·庫馬爾(AlokKumar)、(印度)馬揚克·賈因(MayankJain)
基本介紹
- 中文名:集成學習入門與實戰:原理、算法與套用
- 作者:(印度)阿洛克·庫馬爾(AlokKumar)、(印度)馬揚克·賈因(MayankJain)
- 出版社:化學工業出版社
- 出版時間:2022年2月1日
- 頁數:122 頁
- 開本:32 開
- 裝幀:平裝
- ISBN:9787122401670
目錄
第1章 為什麼需要集成學習 001
1.1 混合訓練數據 003
1.2 混合模型 004
1.3 混合組合 008
1.4 本章小結 009
第2章 混合訓練數據 011
2.1 決策樹 013
2.2 數據集採樣 018
2.2.1 不替換採樣(WOR) 018
2.2.2 替換採樣(WR) 019
2.3 Bagging(裝袋算法) 021
2.3.1 k重交叉驗證 024
2.3.2 分層的k重交叉驗證 026
2.4 本章小結 028
第3章 混合模型 029
3.1 投票集成 030
3.2 硬投票 031
3.3 均值法/軟投票 033
3.4 超參數調試集成 036
3.5 水平投票集成 038
3.6 快照集成 044
3.7 本章小結 046
第4章 混合組合 047
4.1 Boosting(提升算法) 048
4.1.1 AdaBoost(自適應提升算法) 049
4.1.2 Gradient Boosting(梯度提升算法) 051
4.1.3 XGBoost(極端梯度提升算法) 053
4.2 Stacking(堆疊算法) 055
4.3 本章小結 058
第5章 集成學習庫 059
5.1 ML-集成學習 060
5.1.1 多層集成 063
5.1.2 集成模型的選擇 064
5.2 通過Dask擴展XGBoost 069
5.2.1 Dask數組與數據結構 071
5.2.2 Dask-ML 076
5.2.3 擴展XGBoost 079
5.2.4 微軟LightGBM 082
5.2.5 AdaNet 088
5.3 本章小結 090
第6章 實踐指南 092
6.1 基於隨機森林的特徵選擇 093
6.2 基於集成樹的特徵轉換 096
6.3 構建隨機森林分類器預處理程式 103
6.4 孤立森林進行異常點檢測 110
6.5 使用Dask庫進行集成學習處理 114
6.5.1 預處理 115
6.5.2 超參數搜尋 117
6.6 本章小結 121
致謝 122