Python預測分析與機器學習

《Python預測分析與機器學習》是清華大學出版社於2022年出版的書籍,作者是王沁晨。

基本介紹

  • 中文名:Python預測分析與機器學習
  • 作者:王沁晨
  • 出版社:清華大學出版社
  • 出版時間:2022年5月1日
  • 定價:89 元
  • ISBN:9787302592549
內容簡介,目錄,

內容簡介

本書從理解問題定義、了解數據內的高層信息、數據清理、視化數據,到基礎建模、模型最佳化,分享一個數據分析師的視角與思路。在預測分析的流程中,一步步用詳細的圖文代碼講解使用到的庫,如何正確使用各個庫中的方法和函式,以及在遇到類似的問題時如何套用學過的知識。 本書共8章。第1章對預測分析的流程進行一個高層次的概述。第2章介紹本書需要安裝使用的庫,並講解數據清理步驟的執行。第3章講解基礎建模需考慮的細節,結合第4章的模型選擇,可以搭建一個基礎的預測管道。第5章和第6章分別從模型和數據的角度講解如何最佳化預測表現。第7章講解時間序列這一特殊數據的預測方法。最後,第8章總結全書學習到的內容,解決一個實戰問題。 本書面向3類讀者。

目錄

第1章預測分析與機器學習的實用價值
1.1人工智慧、機器學習與數據分析的關係
1.2什麼是預測分析
1.3預測分析在各行業中的套用
1.4預測分析流程概覽
1.5小結
第2章數據清理
2.1建立編程環境
2.1.1Anaconda簡介及安裝
2.1.2Jupyter Notebook 簡介及安裝
2.1.3Pandas簡介及安裝
2.1.4scikitlearn 簡介及安裝
2.1.5XGBoost、LightGBM、CatBoost簡介及安裝
2.1.6TensorFlow簡介及安裝
2.2面對異構數據如何下手
2.2.1什麼是異構數據
2.2.2如何處理異構數據
2.3數據誤差
2.3.1各類數據誤差及其影響
2.3.2如何處理數據誤差
2.4數據重新格式化
第3章基礎建模
3.1判斷何為X和y
3.1.1X和y的定義
3.1.2X和y的選擇對預測的影響
3.2訓練集、驗證集與測試集
3.2.1三者的定義及關係
3.2.2如何使用sklearn分離3個集
3.2.3如何使用Pandas手動分離3個集
3.3數據泄露
3.3.1不同類型的數據泄露
3.3.2發現並避免目標泄露
3.3.3避免訓練集與測試集的相互污染
3.4偏差與方差
3.4.1定義偏差與方差
3.4.2過擬合與欠擬合
3.4.3實踐中的過擬合與欠擬合

相關詞條

熱門詞條

聯絡我們