《Pandas與scikit-learn數據分析與挖掘實用指南》是2021年天津大學出版社出版的圖書。
基本介紹
- 中文名:Pandas與scikit-learn數據分析與挖掘實用指南
- 作者:郭肖勇
- 出版社:天津大學出版社
- 出版時間:2021年8月1日
- ISBN:9787561870228
內容簡介,圖書目錄,
內容簡介
數據分析與挖掘可以幫助人們從數據中發現規律獲取知識。Pandas與Scikit-learn是目前較為流行的數據分析、可視化與機器學習工具。通過Python語言可以方便地使用Pandas與Scikit-Iearn進行數據分析與挖掘。《(2021版)Pandas與scikit-learn數據分析與挖掘實用指南》通過大量的實例系統地講解這兩個庫的使用。前兩章介紹了數據挖掘的基本概念和Python開發環境的搭建。第3章和第4章介紹Pandas與Scikit-leam的使用。第5章介紹特徵工程,這是在數據挖掘與建模過程中非常重要的環節。最後一章通過實例來演示完整的數據挖掘項目流程。
《Pandas與scikit-learn數據分析與挖掘實用指南》適合高等院校理工科專業的本科生和研究生及其他任何對數據分析與挖掘感興趣的人士閱讀。
圖書目錄
第1章 引言
1.1 數據挖掘
1.2 機器學習算法
1.3 數據挖掘的主要流程
第2章 Python基礎
2.1 Python簡介
2.2 Python開發環境的搭建
第3章 Pandas基礎
3.1 創建、讀取和寫入
3.2 索引、選擇和分配
3.3 分組和排序
3.4 數據類型和缺失值
3.5 重命名及合併
第4章 Scikit-learn基礎
4.1 Scikit-learn簡介
4.2 Scikit-learn的技術基礎
4.3 Scikit-learn安裝
4.4 監督學習
4.5 交叉驗證:評估機器學習模型的表現
第5章 特徵工程
5.1 基準模型
5.2 分類編碼
5.3 特徵的生成
5.4 特徵的選擇
第6章 實例
6.1 lightgbm實踐:桑坦德銀行客戶交易預測
6.2 Kaggle Titanic生存預測