大數據挖掘與統計機器學習(第2版)

大數據挖掘與統計機器學習(第2版)

《大數據挖掘與統計機器學習(第2版)》是2019年中國人民大學出版社出版的圖書。

基本介紹

  • 中文名:大數據挖掘與統計機器學習(第2版)
  • 作者: 呂曉玲 宋捷 
  • 出版時間:2019年
  • 出版社中國人民大學出版社 
  • ISBN:9787300264066
內容簡介,目錄,

內容簡介

  《大數據挖掘與統計機器學習(第2版)/大數據分析統計套用叢書》介紹數據挖掘與統計機器學習領域常用的模型和算法,包括基礎的線性回歸和線性分類方法,以及模型選擇和模型評價的概念和方法,進而介紹非線性的回歸和分類方法(包括決策樹與組合方法、支持向量機、神經網路以及在此基礎上發展的深度學習方法)。最後介紹無監督的學習中的聚類方法和業界廣泛使用的推薦系統方法。除了方法的理論講解之外,我們給出了每種方法的R語言及Python語言實現。
  《大數據挖掘與統計機器學習(第2版)/大數據分析統計套用叢書》的一個亮點是最後一章給出的三個大數據案例,數據量均在10G左右。

目錄

第1章 概述
1.1 名詞演化
1.2 基本內容
1.3 數據智慧
第2章 線性回歸方法
2.1 多元線性回歸
2.2 壓縮方法:嶺回歸與Lasso
2.3 Lasso模型的求解與理論性質
2.4 損失函式加罰的建模框架
2.5 上機實踐
2.6 上機實踐:Python
第3章 線性分類方法
3.1 分類問題綜述與評價準則
3.2 Logistic回歸
3.3 線性判別
3.4 上機實踐
3.5 上機實踐:Python
第4章 模型評價與選擇
4.1 基本概念
4.2 。理論方法
4.3 數據重利用方法
4.4 上機實踐
4.5 上機實踐:Python
第5章 決策樹與組合方法
5.1 決策樹
5.2 Bagging
5.3 Boosting
5.4 隨機森林
5.5 上機實踐
5.6 上機實踐:Python
第6章 神經網路與深度學習
6.1 神經網路
6.2 深度信念網
6.3 卷積神經網路
6.4 上機實踐
6.5 上機實踐:Python
第7章 支持向量機
7.1 線性可分支持向量機
7.2 軟間隔支持向量機
7.3 一些拓展
7.4 上機實踐
7.5 上機實踐:Python
第8章 聚類分析
8.1 基於距離的聚類
8.2 基於模型和密度的聚類
8.3 稀疏聚類
8.4 雙向聚類
8.5 上機實踐
8.6 上機實踐:Python
第9章 推薦系統9.1 基於鄰居的推薦
9.2 潛在因子與矩陣分解算法
9.3 上機實踐
9.4 上機實踐:Python
第10章 大數據案例分析
10.1 智慧型手機用戶監測數據案例分析
10.2 美國航空數據案例分析
10.3 美國紐約公共腳踏車數據案例分析
參考文獻

相關詞條

熱門詞條

聯絡我們