《R語言統計分析與機器學習:微課版》是2020年水利水電出版社出版的圖書。
基本介紹
- 中文名:R語言統計分析與機器學習:微課版
- 作者:薛震、孫玉林
- 出版時間:2020年2月
- 出版社:水利水電出版社
- ISBN:9787517079552
- 類別:程式設計
- 開本:16 開
- 裝幀:平裝-膠訂
內容簡介,圖書目錄,作者簡介,
內容簡介
R語言是全球熱門的統計語言之一,也是一款優秀的數據分析和數據可視化軟體,它*的一個優點就是自由、開源。隨著 R 語言的不斷發展,它在機器學習和深度學習等領域受
到了眾多學者和企業的套用,並且提供了很多豐富的R語言包。
《R語言統計分析與機器學習(微課視頻版)》理論介紹言簡意賅,分析過程可視化,注重實戰操作,是R語言統計分析與機器學習的一本入門教材。本書涵蓋了R語言的使用,
於R語言的數據預處理、可視化及統計分析,基於 R 語言實現的機器學習、深度學習等內容。
《R語言統計分析與機器學習(微課視頻版)》可作為高等院校統計學、計算機科學、數據分析、數據挖掘、人工智慧等方向的本科生或研究生教材,也可供對數據分析和機器學習感興趣的研究人員和工程技術人員閱讀參考。
圖書目錄
第1篇R語言基礎
第1章R語言人門
1.1R與RStudio
1.1.1什麼是R語言
1.1.2用RStudio
1.2R的數據結構
1.2.1向量
1.2.2矩陣
1.2.3高維數組
1.2.4數據框
1.2.5列表
1.3控制和函式
1.3.1條件語句
1.3.2循環語句
1.3.3函式
1.4R中的常用包
1.5本章小結
習題1
第2章數據管理和探索
2.1數據獲取
2.1.1從檔案中獲取數據
2.1.2網路爬蟲
2.2缺失值處理
2.2.1缺失值的判別
2.2.2缺失值的簡單處理
2.2.3處理缺失值的複雜方法
2.3數據操作
2.3.1長寬型數據轉換
2.3.2數據分類匯總
2.3.3數據屬性轉換
2.3.4數據切分
2.4數據描述
2.4.1數據的集中位置
2.4.2數據的離散程度
2.4.3數據的度和峰度
2.5數據相似性度量
2.5.1變數的相關係數
2.5.2樣本間的距離
2.6本章小結
習題2
第3章數據可視化
3.1R基礎的數據可視化
3.2ggplot2系列包的可視化
3.2.1ggplot2的基礎繪圖
3.2.2基於ggplot2的展包
3.3其他數據可視化包
3.3.1樹圖可視化
3.3.2地圖可視化
3.3.3社交網路可視化
3.3.4韋恩圖
3.4R可視化3D圖像
3.5本章小結
習題3
第2篇統計分析
第4章數理統計基礎
4.1隨機數模擬
4.1.1一元隨機數
4.1.2多元隨機數
4.2假設檢驗
4.2.1數據分布檢驗
4.2.2均值的檢驗
4.2.3方差齊性檢驗
4.2.4相關性檢驗
4.3方差分析
4.3.1單因素方差分析
4.3.2雙因素方差分析
4.4列聯表分析
4.4.1簡單列聯表分析
4.4.2高維列聯表分析
4.5本章小結
習題4
第5章回歸分析
5.1一元回歸模型
5.1.1一元線性回歸
5.1.2多項式回歸
5.2多元線性回歸分析
5.2.1多元線性回歸的預測
5.2.2多元線性回歸結果檢驗
5.3逐步回歸進行變數選擇
5.3.1逐步回歸進行預測
5.3.2逐步回歸模型結果檢驗
5.4Logistie
5.4.1Logistie
5.4.2逐步邏輯變數篩選過程
5.5泊松回歸模型
5.6RidgeLasso
5.6.1使用R進行Ridge歸
5.6.2使用R進行Lasso回歸
5.6.3使用R進行Lasso分類
5.7本章小結
習題5
第6章多元統計分析
6.1主成分分析
6.1.1提取特徵主成分
6.1.2提取樣本主成分
6.2聚類分析
6.2.1系統聚類
6.2.2k-means
6.2.3密度聚類
6.3對應分析
6.3.1簡單對應分析
6.3.2多重對應分析
6.4典型相關分析
6.4.1數據的典型相關分析
6.4.2典型相關分析可視化
6.5判別分析
6.5.1線性判別
6.5.2非線性判別
6.6關聯規則分析
6.6.1發現頻繁項集
6.6.2發現關聯規則
6.6.3關聯規則可視化
6.7本章小結
習題6
第7章時間序列分析
7.1時間序列的相關檢驗
7.1.1白噪聲檢驗
7.1.2平穩性檢驗
7.2自回歸移動平均模型
7.2.1ARMA準
7.2.2可化ACF和PACF
7.2.3建立ARMA模型
7.3節ARIMA模
7.3.1SARIMA
7.3.2數據平穩性分析
7.3.3SARIMA模建立
7.4多元時間序列ARIMAX模型
7.4.1ARIMAX準
7.4.2ARIMAX模型建立
7.5 prophet預測時間序列
7.5.1 prophet
7.5.2使用prophet包建立測模
7.6本章小結
習題7
第3篇機器學習
第8章K-近鄰和樸素貝葉斯
8.1KNN算法
8.1.1KNN分類識別圖
8.1.2KNN回歸預測房價
8.2樸素貝葉斯方法
8.2.1垃圾郵件數據預處理和探索
8.2.2樸素貝葉斯分類器
8.3本章小結
習題8
第9章決策樹和集成學習
9.1決策樹模型
9.1.1數據準備和預處理
9.1.2決策樹模型建立
9.1.3決策樹最佳化
9.2隨機森林模型
9.2.1隨機森林分類
9.2.2隨機森林回歸
9.2.3最佳化隨機森林回歸
……
作者簡介
薛震,中北大學優秀青年主講教師,山西省高校數學類專業教學指導委員會秘書長,全國數學微課競賽山西賽區秘書長。現主要從事數據統計分析、機器學習和計算機視覺等方面的研究,發表科學研究論文10餘篇,其中被SCI、EI檢索5篇。主持和參與多項省、校級教改項目,獲省級教學成果獎2項。曾榮獲全國“公益雲圖數據可視化創新大賽”優秀導師獎。近年來指導大學生數學建模競賽,獲國內、國際一、二等獎10餘項。