基於R的統計分析與數據挖掘

基於R的統計分析與數據挖掘

《基於R的統計分析與數據挖掘》是2014年5月中國人民大學出版社出版的圖書,作者是薛薇。

基本介紹

  • 中文名:基於R的統計分析與數據挖掘
  • 作者:薛薇
  • ISBN:9787300190747
  • 定價:48元
  • 出版社:中國人民大學出版社
  • 出版時間:2014年5月
  • 裝幀:平裝
  • 開本:16開
內容簡介,圖書目錄,

內容簡介

本書聚焦當今備受國內外數據分析師和數據套用者關注的R語言,關注如何藉助R實現統計分析和數據挖掘。它既不是僅側重理論講解的統計分析和數據挖掘教科書,也不是僅側重R編程操作的使用手冊,而是以數據分析貫穿全書的兩者的有機結合。
本書特色在於:以數據模擬的直觀方式論述方法原理的同時,通過案例強化R的操作實踐性;在以解決套用問題為目標討論R操作的同時,通過原理論述強化模型結果的解讀理解。
本書定位於統計分析和數據挖掘的學習者、實踐者和研究者,旨在使讀者理解統計分析原理,熟練操控R軟體,拓展數據套用,提升研究水平。

圖書目錄

第1章 關於R
1.1 為什麼選擇R
1.2 如何學習R
1.3 R入門必備
1.4 小 結
第2章 R的數據組織
2.1 R的數據對象
2.2 創建和訪問R的數據對象
2.3 從文本檔案讀數據
2.4 外部數據的導入
2.5 R數據組織的其他問題
2.6 小 結
第3章 R的數據管理
3.1 數據合併
3.2 數據排序
3.3 缺失數據報告
3.4 變數計算
3.5 變數值的重編碼
3.6 數據篩選
3.7 數據保存
3.8 數據管理中控制流程
3.9 小 結
第4章 R的基本數據分析:描述和相關
4.1 數值型單變數的描述
4.2 分類型單變數的描述
4.3 兩數值型變數相關性的分析
4.4 兩分類型變數相關性的分析
4.5 小 結
第5章 R的基本數據分析:可視化
5.1 繪圖基礎
5.2 數值型單變數分布的可視化
5.3 分類型變數分布和相關性的可視化
5.4 兩數值型變數相關性的可視化
5.5 lattice繪圖
5.6 小 結
第6章 R的兩均值比較檢驗
6.1 兩獨立樣本的均值檢驗
6.2 兩配對樣本的均值檢驗
6.3 樣本均值檢驗的功效分析
6.4 兩總體分布差異的非參數檢驗
6.5 兩樣本均值差的置換檢驗
6.6 兩樣本均值差的自舉法檢驗
6.7 小 結
第7章 R的方差分析
7.2 單因素協方差分析
7.3 多因素方差分析
7.4 小 結
第8章 R的回歸分析:一般線性模型
8.1 回歸分析概述
8.3 線性回歸方程的檢驗
8.4 回歸診斷:誤差項是否滿足高斯馬爾科夫假定
8.5 回歸診斷:診斷數據中的異常觀測點
8.6 回歸診斷:多重共線性的診斷
8.7 回歸建模策略
8.8 回歸模型驗證
8.9 帶虛擬變數的線性回歸分析
8.10 小 結
第9章 R的回歸分析:廣義線性模型
9.1 廣義線性模型概述
9.2 logistic回歸分析:連線函式和參數估計
9.3 logistic回歸分析:解讀模型和模型檢驗
9.4 logistic回歸分析:R函式和示例
9.5 logistic回歸分析:回歸診斷
9.6 泊松回歸分析
9.7 廣義線性模型的交叉驗證
9.8 小 結
第10章 R的聚類分析
10.1 聚類分析概述
10.2 K-Means聚類
10.3 層次聚類
10.4 兩步聚類
10.5 小 結
第11章 R的因子分析:變數降維
11.1 因子分析概述
11.2 構造因子變數:基於主成分分析法
11.3 構造因子變數:基於主軸因子法
11.4 因子變數的命名
11.5 計算因子得分
11.6 小 結
第12章 R的線性判別分析:分類模型
12.1 距離判別
12.2 Fisher判別
12.3 小 結
第13章 R的決策樹:預測模型
13.1 決策樹算法概述
13.2 分類回歸樹的生長過程
13.3 分類回歸樹的剪枝
13.4 建立分類回歸樹的R函式和示例
13.5 建立分類回歸樹的組合預測模型
13.6 隨機森林
13.7 小 結
第14章 R的人工神經網路:預測和聚類
14.1 人工神經網路概述
14.2 B-P反向傳播網路
14.3 B-P反向傳播網路的R函式和示例
14.4 SOM自組織映射網路
14.5 小 結

相關詞條

熱門詞條

聯絡我們