R語言與數據挖掘最佳實踐和經典案例

R語言與數據挖掘最佳實踐和經典案例

《R語言與數據挖掘最佳實踐和經典案例》是2014年機械工業出版社出版的圖書,作者是[澳] Yanchang Zhao。

基本介紹

  • 中文名:R語言與數據挖掘最佳實踐和經典案例
  • 作者:[澳] Yanchang Zhao
  • 出版時間:2014年9月1日
  • 出版社:機械工業出版社
  • ISBN:9787111475415
內容簡介,圖書目錄,作者簡介,

內容簡介

《R語言與數據挖掘實踐和經典案例》為研究人員、高校學生、數據分析人員介紹了使用R語言進行數據挖掘套用的實用方法和技術。讀祖騙櫻者會從《R語言與數據挖掘實踐和經典案例》中發現使用R語言完成數據挖掘任務(如分類和預測、聚類、孤立點檢測、關聯規則、序列分析、文本挖掘、社會網路分析、情感分析等)的非常有價值的指導。數據挖掘技術在廣泛領域都發展迅速。《R語言與數據挖掘實踐和經典案例》重點關注數據挖掘過程的建模階段,以及數據探查和模型評估問題。《R語言與數據挖掘實踐和經典案例》講述簡潔實用,配有現實套用案例和代碼示例以及數據,線上資源及時豐富,是一本數據分析的實戰技術圖書。

圖書目錄

出版者的話
譯者序
縮寫詞表
第1章 簡介
1.1 數據挖掘
1.2 R
1.3 數據集
1.3.1 iris數據集
1.3.2 bodyfat數據集
第2章 數據的導入與導出
2.1 R數據的保存與載入
2.2.CSV檔案的導入與導出
2.3 從SAS中導人數據
2.4 通過ODBC導人與導出數據
2.4.1 從資料庫中讀取數據
2.4.2 從Excel檔案中導入與導出數據
第3章 數據探索
3.1 查看數據
3.2 探索單個變數
3.3 探索多個變數
3.4 更多探索
3.5 將圖表保存到檔案中
第4章 決策樹與隨機森林
4.1 使用party包構建決策樹
4.2 使用rpart包構建決策樹
4.3 隨機森林
第5章 回歸分析
5.1 線性回歸
5.2 邏輯回歸
5.3 廣義線性回歸
5.4 非線性回歸
第6章 聚類
6.1 k?means聚類
6.2 k?medoids聚類
6.3 層次聚類
6.4 基於密度的聚類
第7章 離群點檢測
7.1 單變數的離群點檢測
7.2 局部離群點因子檢測
7.3 用聚類方法進行離群點檢測
7.4 時間序列數據的離群點檢測
7.5 討論
第8章 時間序列分析與挖掘
8.1 R中的時間序列數據
8.2 時間序列分解
8.3 時間序列預測匪敬蘭
8.4 時間序列聚類
8.4.1 動態時間規整
8.4.2 控制圖的時間序列數據
8.4.3 基於歐氏距離的層次聚類
8.4.4 基於DTW距離的層次聚類
8.5 時間序列分類
8.5.1 基於原始數據的分類
8.5.2 基於特徵提取的分類
8.5.3 k——NN分類
8.6 討論
8.7 延伸閱讀
第9章 關聯規則
9.1 關聯規則的基本概念
9.2 Titanic數據集
9.3 關聯規則捉旋挖掘
9.4 消除冗餘
9.5 解釋規則
9.6 關聯規則的可視化
9.7 討論與延伸閱讀
第10章 文本挖掘
10.1 Twitter的文本檢索
10.2 轉換文本
10.3 提取詞幹
10.4 建立詞項槶牡稻卣
10.5 頻繁詞項與關聯
10.6 詞雲
10.7 詞項聚類
10.8 推文聚類
10.8.1 基於k——means算法的推文聚類
10.8.2 基於k——medoids算法的推文聚類
10.9 程式包、延伸閱讀與討論
第11章 社交網路分析
11.1 詞項網剃邀戶絡
11.2 推文網路
11.3 雙模式雄牛姜匙網路
11.4 討論與延伸閱讀
第12章 案例Ⅰ:房價指數的分析與預測
12.1 HPI數據導入
12.2 HPI數據探索
12.3 HPI趨勢與季節性成分
12.4 HPI預測
12.5 房地產估價
12.6 討論
第13章 案例Ⅱ:客戶回復預測與效益最大化
13.1 簡介
13.2 KDDCup1998的數據
13.3 數據探索
13.4 訓練決策樹
13.5 模型評估
13.6 選擇最優決策樹
13.7 評分
13.8 討論與總結
第14章 案匪霉員例Ⅲ:記憶體受限的大數據預測模型
14.1 簡介
14.2 研究方法
14.3 數據與變數
14.4 隨機森林
14.5 記憶體問題
14.6 樣本數據的訓練模型
14.7 使用已選變數建立模型
14.8 評分
14.9 輸出規則
14.9.1 以文本格式輸出規勸捆膠求則
14.9.2 輸出SAS規則的得分
14.10 總結與討論
第15章 線上資源
15.1 R參考文檔
15.2 R
15.3 數據挖掘
15.4 R的數據挖掘
15.5 R的分類與預測
15.6 R的時間序列分析
15.7 R的關聯規則挖掘
15.8 R的空間數據分析
15.9 R的文本挖掘
15.10 R的社交網路分析
15.11 R的數據清洗與轉換
15.12 R的大數據與並行計算
R語言數據挖掘參考文檔
參考資料
通用索引
包索引
函式索引

作者簡介

YanchangZhao,從2009年起擔任澳大利亞政府部門的高級數據挖掘分析師。在加入澳大利亞政府部門之前,他是悉尼科技大學工程和信息技術學院博士後研究員。他的研究興趣包括聚類分析、關聯規則、時間序列、孤立點檢測、數據挖掘套用等,當前關注在數據挖掘套用中使用R語言。他是IEEE高級會員和澳大利亞分析專業人員協會成員。他發表了50多篇數據挖掘研究和套用方面的論文,並獨立或與他人合作編寫了3本著作。
8.5.1 基於原始數據的分類
8.5.2 基於特徵提取的分類
8.5.3 k——NN分類
8.6 討論
8.7 延伸閱讀
第9章 關聯規則
9.1 關聯規則的基本概念
9.2 Titanic數據集
9.3 關聯規則挖掘
9.4 消除冗餘
9.5 解釋規則
9.6 關聯規則的可視化
9.7 討論與延伸閱讀
第10章 文本挖掘
10.1 Twitter的文本檢索
10.2 轉換文本
10.3 提取詞幹
10.4 建立詞項槶牡稻卣
10.5 頻繁詞項與關聯
10.6 詞雲
10.7 詞項聚類
10.8 推文聚類
10.8.1 基於k——means算法的推文聚類
10.8.2 基於k——medoids算法的推文聚類
10.9 程式包、延伸閱讀與討論
第11章 社交網路分析
11.1 詞項網路
11.2 推文網路
11.3 雙模式網路
11.4 討論與延伸閱讀
第12章 案例Ⅰ:房價指數的分析與預測
12.1 HPI數據導入
12.2 HPI數據探索
12.3 HPI趨勢與季節性成分
12.4 HPI預測
12.5 房地產估價
12.6 討論
第13章 案例Ⅱ:客戶回復預測與效益最大化
13.1 簡介
13.2 KDDCup1998的數據
13.3 數據探索
13.4 訓練決策樹
13.5 模型評估
13.6 選擇最優決策樹
13.7 評分
13.8 討論與總結
第14章 案例Ⅲ:記憶體受限的大數據預測模型
14.1 簡介
14.2 研究方法
14.3 數據與變數
14.4 隨機森林
14.5 記憶體問題
14.6 樣本數據的訓練模型
14.7 使用已選變數建立模型
14.8 評分
14.9 輸出規則
14.9.1 以文本格式輸出規則
14.9.2 輸出SAS規則的得分
14.10 總結與討論
第15章 線上資源
15.1 R參考文檔
15.2 R
15.3 數據挖掘
15.4 R的數據挖掘
15.5 R的分類與預測
15.6 R的時間序列分析
15.7 R的關聯規則挖掘
15.8 R的空間數據分析
15.9 R的文本挖掘
15.10 R的社交網路分析
15.11 R的數據清洗與轉換
15.12 R的大數據與並行計算
R語言數據挖掘參考文檔
參考資料
通用索引
包索引
函式索引

作者簡介

YanchangZhao,從2009年起擔任澳大利亞政府部門的高級數據挖掘分析師。在加入澳大利亞政府部門之前,他是悉尼科技大學工程和信息技術學院博士後研究員。他的研究興趣包括聚類分析、關聯規則、時間序列、孤立點檢測、數據挖掘套用等,當前關注在數據挖掘套用中使用R語言。他是IEEE高級會員和澳大利亞分析專業人員協會成員。他發表了50多篇數據挖掘研究和套用方面的論文,並獨立或與他人合作編寫了3本著作。

相關詞條

熱門詞條

聯絡我們