R語言數據分析與數據挖掘套用(微課視頻版)

《R語言數據分析與數據挖掘套用(微課視頻版)》是2021年清華大學出版社出版的一部作品,作者為李慶華、周青。

基本介紹

  • 中文名:R語言數據分析與數據挖掘套用(微課視頻版)
  • 作者:李慶華、周青
  • 出版時間:2021年8月1日
  • 出版社清華大學出版社
  • ISBN:9787302584087
  • 定價:45 元
圖書內容,目錄,

圖書內容

本書主要講述R語言在數據分析與數據挖掘方面的套用,內容結構編排合理,由淺到深循序漸進地引導讀者快速入門,並逐步提高使用R語言編程實現數據分析和文本數據挖掘的能力。

目錄

第1章R基礎知識簡介
1.1為什麼要學習R語言
1.2如何下載、安裝R和RStudio軟體
1.3R軟體使用入門
1.4R的工作原理
1.5R啟動項檔案的配置
1.5.1PATH環境變數
1.5.2R的啟動順序
1.5.3.Rprofile檔案配置
1.6R語言的工作空間
1.6.1數據的導入
1.6.2數據的存儲
1.6.3R語言的批量讀取和寫入
1.6.4R的內置數據集
1.6.5批處理檔案
1.6.6R的線上幫助
1.7R數據包的安裝和載入
1.7.1R數據分析與數據挖掘相關包
1.7.2R文本挖掘wordcloud2包的使用
1.7.3R語言中的機器學習包
1.8R語言編程過程中的常見錯誤
1.8.1R包安裝失敗的原因分析
1.8.2R語言調試查錯
1.8.3R程式的運行時間與效率
1.9控制流
1.9.1分支結構的流程控制
1.9.2中止語句與空語句的流程控制
1.9.3重複和循環語句的流程控制
1.10R語言編程常用的函式
1.10.1用戶自定義函式
1.10.2常用的數學函式
1.10.3常用的基礎統計函式
1.10.4常用的數據挖掘函式
1.11R的趣味套用
本章小結
思考與練習
第2章數據分析和挖掘的初步認識: R的數據結構
2.1R的對象與屬性
2.2向量對象
2.2.1向量的索引方式
2.2.2向量的排序和排名
2.2.3向量的運算
2.3數組與矩陣對象
2.3.1矩陣的建立
2.3.2矩陣元素值的修改
2.3.3數組的建立
2.3.4矩陣和數組的索引方式
2.4數據框對象
2.5因子對象
2.6列表對象
2.7時間序列對象
2.8R語言中對象間的相互轉換
3.2.1估計量與估計值
3.2.2點估計與區間估計
3.3總體的區間估計
3.3.1用R進行總體均值的區間估計
3.3.2總體方差的區間估計
3.3.3總體比例的區間估計
3.3.4兩個總體均值之差的區間估計
3.3.5兩個總體比例之差的區間估計
3.4估計總體均值時樣本量的確定
3.5R語言中的ShapiroWilk檢驗
本章小結
思考與練習
第4章假設檢驗
4.1假設檢驗的基本問題
4.1.1原假設與備擇假設
4.1.2兩類錯誤
4.1.3假設檢驗的步驟
4.1.4區間估計與假設檢驗
4.1.5利用P值進行決策
4.2一個總體參數的檢驗
4.2.1總體均值的假設檢驗
4.2.2正態總體比例的假設檢驗
4.2.3正態總體方差的假設檢驗
4.2.4正態性檢驗
4.2.5W檢驗
4.2.6EppsPulley檢驗
4.3兩個總體參數的假設檢驗
4.3.1兩個總體均值之差的假設檢驗
4.3.2兩個總體方差之比的區間估計
4.3.3兩個總體比例之差的檢驗
4.3.4總體比率或百分比的檢驗
4.4本章要點
本章小結
思考與練習
第5章R的基本數據分析與繪圖
5.1數據的直觀印象
5.1.1R的繪圖設備和檔案
5.1.2R的圖形組成、參數和邊界
5.2單變數分布特徵的直觀印象
5.2.1直方圖
5.2.2條形圖
5.2.3風向風速玫瑰圖
5.2.4餅圖
5.2.5莖葉圖
5.2.6箱線圖
5.2.7核密度圖
5.2.8小提琴圖
5.2.9棒棒糖圖
5.2.10克利夫蘭點圖
5.3多變數聯合分布的直觀印象
5.3.1等高線圖
5.3.2雷達圖
5.4變數間相關性的直觀印象
5.4.1馬賽克圖
5.4.2散點圖
5.4.3相關係數圖
5.5以鳶尾花數據集為例進行數據挖掘
本章小結
思考與練習
第6章R的空間數據可視化
6.1基於百度地圖的可視化REmap包
6.1.1remap( )函式
6.1.2remapB( )函式
6.2baidumap地圖包的使用
6.3熱力圖
6.4leaflet地圖包的使用
6.5ggmap地圖包的使用
6.5.1ggmap的工作原理
6.5.2get_map函式
本章小結
思考與練習
第7章R語言的文本數據挖掘套用
7.1文本挖掘的概述
7.2文本挖掘與數據挖掘的關係
7.3文本挖掘的首要步驟——分詞
7.4jiebaR分詞包及Rwordseg分詞包的安裝和使用
7.5文本挖掘tm包的安裝和使用——以《哈利·波特與密室》為例
7.5.1數據輸入——語料庫的構建
7.5.2使用tm_map()函式對語料庫進行預處理
7.5.3元數據查看與管理
7.5.4創建詞條文檔關係矩陣
7.5.5文檔距離的計算
7.6R的文本分類分析方法
7.6.1文本特徵提取——詞袋模型
7.6.2文本特徵選擇
7.6.3文本特徵向量
7.6.4基於統計的特徵提取方法(構造評估函式)
7.7LDA主題模型
7.7.1LDA模型涉及的先驗知識
7.7.2LDA模型的文檔生成過程
7.7.3小說《紅樓夢》的文本挖掘
7.8R的文本聚類分析方法
7.8.1層次聚類法
7.8.2kmeans聚類法
7.8.3K中心點聚類算法
7.8.4K近鄰分類算法
7.8.5支持向量機SVM算法
7.8.6基於R的文本聚類的套用——以《紅樓夢》為例進行說明
7.9用R包做詞頻統計圖(詞雲圖)
7.9.1常見詞雲圖繪製
7.9.22018年政府工作報告的詞雲圖
7.9.3小說《都挺好》詞雲圖繪製
7.9.4新華社新年獻詞的詞雲圖繪製
7.10小說《琅琊榜》文本的數據挖掘分析
7.11用R和Python實現關鍵字共現矩陣的構建
本章小結
思考與練習
參考文獻

相關詞條

熱門詞條

聯絡我們