R語言數據分析與挖掘

R語言數據分析與挖掘

《R語言數據分析與挖掘》是一本2020年出版的圖書,由西安電子科技大學出版社出版

基本介紹

  • 中文名:R語言數據分析與挖掘
  • 作者:編者:陳維|責編:何雪梅//孟秋黎
  • 出版時間:2020年
  • 出版社:西安電子科技大學出版社
  • ISBN:9787560657905
  • 開本:16 開
  • 裝幀:平裝
內容簡介,圖書目錄,

內容簡介

現在,越來越多的人考慮引入大數據技術來促進公司產品的銷售以獲得更多的利潤。而學習算法能夠讓商務活動及其發展過程的預測擺脫人腦計算能力的局限,並且能提高數據模型的預測精確度,使得大數據的分析處理在依託計算機的大規模計算能力下得以完成。
當前數據分析*常用的工具就是R語言,本書深入淺出地介紹了利用R語言進行數據分析及構建預測模型的多種實用方法,包括回歸、聚類、關聯和分類分析等常用學習算法的實現,每一種算法都通過具體案例詳細說明構建模型、實現模型以及評價模型的過程。本書還系統講解了相關的R語言的基礎知識,包括環境準備以及數據轉換、分析和結果可視化的方法等。
本書融合了作者十幾年來利用數據分析算法來完成數據挖掘方面的諸多心得,並且書中所有的原始碼和實驗數據在配套的網站上可以免費下載,包括習題和答案也都可以下載。閱讀完本書並親自動手完成書中所有算法案例後,讀者將對數據分析有更深入的了解,設計學習算法來發現隱藏在數據中有價值的模式也不再是遙不可及的目標。
本書既可以作為相關專業數據分析的教材,也可以作為大數據網路培訓或技術人員自學的參考資料。

圖書目錄

第1章 初識數據分析與R語言
1.1 軟體下載與安裝
1.1.1 下載和安裝
1.1.2 下載和安裝RStudio
1.2 包的安裝和載入
1.3 套用R實現數據操作
1.3.1 數據讀寫
1.3.2 數據基本操作
1.3.3 套用簡單統計
1.3.4 數據可視化
習題
第2章 回歸分析
2.1 簡單線性回歸分析
2.1.1 調用lm函式構建簡單線性回歸模型
2.1.2 輸出線性模型的特徵信息
2.1.3 使用線性回歸模型預測未知數
2.1.4 生成模型的診斷圖
2.2 多項式回歸分析
2.2.1 利用lm函式生成多項式回歸模型
2.2.2 調用rlm函式生成穩健線性回歸模型
2.3 在SLID數據集上研究線性回歸案例
習題
第3章 關聯分析
3.1 關聯分析的準備工作
3.1.1 將數據轉換成事務數據
3.1.2 展示事務及其關聯
3.2 Apriori規則
3.2.1 使用Apriori規則完成關聯挖掘
3.2.2 去掉冗餘規則
3.3 關聯規則可視化
3.4 Eclat挖掘
3.4.1 使用Eclat挖掘頻繁項集
3.4.2 生成時態事務數據
3.5 使用cSPADE挖掘頻繁時序模式
習題
第4章 聚類分析
4.1 層次聚類
4.1.1 使用層次聚類處理數據
4.1.2 將樹分成簇
4.2 k均值聚類
4.2.1 使用k均值方法處理數據
4.2.2 繪製二元聚類圖
4.3 聚類算法比較
4.4 聚類效果評估
4.4.1 從簇中抽取輪廓信息
4.4.2 獲得最佳化的k值聚類
4.5 使用密度聚類方法處理數據
習題
……
第5章 決策樹
第6章 神經網路與支持向量機
第7章 模型評估
附錄 習題庫
參考文獻

相關詞條

熱門詞條

聯絡我們