基於Rattle的可視化數據挖掘技術

內容簡介

數據挖掘技術近年來發展異常迅猛，已成為大數據時代最熱門的技術和研究熱點，不僅產生了大量不同類型、功能強大的數據挖掘算法，而且推動了眾多數據挖掘工具軟體的發展。在這些軟體中，R語言是數據挖掘領域最重要的軟體之一。Rattle是一種用於數據挖掘的R語言的圖形互動界面，或稱為可視化數據挖掘工具。Rattle給出了從數據整理到模型評價的完整解決方案。

本書主要介紹如何用Rattle包進行數據挖掘，全書共9章，通過大量精選實例，循序漸進、全面系統地講述數據挖掘過程。

本書不僅是從事數據挖掘和大數據分析工程技術人員開發相關係統的技術資料，也可作為學習數據挖掘和大數據分析等課程的參考用書。

圖書目錄

第1章緒論1

1.1數據挖掘的認識1

1.1.1為什麼要進行數據挖掘1

1.1.2數據挖掘過程1

1.1.3數據挖掘九大定律3

1.2R與Rattle3

1.2.1R語言3

1.2.2R語言的基本語法4

1.2.3R語言的優勢10

1.2.4Rattle包10

1.3本章小結12

第2章入門指南13

2.1概述13

2.2認識Rstudio13

2.2.1Rstudio的界面13

2.2.2R腳本編輯區14

2.2.3R命令控制台15

2.2.4工作空間16

2.2.5結果展示區18

2.3認識Rattle20

2.3.1Rattle的安裝與啟動20

2.3.2選項卡21

2.3.3工具列24基於Rattle的可視化數據挖掘技術2.3.4選單欄24

2.3.5屬性面板26

2.4本章小結26

第3章數據準備28

3.1概述28

3.2數據28

3.2.1術語28

3.2.2變數29

3.2.3數據集30

3.3可用數據30

3.4數據質量31

3.4.1數據質量概述31

3.4.2數據質量評估維度31

3.4.3影響數據質量的因素31

3.5數據匹配32

3.6數據倉庫33

3.7數據訪問34

3.8載入數據35

3.8.1載入CSV數據35

3.8.2載入資料庫36

3.8.3載入SPSS類型數據38

3.8.4載入自帶數據集38

3.8.5載入網頁數據38

3.8.6載入其他格式的數據39

3.9本章小結39

第4章數據理解41

4.1概述41

基於Rattle的可視化數據挖掘技術

基本介紹

內容簡介

圖書目錄

相關詞條

熱門詞條