探尋數據背後的邏輯：R語言數據挖掘之道

內容簡介

數據分析、數據挖掘的本質是探尋數據背後的邏輯，挖掘人們的欲望、需求、態度等。本書不僅僅教會讀者如何掌握數據挖掘相關技能，更教會讀者如何從數據挖掘結果中分析出更深層次的邏輯。本書主要介紹使用R語言進行數據挖掘的過程。具體內容包括R軟體的安裝及R語言基礎知識、數據探索、數據可視化、回歸預測分析、時間序列分析、算法選擇流程及十大算法介紹、數據抓取、社交網路關係分析、情感分析、話題模型、推薦系統，以及數據挖掘在生物信息學中的套用。另外，本書還介紹了R腳本最佳化相關內容，使讀者的數據挖掘技能更上一層樓。本書適合從事數據挖掘、數據分析、市場研究的工作者及學生群體，以及對數據挖掘和數據分析感興趣的初級讀者。

圖書目錄

第1章萬事不只開頭難 1

1.1 工欲善其事，必先利其器：安裝 1

1.1.1 安裝R和RStudio 1

1.1.2 安裝數據包 3

1.1.3 數據包載入、卸載、升級，查看幫助文檔 5

1.1.4 什麼樣的R包值得相信 7

1.2 了解R的對象 8

1.2.1 如何進行常見的算術運算 8

1.2.2 R語言的三大數據類型 10

1.2.3 向量及其運算 12

1.2.4 因子變數鮮有人知的秘密 15

1.2.5 矩陣相關運算及神奇的特徵值 17

1.2.6 數據框及其篩選、替換、添加、排序、去重 18

1.2.7 與數組（array）相比，表單（list）的用處更加廣泛 22

1.2.8 如何進行數據結構之間的轉化 23

1.3 R語言的重器：函式 26

1.3.1 自編函式 26

1.3.2 有用的R字元串函式 29

1.4 控制流在R語言裡只是一種輔助工具 31

1.4.1 判斷 32

1.4.2 循環 33

1.5 數據的讀入與輸出 35

1.5.1 常見數據格式的輸入/輸出（CSV、TXT、RDATA、XLSX） 35

1.5.2 資料庫連線：Oracle、MySQL及Hive 37

1.5.3 亂碼就像馬賽克一樣讓人討厭 39

第2章數據探索，招招都是利器 41

2.1 不要在工作後才認識“髒數據” 41

2.1.1 以老闆信服的方式處理缺失數據 42

2.1.2 異常值預警 48

2.1.3 字元處理正則表達式不再是天書 49

探尋數據背後的邏輯：R語言數據挖掘之道

基本介紹

內容簡介

圖書目錄

相關詞條

熱門詞條