計算機科學叢書：數據挖掘與R語言

內容簡介

《計算機科學叢書:數據挖掘與R語言》的支持網站給出了案例研究的所有代碼、數據集以及R函式包，不要求讀者具有R、數據挖掘或統計技術的基礎知識。《計算機科學叢書:數據挖掘與R語言》利用大量給出必要步驟、代碼和數據的具體案例，詳細描述了數據挖掘的主要過程和技術。

作者簡介

作者：（葡萄牙）托爾戈（Luís Torgo）譯者：李洪成陳道輪吳立明

托爾戈（Luís Torgo），葡萄牙波爾圖大學計算機科學系副教授，現在在LIAAD實驗室從事研究工作。他是APPIA會員，同時還是OBEGEF的創辦會員。

圖書目錄

出版者的話

推薦序

中文版序

譯者序

前言

致謝

第1章簡介

1.1如何閱讀本書

1.2R簡介

1.2.1R起步

1.2.2R對象

1.2.3向量

1.2.4向量化

1.2.5因子

1.2.6生成序列

1.2.7數據子集

1.2.8矩陣和數組

1.2.9列表

1.2.10數據框

1.2.11構建新函式

1.2.12對象、類和方法

1.2.13管理R會話

1.3MySQL簡介

第2章預測海藻數量

2.1問題描述與目標

2.2數據說明

2.3數據載入到R

2.4數據可視化和摘要

2.5數據缺失

2.5.1將缺失部分剔除

2.5.2用最高頻率值來填補缺失值

2.5.3通過變數的相關關係來填補缺失值

2.5.4通過探索案例之間的相似性來填補缺失值

2.6獲取預測模型

2.6.1多元線性回歸

2.6.2回歸樹

2.7模型的評價和選擇

2.8預測7類海藻的頻率

2.9小結

第3章預測股票市場收益

3.1問題描述與目標

3.2可用的數據

3.21在R中處理與時間有關的數據

3.22從CSV檔案讀取數據

3.23從網站上獲取數據

3.24從MySQL資料庫讀取數據

3.3定義預測任務

3.3.1預測什麼

3.3.2預測變數是什麼

3.3.3預測任務

計算機科學叢書：數據挖掘與R語言

基本介紹

內容簡介

作者簡介

圖書目錄

相關詞條

熱門詞條