數據科學(方匡南主編書籍)

書籍信息

作譯者：方匡南

出版時間：2018-07 千字數：531

版次：01-01 頁數：3312

開本：16開

裝幀：

I S B N ：9787121342448

換版：

所屬分類：科技 >> 計算機 >> 程式語言

內容簡介

本書是一本數據科學的入門書籍。每個知識點儘量從實際的套用案例出發，從數據出發，以問題為導向，在解決問題中學習數據挖掘、機器學習等數據科學相關方法。本書將數據讀寫、數據清洗和預處理作為開端，逐漸深入到和數據科學相關的決策樹、支持向量機、神經網路、無監督學習等知識。此外，結合數據科學的實際套用，書中還講解了推薦算法、文本挖掘和社交網路分析等熱門實用技術。本書在寫作過程中儘量刪去太過抽樣的理論，讓具有一定高等數學和機率論基礎的讀者就能看得懂。當然，如果讀者對方法原理確實不感興趣，只是為了用R程式實現某種方法，可以跳過方法只看案例和程式。本書適合作為高校數據科學、機器學習、數據挖掘、大數據分析等相關專業的研究生和高年級本科的教科書，也適合作為相關企業的數據科學家、數據挖掘工程師、數據分析師及數據科學的愛好者等的工具書。

圖書目錄

第1章導論 1

1.1 數據科學的發展歷史 1

1.2 數據科學研究的主要問題 3

1.3 數據科學的主要方法 5

1.4 R語言的優勢 7

第2章數據讀/寫 9

2.1 數據的讀入 9

2.1.1 直接輸入數據 9

2.1.2 讀入R包中的數據 10

2.1.3 從外部檔案讀入數據 10

2.1.4 批量讀入數據 15

2.1.5 R語言讀取檔案的幾個常錯的問題 15

2.2 寫出數據 17

2.3 習題 18

第3章數據清洗與預處理 19

3.1 數據分類 19

3.2 數據清洗 20

3.2.1 處理缺失數據 20

3.2.2 處理噪聲數據 23

3.3 數據變換 23

3.4 R語言實現 25

3.4.1 數據集的基本操作 25

3.4.2 數據集間的操作 28

3.4.3 連線資料庫數據 29

3.5 習題 30

第4章數據可視化 31

4.1 高階繪圖工具——ggplot2 31

4.1.1 快速繪圖 32

4.1.2 使用圖層構建圖像 34

4.1.3 分面 37

4.2 ECharts2 39

4.2.1 安裝 39

4.2.2 使用 40

4.3 習題 48

第5章線性回歸 49

5.1 問題的提出 49

5.2 一元線性回歸 50

5.2.1 一元線性回歸概述 50

5.2.2 一元線性回歸的參數估計 52

數據科學(方匡南主編書籍)

書籍信息

內容簡介

圖書目錄

相關詞條

熱門詞條