《大數據分析R基礎及套用》是2016年清華大學出版社出版的圖書,作者是深圳國泰安教育技術股份有限公司、中科院深圳先進技術研究院-國泰安金融大數據研究中心。
基本介紹
- 書名:大數據分析:R基礎及套用
- 作者:深圳國泰安教育技術股份有限公司、國泰安金融大數據研究中心、中科院深圳先進技術研究院
- 出版時間:2016年3月1日
- 定價:49 元
- 開本:16 開
- 裝幀:平裝
- ISBN:9787302428633
- 印次:1-1
- 用紙:膠版紙
圖書目錄
第一部分大數據簡介
第1章大數據概述
1.1大數據的概念
1.2大數據的特徵
1.3大數據的產生
1.4大數據套用案例
第2章大數據相關技術
2.1數據採集和準備
2.2分散式資料庫
2.3分散式數據分析框架
2.3.1Hadoop
2.3.2HDFS
2.3.3HBase
2.3.4Hive
2.3.5MapReduce
2.3.6Strom
2.4大數據分析與R
2.4.1RHadoop
2.4.2RHIPE
2.4.3RHive
2.4.4RHBase
2.5國泰安的大數據
2.5.1大數據實驗室建設
2.5.2大數據分析平台
第二部分R語言
第3章R語言簡介
3.1R語言概述
3.2R的下載、安裝和使用
3.2.1RGui界面
3.2.2RStudio界面
3.2.3R的運行
3.2.4工作目錄和工作空間
3.2.5R語言的幫助
3.3R的包
3.3.1包的獲取
3.3.2包的安裝
3.3.3包的載入
3.3.4包的使用
第4章R語言基本操作
4.1數據結構
4.2數據的基本操作
4.2.1賦值和創建
4.2.2數據的運算
4.2.3數據的導入
4.3數據的管理
4.3.1數據排序
4.3.2數據集的合併
4.3.3剔除變數
4.3.4數據集提取
4.3.5subset函式
4.4常用函式
第5章R語言繪圖
5.1繪圖參數
5.1.1符號、線條與顏色
5.1.2標題、坐標軸與圖例
5.1.3文本屬性
5.1.4圖形的組合
5.2高級繪圖函式
5.2.1通用二維圖
5.2.2餅圖
5.2.3箱線圖
5.2.4條形圖
5.2.5直方圖
5.2.6核密度圖
5.2.7點圖
5.3低級繪圖函式
第6章R語言數據分析
6.1數據處理基礎函式
6.1.1數學函式
6.1.2統計函式
6.1.3機率函式
6.1.4數據分析實例
6.2描述性統計分析
6.2.1描述統計函式
6.2.2軟體包的描述統計
6.3多元統計分析
6.3.1方差分析
6.3.2判別分析
6.3.3聚類分析
6.3.4主成分分析
6.3.5因子分析
6.3.6典型相關分析
第三部分專題實證研究
第7章金融時間序列建模專題
7.1金融時間序列
7.2ARMA模型
7.2.1ARMA模型簡介
7.2.2ARMA模型定階
7.2.3ARMA模型擬合
7.3GARCH模型
7.3.1GARCH模型簡介
7.3.2GARCH模型擬合
第8章動態面板數據專題
8.1GMM估計
8.1.1系統GMM估計
8.1.2GMM估計原理
8.2動態面板數據模型的系統GMM估計
第9章數據挖掘專題
9.1關聯規則
9.2降維分析
9.3社交網路分析
9.4貝葉斯分類法
9.4.1貝葉斯定理
9.4.2貝葉斯分類實例
9.5決策樹
9.5.1決策樹原理
9.5.2決策樹分類實例
9.6人工神經網路
9.6.1三層前饋神經網路原理
9.6.2神經網路分類實例
9.7支持向量機
9.7.1支持向量機原理
9.7.2支持向量機分類實例
第10章信息可視化專題
10.1繪製地圖
10.1.1世界地圖
10.1.2中國地圖
10.1.3公路線圖
10.2可視化實例
10.2.1數據
10.2.2ggmap
第四部分RHadoop案例分析
第11章RHadoop的基本操作
11.1數據檔案的讀取
11.2包的載入
11.3基本函式
第12章RHadoop環境下案例分析
12.1回歸分析
12.1.1回歸分析原理
12.1.2線性回歸分析案例
12.2Logistic分析
12.2.1Logistic分析原理
12.2.2Logistic分析案例
12.3判別分析
12.3.1線性判別分析原理
12.3.2線性判別分析案例
12.4聚類分析
12.4.1Kmeans聚類分析原理
12.4.2Kmeans聚類分析案例
12.5主成分分析
12.5.1主成分分析原理
12.5.2主成分分析案例
12.6因子分析
12.6.1因子分析原理
12.6.2因子分析案例
12.7商品推薦算法
12.7.1商品推薦算法原理
12.7.2商品推薦案例
12.8差異分析
12.8.1多維標度法的原理
12.8.2差異分析案例
附錄一國泰安CSMAR數據下載
附錄二深圳國泰安教育技術股份有限公司簡介
參考文獻