R語言數據可視化實戰

R語言數據可視化實戰

《R語言數據可視化實戰》一書由米霖編寫而成,由機械工業出版社出版。

基本介紹

  • 中文名:R語言數據可視化實戰 
  • 作者:米霖
  • 出版社機械工業出版社
  • 出版時間:2020年
  • 頁數:572 頁
  • 定價:169 元
  • 開本:16 開
  • 裝幀:平裝
  • ISBN:9787111667919
內容簡介,圖書目錄,作者簡介,名人推薦,

內容簡介

數據可視化是一種非常重要的技能。R語言是一種非常好的數據可視化工具。本書結合大量實例,全面介紹如何利用R語言繪製各種統計圖形,涵蓋普通統計圖形的繪製、高級統計圖形的繪製、互動式圖形的繪製及動畫圖形的繪製等。本書中的所有統計圖形都給出了實例原始碼,讀者可以通過代碼進行復現。
《R語言數據可視化實戰》共分為13章,涵蓋的主要內容有:R語言數據可視化簡介,數據處理與探索,數據可視化,單變數圖形繪製,兩個同類型變數的圖形繪製,分類變數和連續變數的圖形繪製,高維圖形繪製,其他圖形繪製,圖形元素、標題和圖例繪製,顏色等參數的調整,合併多幅圖形,R語言繪圖包,Shiny工具包。《R語言數據可視化實戰》語言通俗易懂,案例豐富,實用性強,特別適合R語言數據可視化的入門與進階讀者閱讀,也適合其他數據科學從業者閱讀。另外,本書還可作為統計學、計算機、機器學習和數學等相關專業本科生及研究生的參考讀物。

圖書目錄

前言
第1章 R語言數據可視化簡介 1
1.1 R語言介紹 1
1.1.1 向量 3
1.1.2 列表 3
1.1.3 矩陣 4
1.1.4 數組 5
1.1.5 因子 5
1.1.6 數據框 6
1.1.7 for循環7
1.1.8 條件判斷 8
1.1.9 函式 9
1.2 Rstudio介紹 12
1.3 R包介紹 13
1.4 R語言數據讀取 14
1.4.1 讀取Excel數據 15
1.4.2 讀取SPSS、SAS和STATA數據 17
1.5 ggplot2介紹 18
1.5.1 使用qplot函式快速繪圖 19
1.5.2 使用ggplot函式繪圖 20
1.6 統計圖形 22
1.6.1 散點圖 22
1.6.2 箱線圖 24
1.6.3 小提琴圖 25
1.6.4 條形圖 27
1.6.5 和弦圖 28
1.6.6 桑基圖 30
1.6.7 棒棒糖圖 31
1.6.8 克利夫蘭點圖 32
1.6.9 藝術圖 34
1.7 tidyverse介紹 38
1.8 總結 41
第2章 數據處理與探索 42
2.1 數據轉換 42
2.1.1 篩選數據集的行 42
2.1.2 篩選數據集的列 46
2.1.3 數據排序及新變數生成 48
2.1.4 數據分組匯總 49
2.1.5 數據合併 50
2.2 數據重塑 54
2.2.1 數據聚合 55
2.2.2 數據分散 56
2.2.3 數據切割 57
2.2.4 數據合併 58
2.3 總結 59
第3章 數據可視化 60
3.1 ggplot2核心概念 60
3.1.1 散點圖 62
3.1.2 折線圖 64
3.1.3 條形圖 66
3.1.4 直方圖 68
3.1.5 密度圖 72
3.1.6 箱線圖 75
3.2 總結 79
第4章 單變數圖形繪製 80
4.1 面積圖 80
4.1.1 面積圖的繪製方式 82
4.1.2 繪製堆疊的面積圖 85
4.1.3 繪製比例堆疊面積圖 88
4.2 密度圖 90
4.2.1 基礎密度圖 95
4.2.2 繪製少量分組的密度圖 96
4.2.3 繪製大量分組的密度圖 101
4.2.4 密度圖的其他調整 103
4.3 直方圖 105
4.3.1 基礎直方圖 107
4.3.2 分組直方圖的繪製 109
4.3.3 合併直方圖與密度圖 111
4.4 頻率圖 113
4.5 總結 114
第5章 兩個同類型變數的圖形繪製 115
5.1 散點圖 115
5.1.1 繪製基礎散點圖 118
5.1.2 繪製分組散點圖 121
5.1.3 添加擬合曲線 127
5.1.4 在散點圖中添加地毯圖 130
5.1.5 在散點圖中添加文本 136
5.2 抖動點圖 140
5.3 連續二維分布圖 142
5.3.1 繪製二維直方圖 143
5.3.2 繪製六角直方圖 144
5.3.3 繪製二維密度直方圖 145
5.3.4 調整圖形配色 147
5.4 線圖 148
5.4.1 繪製基礎線圖 155
5.4.2 繪製連線圖 160
第6章 分類變數和連續變數的圖形繪製 163
6.1 箱線圖 163
6.1.1 繪製基礎箱線圖 174
6.1.2 調整參數 175
6.1.3 調整箱線圖組別的順序 176
6.1.4 調整顏色 183
6.1.5 構建分組箱線圖 191
6.1.6 調整箱線圖的寬度 193
6.1.7 構建連續變數的箱線圖 194
6.1.8 添加平均值 195
6.1.9 添加抖動點 196
6.2 小提琴圖 197
6.2.1 繪製基礎的小提琴圖 200
6.2.2 繪製水平的小提琴圖 201
6.2.3 在小提琴圖中添加箱線圖 203
6.3 棒棒糖圖 204
6.3.1 繪製分組的棒棒糖圖 209
6.3.2 繪製基礎棒棒糖圖 217
6.3.3 棒棒糖圖參數的調節 219
6.3.4 添加標註 224
6.4 條形圖 226
6.4.1 繪製基礎條形圖 229
6.4.2 改變條形圖寬度 235
6.4.3 添加誤差棒 235
6.5 圓形條形圖 241
6.5.1 繪製基礎圓形條形圖 250
6.5.2 添加標籤 252
6.5.3 圓形條形圖的更多調整 253
6.6 餅圖 259
6.6.1 繪製基礎餅圖 263
6.6.2 調整細節 264
6.6.3 添加標籤 265
6.7 甜甜圈圖 266
第7章 高維圖形繪製 270
7.1 氣泡圖 270
7.1.1 繪製基礎氣泡圖 274
7.1.2 控制氣泡的大小 275
7.1.3 設定顏色 276
7.1.4 調整更多的細節 277
7.1.5 繪製動態圖 279
7.2 三維散點圖 280
7.3 流型圖 282
7.3.1 繪製基礎流型圖 285
7.3.2 調整流型圖的偏移 286
7.3.3 調整流型圖的形狀與顏色 287
7.4 相關矩陣圖 288
7.5 樹狀圖 291
7.5.1 繪製基礎樹狀圖 295
7.5.2 繪製圓形樹狀圖 297
7.5.3 繪製聚類結果的樹狀圖 298
7.5.4 更多調整 302
7.6 圓形包裝圖 308
7.6.1 具有一個層次的圓形包裝圖 310
7.6.2 調整顏色 311
7.6.3 調整圓形之間的距離 315
7.6.4 繪製多層次的圓形包裝圖 315
7.6.5 調整細節 317
7.6.6 隱藏第一級 321
7.7 樹形圖 325
7.7.1 繪製基礎樹形圖 326
7.7.2 繪製帶有多個級別的樹形圖 327
7.7.3 自定義樹形圖 328
第8章 其他圖形繪製 332
8.1 和弦圖 332
8.1.1 繪製圓形圖 334
8.1.2 繪製基礎和弦圖 337
8.1.3 調整細節 340
8.2 桑基圖 343
8.3 網路圖 347
8.3.1 繪製基礎網路圖 356
8.3.2 調整網路圖的參數 358
8.3.3 網路圖布局 361
8.3.4 將變數映射到節點和連結特徵 362
8.3.5 使用網路圖可視化聚類結果 364
8.4 旭日圖 366
8.5 雷達圖 368
8.5.1 繪製雷達圖 374
8.5.2 繪製多組雷達圖 375
8.6 詞雲 376
8.6.1 繪製詞雲 378
8.6.2 調整顏色和背景顏色 379
8.6.3 調整形狀 381
8.6.4 調整單詞方向 382
8.7 平行圖 383
8.7.1 繪製基礎平行圖 389
8.7.2 自定義顏色、主題和外觀 390
8.8 時間序列圖 391
8.8.1 時間序列包dygraphs 396
8.8.2 時間序列熱圖 397
8.9 互動式圖形 399
8.9.1 散點圖 400
8.9.2 氣泡圖 401
8.9.3 面積圖 402
8.9.4 條形圖 404
8.9.5 餅圖 405
8.9.6 桑基圖 406
8.9.7 誤差棒圖 408
8.9.8 箱線圖 409
8.9.9 直方圖 411
8.9.10 二維直方圖413
8.9.11 二維輪廓直方圖414
8.9.12 小提琴圖 415
8.9.13 雷達圖416
8.9.14 熱圖 418
8.9.15 三維散點圖418
8.9.16 動畫圖420
8.9.17 調整圖形圖例 421
8.9.18 修改互動文本 422
8.10 動畫圖 423
8.10.1 繪製基礎動畫圖424
8.10.2 使用分面 425
8.10.3 動態變化圖形 426
第9章 圖形元素、標題和圖例繪製 429
9.1 添加圖形元素 429
9.2 主標題、軸標籤和圖例標題 432
9.2.1 改變標籤的外觀 434
9.2.2 修改圖例 436
9.2.3 修改圖例的位置和外貌 436
9.2.4 使用guides函式修改圖例 440
第10章 顏色等參數的調整 445
10.1 圖形顏色調整 445
10.1.1 使用單個顏色調整圖形 446
10.1.2 通過分組調整顏色 448
10.1.3 漸變或連續顏色455
10.2 點的形狀、顏色和大小的調整 457
10.3 線條類型調整 460
10.4 坐標軸範圍調整 462
10.5 坐標軸轉換 465
10.6 時間數據坐標軸 468
10.7 自定義標籤 471
10.8 圖形主題和背景顏色 477
10.9 自定義圖形的背景 480
10.10 刪除面板框線和格線線 481
10.11 ggthemes包 482
10.12 文本注釋 483
10.13 ggrepel包 485
10.14 添加直線 488
10.15 圖形翻轉和反向 490
10.16 分面 491
第11章 合併多幅圖形 499
11.1 合併多幅圖形到一張圖中 499
11.2 gridExtra包 502
11.3 添加邊際分布圖 505
11.4 在ggplot中插入一個外部圖形元素 506
第12章 R語言繪圖包 509
12.1 ggstatsplot包 509
12.2 ggfortify包 520
12.2.1 生存分析 520
12.2.2 時間序列圖521
12.2.3 密度圖523
12.2.4 時間序列預測圖524
12.2.5 聚類圖527
12.2.6 熱力圖530
12.2.7 主成分分析可視化 532
12.3 quantmod包 535
第13章 Shiny工具包 544
13.1 Shiny工具包簡介 544
13.2 Shiny App的基礎部分 548
13.3 Shiny示例 550
13.4 Shiny總結 553
13.5 製作一個Shiny程式 554
13.6 Shiny部署 556
……

作者簡介

米霖 畢業於國內知名的211院校,本科數學專業,研究生統計學專業。有8年以上的R語言項目開發經驗,擅長數據挖掘、機器學習和統計模型。曾經在網易雲課堂上線了多門R語言的相關課程,包括“Shiny初級教程”“R包開發”“H2O機器學習模型”“信用評分模型開發”“R語言文本挖掘”“金融數據分析”等,學員累計超過5000人。完成了多個數據挖掘項目、信貸中的信用評分項目和電商風控項目等,其中,廣告虛假流量識別項目通過對虛假流量數據的挖掘,幫助企業節省了上百萬元的行銷成本。

名人推薦

一圖勝千言。數據可視化可以更清晰、更直觀地展現數據中蘊含的信息,是數據科學的一個重要組成部分。R語言是數據分析和可視化的常用工具。目前市面上介紹R語言數據分析的書籍很多,而詳細且系統地介紹R語言數據可視化的書籍卻比較少,米霖的這本書做了有益嘗試。本書理論結合實踐,對圖形參數的含義及設定都做了詳細講解,讓讀者知其然也知其所以然。相信精讀本書,讀者能很好地通過圖形展示數據分析的結果。
——華中農業大學數學與統計學系副主任 李欣然
各行各業正朝著信息化、數位化和智慧型化的方向前進。數據作為一種資產越來越受到企業的重視,對其質量的探討也成為近幾年數據管理領域關注的熱點。在我看來,數據質量高低的關鍵在於它能否被各方理解和信任,因此如何準確地表達數據成了一個重要問題。R語言數據可視化為數據的直觀展現提供了可能。米霖的這本書順應市場需求,系統地介紹了R數據可視化的相關知識,值得每一個數據可視化技術愛好者細讀。
——原金蝶集團技術架構委員會主任/易伙科技CEO/博士 胡博
R語言是頗受歡迎的統計分析程式語言。R語言數據可視化對於人們理解數據有很大的幫助。無論是數據可視化的初學者還是從業人員,只要認真研讀本書並演練每一個實例,相信都能從書中獲得啟發,從而全面、系統、深入地理解R語言數據可視化技術的精髓。——華中農業大學理學院數學與信息科學系主任/教授 石峰

相關詞條

熱門詞條

聯絡我們