R統計與數據可視化:社會科學數據分析實踐(全彩)

R統計與數據可視化:社會科學數據分析實踐(全彩)

《R統計與數據可視化:社會科學數據分析實踐(全彩)》是電子工業出版社出版圖書,作者是【美】David S. Brown

用真實的數據,探討大量社會科學領域的議題和問題;用完整的R代碼,助力讀者無門檻學習數據分析和可視化

基本介紹

  • 中文名:R統計與數據可視化:社會科學數據分析實踐(全彩)
  • 作者:【美】David S. Brown
  • 譯者:李嘉平
  • 出版時間:2023年9月
  • 出版社:電子工業出版社
  • 頁數:504 頁
  • ISBN:9787121461910
  • 定價:169 元
  • 開本:16 開
內容簡介,圖書目錄,作者簡介,

內容簡介

本書用大量案例輔以數據可視化,將統計學知識融匯其中,循循善誘,幫助讀者避坑排雷,培養正確的數據分析思維方式。

圖書目錄

第1章  入門指南 001
概述 001
R、RStudio 和R Markdown 002
對象與函式 004
RStudio 入門 006
RStudio 的R Markdown 導覽 012
R Markdown 檔案與R 腳本 017
小練習 019
第2章  數據分析導論 027
概述 027
數據分析的動機 028
大數據越來越大 028
數據分析是一項有市場需求的技能 029
數據分析是一種公益 030
數據分析的構成要素 031
描述數據並形成假設 033
假設一:民族語言碎片化 034
假設二:女性選舉權 040
假設三:人力資本 046
假設四:政治穩定 048
模型的構建與估計 052
診斷 054
結果的穩定性 054
殘差圖 056
提出下一個問題 059
第3章  描述數據 064
概述 064
數據集和變數 066
不同類型的變數 068
連續變數 069
分類變數 069
有序分類變數 070
描述數據可以節省時間和精力 073
數據的形狀 073
數據的極差 077
辨識困惑、問題、假設和線索 079
困惑和問題:重要的區別 079
描述數據以改進問題 081
描述數據披露了更多線索 084
度量 086
有效性 086
可靠性 088
第4章  集中趨勢和離散程度 093
概述 093
集中趨勢的度量:眾數、平均數和中位數 094
眾數 095
平均數 096
中位數 100
平均數與中位數 103
離散程度的度量:極差、四分位距和標準差 106
極差 107
四分位距 109
標準差 110
四分位距與標準差 116
關於方差的說明 117
第5章  數據的單變數和雙變數描述 123
概述 123
好的、差的和離群值 124
單變數數據的5 種視圖 125
頻率表 126
條形圖 127
箱線圖(或盒須圖) 128
直方圖 131
莖葉圖 135
變數間是否相關 138
散點圖 139
箱線圖(雙變數) 145
馬賽克圖 145
交叉表 148
氣泡圖 148
第6章  數據變換 157
概述 157
數據變換的理論原因 158
變換數據確保符合理論 158
數據和問題都要變換以相互匹配 159
數據變換的實際原因 160
數據變換——從連續變數到分類變數 164
數據變換——改變類別 169
Box-Cox 變換 175
第7章  數據展示的一些原則 186
概述 186
一些風格要素 187
消除雜亂 188
聚焦 190
整合圖文 192
一圖應該勝千言 195
了解客群 201
了解目的:解釋性、探索性或信息性 203
故事的基本要素 208
文檔(樹立講述者的可信度) 209
建立直覺(設定背景) 211
展示因果關係(旅程) 211
從因果到行動(決議) 213
第8章  機率論精要 218
概述 218
總體和樣本 219
樣本偏差與隨機樣本 220
大數定律 222
大數定律的可視化 223
中心極限定理 227
平均數的抽樣分布隨著n 的增加而接近常態分配 228
和的抽樣分布是正態的 230
從常態分配中抽取時的觀測數量 231
中心極限定理的一個有用性質 232
從不同的分布中抽樣 233
標準常態分配 239
標準常態分配與臨界z 分數 242
第9章  置信區間與假設檢驗 250
概述 250
大樣本的置信區間 251
求總體比例 251
求總體平均數 256
小樣本與t- 分布 260
自由度 263
小樣本的樣本標準差 264
用小樣本構建置信區間 269
例子:女性薪酬與男性薪酬 270
比較兩個樣本的平均數 272
例子:兩個群體和兩種收入 273
例子:種族和對警察的看法 275
例子:收入和對特朗普的支持 275
置信水平 277
關於統計推斷和因果關係的簡要說明 280
第10章  進行比較 285
概述 285
為什麼要進行比較 286
需要比較的問題 287
比較兩個分類變數 289
例子:對警察的看法 289
例子:哪些人去教堂 292
比較連續變數和分類變數 294
例子:歐巴馬情感量表 294
比較兩個連續變數 297
例子:性別與教育 297
例子:性別與政策制定 298
探索性數據分析:調查美國的墮胎率 301
重述要點 303
好的分析引出新的問題 308
第11章  受控比較 312
概述 312
什麼是受控比較 313
比較兩個分類變數,同時控制第三個變數 314
例子:對警察的看法 314
例子:對移民的看法 320
比較兩個連續變數,同時控制第三個變數 327
例子:嬰兒死亡率 328
例子:兇殺率 331
論點與受控比較 334
第12章  線性回歸 340
概述 340
線性回歸的優點 341
線性回歸中的斜率和截距 342
對斜率和截距的解讀 343
例子:選民投票率和教育 343
擬合優度(R2 統計量) 348
統計顯著性 352
計算t- 比率 353
二元回歸的例子 355
一個州的宗教信仰水平是否會影響墮胎率 356
宗教信仰是否會影響槍枝法案 358
暴力會導致政治不穩定嗎 359
收入(人均 GDP)與投票率有關嗎 361
第13章  多元回歸 368
概述 368
什麼是多元回歸 369
為什麼要使用多元回歸 370
回歸模型和論點 371
回歸模型、理論和證據 372
解讀多元回歸中的估計值 376
實質顯著性 376
統計顯著性 377
擬合優度:R2 378
例子:兇殺率與教育 379
理論 379
描述數據 380
估計 384
經驗蘊涵 386
討論 389
第14章  虛擬變數和互動作用 394
概述 394
什麼是虛擬變數 395
加性模型與互動作用模型 396
二元虛擬變數回歸 397
多元回歸與虛擬變數 398
多元回歸中的互動作用 398
例子:伯尼· 桑德斯,教育和收入 400
例子:外援,人均GDP 和民主 405
第15章  診斷1 :普通最小二乘法是否適用 412
概述 412
回歸分析中的診斷 413
統計量與估計量的性質 414
高斯- 馬爾可夫假設 419
殘差圖 425
第16章  診斷2 :殘差、槓桿值與影響力的度量 438
概述 438
離群值 439
槓桿值 442
影響力的度量 448
庫克距離 448
dfbeta 449
增加變數圖 454
第17章  邏輯回歸 461
概述 461
需要邏輯回歸解決的議題與難題 462
邏輯回歸違反了高斯- 馬爾可夫假設 463
使用對數發生比 466
使用預測機率 469
二元邏輯回歸 469
多元邏輯回歸 471
例子:2012 年歐巴馬贏得的選舉人團 472
邏輯回歸模型擬合 475
例子:歐巴馬,收入和教育 475
接收者操作特徵曲線和曲線下面積 476
附錄A  形成經驗蘊涵 488

作者簡介

David S. Brown(戴維·S.布朗):科羅拉多大學博爾德分校政治學教授和社會科學系主任。獲得了加利福尼亞大學洛杉磯分校的政治學博士學位,並且是科羅拉多大學博爾德分校行為科學研究所肯尼斯·博爾丁(他開闢了多個經濟學和社會科學研究領域)的首屆博士後研究員。在加入科羅拉多大學政治學系之前,他曾在萊斯大學擔任助理教授。他研究的是比較政治學,側重於體制及其對經濟發展的影響。他的研究成果已發表在《美國政治科學評論》(American Political Science Review)、《美國政治學期刊》(American Journal of Political Science)、《英國政治學期刊》(British Journal of Political Science)和《美國地理學家協會年鑑》(Annals of the Association of American Geographers)上。
譯者簡介
李嘉平:曾在華大基因從事生物信息分析相關工作,就職於廣西醫科大學第一附屬醫院(廣西心腦血管疾病防治精準醫學重點實驗室)。他是R布道師,希望能夠通過翻譯傳播和推廣R的套用與價值;亦是R鐵桿用戶,具有豐富的生物信息分析經驗,擅長使用R和Python進行各類數據處理以及數據可視化。曾負責生物信息培訓中所有R相關課程的設計與授課。對新技術始終抱有極大的熱情,喜歡去體驗那些仍不完善但有前景的新技術,並享受這個過程帶來的樂趣與啟發。

相關詞條

熱門詞條

聯絡我們