統計學基礎:透過數據看世界

《統計學基礎:透過數據看世界》是2023年機械工業出版社出版的圖書。

基本介紹

  • 中文名:統計學基礎:透過數據看世界
  • 出版時間:2023年9月1日
  • 出版社:機械工業出版社
  • ISBN:9787111732068
內容簡介,圖書目錄,

內容簡介

本書是一本以數據分析為基礎的面向統計學、數據科學等專業的統計學著作。本書的宗旨是為每個人提供數據分析方法,為了降低閱讀門檻,幾乎不涉及高等數學推導。通過本書的學習,你將學會批判性地思考數據,交流你的發現,並仔細評估他人的論點。
本書內容十分豐富,設定精心,書中提供了大量的案例、示例、圖、表、技術提示以及重點和難點警示標籤等,並通過T1-84圖形計算器、Excel、Minitab和StatCrunch展示了大量實際套用。每章末配有數據項目、本章回顧練習和練習指導。主要內容包括:數據導論、圖形可視化變異、中心和變 異的數值匯總統計量、回歸分析、機率、隨機事件機率模型、調查抽樣與推斷、總體比例的假設 檢驗、推斷總體均值以及分類變數研究與科研文獻閱讀。

圖書目錄

前言
第1章 數據導論 1
1.1 什麼是數據 2
1.2 數據分類與存儲 5
1.2.1 變數類型 6
1.2.2 分類數據的數字編碼 7
1.2.3 數據存儲 8
1.3 數據調查 10
1.4 分類數據的組織 14
1.5 數據收集與因果關係識別 18
1.5.1 逸事 19
1.5.2 觀察性研究 20
1.5.3 對照實驗 22
1.5.4 樣本量 22
1.5.5 隨機分配 22
1.5.6 盲法 23
1.5.7 安慰劑 24
1.5.8 結論推廣 25
1.5.9 新聞中的統計 26
數據項目:下載和上傳數據 28
本章回顧 30
練習 32
練習指導 46
第2章 圖形可視化變異 48
2.1 數值數據變異的可視化 49
2.1.1 點圖 51
2.1.2 直方圖 51
2.1.3 莖葉圖 54
2.2 數值分布重要特徵匯總 55
2.2.1 形狀 56
2.2.2 中心 60
2.2.3 變異性 62
2.2.4 分布的描述 64
2.3 分類變數變異的可視化 64
2.3.1 條形圖 65
2.3.2 餅圖 67
2.4 分類分布的匯總 68
2.4.1 眾數 68
2.4.2 變異性 69
2.4.3 分類變數分布的描述 70
2.5 解釋圖表 72
2.5.1 誤導性圖表 72
2.5.2 統計圖形的未來 73
數據項目:提出問題 75
本章回顧 76
練習 78
練習指導 96
技術提示 97
第3章 中心和變異的數值匯總統計量 103
3.1 對稱分布的匯總統計量 104
3.1.1 均值:中心的平衡點度量 104
3.1.2 標準差:變異性的度量 109
3.2 經驗法則與z分數:異常現象的度量 114
3.2.1 經驗法則 114
3.2.2 z分數:與均值距離的度量 117
3.3 偏態分布的匯總統計量 119
3.3.1 中位數:中心的另一種度量 120
3.3.2 四分位距:變異性的度量 122
3.3.3 全距:變異性的另一種度量 126
3.4 度量中心的方法比較 126
3.4.1 分布圖的形狀 126
3.4.2 異常值的影響 128
3.4.3 多峰分布的中心與離散程度 129
3.4.4 不同分布的比較 130
3.5 箱線圖 131
3.5.1 潛在異常值分析 134
3.5.2 水平箱線圖與豎直箱線圖 135
3.5.3 基於箱線圖比較分布 135
3.5.4 使用箱線圖的注意事項 136
3.5.5 五數概括法 136
數據項目:統計調查周期 139
本章回顧 140
練習 142
練習指導 165
技術提示 166
第4章 回歸分析:探究變數的相關性 172
4.1 變異性的可視化:散點圖 173
4.1.1 趨勢 173
4.1.2 強度 175
4.1.3 形狀 175
4.1.4 變數相關性 176
4.1.5 關於回歸的統計問題 177
4.2 相關性的強度度量 178
4.2.1 相關係數可視化 178
4.2.2 相關係數:基於情境 180
4.2.3 相關性與因果關係 181
4.2.4 相關係數的計算 182
4.2.5 相關係數的意義 184
4.3 對線性趨勢建模 187
4.3.1 回歸線 187
4.3.2 解釋回歸線 192
4.4 線性模型的評估 199
4.4.1 建模誤區 199
4.4.2 決定係數r2:擬合優度的度量 203
數據項目:數據遷移 206
本章回顧 209
練習 210
練習指導 237
技術提示 238
第5章 機率:用模型解釋隨機性 243
5.1 什麼是隨機性 244
5.2 理論機率的計算 248
5.2.1 理論機率的性質 248
5.2.2 等可能結果的理論機率 249
5.2.3 積事件與和事件 252
5.2.4 和事件 253
5.2.5 互斥事件 255
5.3 分類變數的相關性 257
5.3.1 條件機率 258
5.3.2 獨立事件與相關事件 261
5.3.3 判斷事件是否獨立 263
5.3.4 獨立事件序列與相關事件序列 264
5.4 經驗機率與模擬機率的計算 269
5.4.1 模擬的設計 270
5.4.2 模擬的步驟 271
5.4.3 大數定律 272
5.4.4 大數定律的內涵 275
數據項目:構造數據子集 276
本章回顧 277
練習 279
練習指導 302
技術提示 303
第6章 隨機事件機率模型:正態模型
與二項模型 306
6.1 隨機實驗模型:機率分布 307
6.1.1 離散機率分布:表格或圖表 308
6.1.2 離散機率分布:公式 309
6.1.3 連續機率:機率密度曲線下方的
面積 311
6.1.4 計算連續值結果的機率 311
6.2 正態模型 312
6.2.1 常態分配可視化 313
6.2.2 計算正態機率 315
6.2.3 用軟體計算機率 316
6.2.4 不用統計軟體:用經驗法則 318
6.2.5 不用統計軟體:標準正態 320
6.2.6 根據常態分配的分位數計算
度量值 323
6.2.7 正態模型的適用性 326
6.3 二項模型 326
6.3.1 二項分布可視化 329
6.3.2 計算二項機率 330
6.3.3 計算(稍微)複雜的機率 332
6.3.4 二項分布的形狀:中心與離散
程度 335
6.3.5 抽樣調查:二項模型的套用 337
數據項目:生成隨機數 339
本章回顧 341
練習 343
練習指導 363
技術提示 364
第7章 調查抽樣與推斷 371
7.1 通過調查了解世界 372
7.1.1 調查術語 372
7.1.2 調查偏差 375
7.1.3 簡單隨機抽樣 377
7.2 度量調查質量 380
7.2.1 模擬與估計量 381
7.2.2 偏差與標準誤差的計算 387
7.2.3 現實生活:我們只有一次機會 388
7.3 樣本比例的中心極限定理 389
7.3.1 中心極限定理的適用條件 389
7.3.2 中心極限定理適用條件的檢驗 391
7.3.3 中心極限定理的套用 391
7.4 估計總體比例的置信區間 395
7.4.1 設定置信水平 396
7.4.2 設定誤差範圍 397
7.4.3 現實檢驗:在p未知的情況下計算
置信區間 399
7.4.4 解釋置信區間 400
7.4.5 研究籌備:計算所需的樣本量 403
7.5 基於置信水平比較總體比例 404
7.5.1 有什麼區別 404
7.5.2 兩個總體比例的置信區間 406
7.5.3 檢查適用條件 407
7.5.4 解釋兩個比例之差的置信區間 409
7.5.5 隨機分配與隨機抽樣 410
數據項目:編碼類別 412
本章回顧 414
練習 416
練習指導 434
技術提示 436
第8章 總體比例的假設檢驗 440
8.1 假設檢驗的基本要素 441
8.1.1 核心要素:一對假設 442
8.1.2 另一個要素:犯錯 445
8.1.3 增加一個要素:檢驗統計量 446
8.1.4 最後一個必不可少的要素:意想
不到的結果 448
8.1.5 假設檢驗與數據周期:提出問題 450
8.2 假設檢驗的四步法 450
8.2.1 步驟詳解 451
8.2.2 四步法 455
8.3 假設檢驗:詳細說明 459
8.3.1 檢驗統計量的值:極端情況 459
8.3.2 z統計量抽樣分布:條件不滿足的
解決方案 461
8.3.3 平衡兩類錯誤 461
8.3.4 統計顯著性與實際意義 463
8.3.5 不要改變假設 463
8.3.6 假設檢驗的邏輯 464
8.3.7 置信區間與假設檢驗 465
8.4 比較兩個總體的比例 467
8.4.1 更改要素:假設 467
8.4.2 更改要素:檢驗統計量 468
8.4.3 更改要素:檢查條件 470
數據項目:日期數據 475
本章回顧 477
練習 480
練習指導 499
技術提示 501
第9章 推斷總體均值 505
9.1 隨機樣本的樣本均值 506
9.1.1 樣本均值的準度與精度 506
9.1.2 模擬的結果 509
9.2 樣本均值的中心極限定理 510
9.2.1 樣本均值分布的可視化 512
9.2.2 中心極限定理的套用 514
9.2.3 分布的類型 514
9.2.4 t分布 516
9.3 總體均值的置信區間估計 518
9.4 均值假設檢驗 528
9.5 兩個總體均值的比較 534
9.5.1 利用置信區間估計均值之差
(獨立樣本) 536
9.5.2 兩個均值之差的置信區間 537
9.5.3 兩個均值的假設檢驗 540
9.5.4 兩個均值的置信區間:相關樣本 545
9.5.5 兩個均值的假設檢驗:相關樣本 547
9.6 均值分析方法總覽 550
9.6.1 不接受原假設 550
9.6.2 置信區間和假設檢驗 551
9.6.3 選擇假設檢驗還是置信區間 552
數據項目:堆疊數據 554
本章回顧 555
練習 558
練習指導 579
技術提示 581
第10章 分類變數研究與科研文獻
閱讀 589
10.1 分類變數的假設檢驗:基本要素 590
10.1.1 數據 591
10.1.2 理論頻數 592
10.1.3 卡方統計量 595
10.1.4 計算卡方統計量的p值 597
10.2 分類變數之間的相關性:卡方檢驗 599
10.2.1 獨立性檢驗與同質性檢驗 601
10.2.2 隨機抽樣與隨機分配 604
10.2.3 比例檢驗 605
10.3 閱讀學術文獻 608
10.3.1 閱讀摘要 610
10.3.2 注意事項 613
數據項目:小處著眼 617
本章回顧 618
練習 622
練習指導 638
技術提示 640
附錄 645
附錄A 表 645
附錄B 奇數號練習答案 654

相關詞條

熱門詞條

聯絡我們