《統計學——科學與工程套用》是2007年7月27日清華大學出版社的圖書,作者是(美)納維迪(Navidi W.) ,譯者是楊文強、羅強。
基本介紹
- 書名:統計學——科學與工程套用
- 作者:(美)納維迪(Navidi W.)
- 譯者:楊文強,羅強
- ISBN:9787302154631
- 定價:98元
- 出版社:清華大學出版社
- 出版時間:2007-7-27
- 裝幀:平裝
內容簡介
本書可作為高等院校相關專業的統計學教材,也可作為工程技術人員和科研工作者的權威參考。
作者簡介
圖書前言
在我看來,一本給工程學和理學的學生使用的統計學入門教程,應該在適當的深度上包含上述的所有內容。此外,成功地開設一門統計學入門課程可以有多種不同的方法——可以根據需要有選擇地組織統計學內容進行講授,所以作為一本教材,它還應該具有足夠的靈活性以滿足各種不同的需求。並且,它必須提供豐富的示例來闡明各種重要的統計學思想是如何在實際中運用的。因此,這本書有以下特點:
● 本書的章節安排上具有足夠的靈活性,使得教師可以自由選擇所要講授的機率論知識的深度和廣度。
● 本書從很多實際問題出發,以真實的數據集作為示例,以此激發學生的學習熱情,同時也展示了科學研究與工業生產之間的緊密聯繫。
● 本書包含了很多給出計算機輸出結果的實例以及適合於利用計算機軟體求解的習題。
● 本書對誤差傳播進行了廣泛的討論。
● 本書深入地講解了仿真方法和自助法,同時也介紹了它們在正態性檢驗、機率計算、誤差估計、置信區間計算和假設檢驗等中的套用。
● 本書提供的關於線性模型診斷程式的介紹比大多數統計學入門教材都要豐富,其相關內容主要包括:殘差圖、變數變換和多元模型中變數的選擇等。
● 本書覆蓋了統計學的基本內容,包括描述性統計量、機率、置信區間、假設檢驗、線性回歸、析因實驗和統計質量控制等。
讀者對象
閱讀本書,讀者只需具備一些基本的微積分知識。有關偏導數和多元積分的知識會在多元誤差傳播分析和聯合機率分布計算中用到,但如果有困難的話,第一次學習的時候可以先跳過這些內容。另外,偏導數的計算在附錄B中給出了相關介紹,讀者可以參考。
計算機的使用
在過去的20年裡,計算技術的發展使統計學的實踐產生了革命性的變化。這也是統計學方法比以往任何時候都更深入到科學工作中去的主要原因之一。今天的科學家和工程師不僅要能夠熟練地使用計算機軟體包,而且要具備對計算機輸出結果進行分析並且得出結論的能力。因此,本書包含了利用計算機進行分析和生成實驗數據的內容(見相關習題和示例),這些內容主要集中線上性模型和析因分析的相關章節。
如今計算機和統計軟體的普及也給教學帶來了很大的便利,使得初學者也可以方便地使用各種仿真手段。仿真可以生動地展現統計學的基本原理。本書所設計的仿真素材可以加深讀者對一些基本的統計思想的理解,同時也展示了如何使用仿真這個有力的工具。
內容提要
第1章包括了對採樣和描述性統計量的介紹。統計方法有效的原因在於採樣產生的樣本與它們的總體具有相似性。因此,第1章首先介紹了一些獲得有效樣本的方法。接著在該章的第二部分討論了描述性統計量。
第2章介紹了機率論的一些基本概念。對於機率的講解可以有多種方法,教員可以從不同的廣度和深度上介紹“機率”這個概念。因此,本章的內容具有很大的靈活性。本章給出了從公理導出的主要概念及其證明。於是,教員可以通過嚴格的數學推導來介紹機率。另一方面,為了展現這些概念背後所蘊含的直觀思想,我嘗試對所介紹的每個概念舉出一兩個例子來進行說明,並且在可能的情況下都儘量使用學術性的語言。那些偏向於從實際入手的教員,可以把注意力更多地集中在這些概念的實例上,而不用去理會它們的證明。
第3章介紹誤差傳播,有時也叫做“誤差分析”,或者被統計學家稱作“方法”。本章中的內容比大多數相關的教科書所包含的內容都要全面。考慮到本章內容的重要性,我認為這是有必要的。本章所採用的教學方法,使得教員能夠根據需求對內容進行取捨。
第4章介紹了一些在實際中常用的機率分布函式,也介紹了機率圖和中心極限定理。最後一節還介紹了如何使用仿真方法來評估正態性假設、計算機率和估計偏差等。
第5章和第6章分別介紹置信區間和假設檢驗。在假設檢驗中著重闡述了P-值法,同時對固定水平檢驗和功效計算也作了介紹。在一定深度上討論了多重檢驗問題。本章還介紹了計算置信區間的方法,以及檢驗假設的仿真方法。
第7章介紹相關性和簡單線性回歸。著重強調了線性模型僅當變數之間線性相關時才適用。這一點是非常重要的,但是在實際套用中它卻常常被工程師和科學家(不包括統計學家)所忽視。由於在科技文獻中常常見到這樣的結果:直線擬合和相關係數計算均顯示出明顯的曲率,或者直線的斜率完全由幾個影響大的點所決定。所以本章給出了一節篇幅較長的內容專門討論如何檢驗模型假設和進行變數變換。
第8章介紹了多重回歸。本章對模型選擇方法給予了相當的重視,因為在現實生活中進行相關分析時,為模型選擇合適的變數是回歸分析所必需的步驟。另外,對混雜問題也進行了仔細的討論。
第9章討論了常用的實驗設計及其數據分析方法,詳細地介紹了單因素方差分析和雙因素方差分析方法,以及隨機化完全區組設計和2p析因設計。
第10章介紹了統計質量控制問題,討論了控制圖、累積和圖、過程能力。最後,以對6-質量簡要討論作為結束。
使用說明
本書包含的內容足夠一學年的課程使用。若開設學期課程,可參考我們提出的以下具體方案。美國科羅拉多州礦業學校的課程三小時為一節,一個學期的課程中,我們講授了前4章中除聯合分布、指數分布、伽馬分布和韋布爾分布之外的所有內容。然後教授了第5章和第6章中置信區間和假設檢驗的內容,並簡要地介紹了兩樣本方法以及功效計算,並省略了任意分布檢驗方法以及x2檢驗和F檢驗。我們以第7章作為課程的結束,如果時間允許的話可以儘可能多地介紹相關係數和簡單線性回歸模型方面的內容。
圖書目錄
1.1 抽樣 2
1.1.1 獨立性 7
1.1.2 其他抽樣方法 8
1.1.3 試驗類型 8
1.1.4 數據類型 9
1.2 匯總統計量 11
1.2.1 樣本均值 11
1.2.2 標準差 11
1.2.3 異常值 13
1.2.4 樣本中位數 14
1.2.5 截尾均值 14
1.2.6 眾數與極差 15
1.2.7 四分位數 15
1.2.8 百分位數 16
1.2.9 分類數據的匯總統計量 18
1.2.10 樣本統計量與總體參數 18
1.3 統計圖 21
1.3.1 莖葉圖 21
1.3.2 點圖 22
1.3.3 直方圖 23
1.3.4 等寬度分類區間 25
1.3.5 直方圖以及樣本均值
和方差 26
1.3.6 對稱與傾斜 27
1.3.7 單峰和雙峰直方圖 27
1.3.8 將高度設定為頻數 29
1.3.9 箱圖 30
1.3.10 對比箱圖 31
1.3.11 多元數據 33
第2章 機率 47
2.1 基本概念 47
2.1.1 合併事件 49
2.1.2 互不相容事件 49
2.1.3 機率 50
2.1.4 機率論的公理化 51
2.1.5 等可能概型 53
2.1.6 加法公式 54
2.2 計數方法 57
2.2.1 排列 58
2.2.2 組合 59
2.3 條件機率和獨立性 63
2.3.1 獨立事件 66
2.3.2 乘法公式 67
2.3.3 全機率公式 69
2.3.4 貝葉斯公式 71
2.3.5 系統的可靠性分析 73
2.4 隨機變數 80
2.4.1 隨機變數和總體 83
2.4.2 離散型隨機變數 83
2.4.3 離散型隨機變數的累積分布
函式 84
2.4.4 離散型隨機變數的均值
和方差 86
2.4.5 機率直方圖 88
2.4.6 連續型隨機變數 90
2.4.7 利用機率密度函式計算
機率 90
2.4.8 連續型隨機變數的累積分布
函式 92
2.4.9 連續型隨機變數的均值
和方差 93
2.4.10 總體中位數和總體
百分位數 94
2.5 隨機變數的線性函式 102
2.5.1 添加一個常數 102
2.5.2 乘以一個常數 103
2.5.3 隨機變數線性組合的均值 104
2.5.4 相互獨立的隨機變數 105
2.5.5 相互獨立隨機變數線性組合
的方差 106
2.5.6 獨立的簡單隨機樣本 107
2.5.7 樣本均值的期望和方差 107
2.6 隨機變數的聯合分布 111
2.6.1 聯合離散型隨機變數 111
2.6.2 聯合連續型隨機變數 113
2.6.3 多維隨機變數 117
2.6.4 隨機變數函式的均值 117
2.6.5 條件分布 119
2.6.6 條件期望 121
2.6.7 獨立隨機變數 122
2.6.8 協方差 124
2.6.9 相關係數 127
2.6.10 協方差、相關係數和
獨立性 129
2.6.11 隨機變數的線性組合 129
2.6.12 樣本均值的期望和方差 131
2.6.13 在證券管理中的套用 131
第3章 誤差傳播 149
3.1 測量誤差 149
3.2 測量值的線性組合 154
3.2.1 重複測量 156
3.2.2 具有不同不確定度的
重複測量 158
3.2.3 相關測量的線性組合 159
3.3 單測量值函式的不確定度 163
3.3.1 誤差傳播的不確定度僅是
近似值 163
3.3.2 非線性函式是有偏的 164
3.3.3 單測量值函式的相對
不確定度 164
3.4 多測量值函式的不確定度 169
3.4.1 相關測量值函式的
不確定度 171
3.4.2 多測量值函式的相對
不確定度 172
第4章 常用分布 183
4.1 伯努利分布 183
4.2 二項分布 186
4.2.1 服從二項分布的隨機變數的
分布律函式 187
4.2.2 二項分布隨機變數是伯努利
隨機變數的和 190
4.2.3 二項分布隨機變數的均值
和方差 190
4.2.4 利用樣本比估計成功機率 191
4.2.5 樣本比的不確定度 191
4.3 泊松分布 196
4.3.1 泊松分布隨機變數的均值
和方差 199
4.3.2 利用泊松分布估計速率 202
4.3.3 速率估計量的不確定度 202
4.4 其他離散型分布 209
4.4.1 超幾何分布 209
4.4.2 超幾何分布的均值和方差 211
4.4.3 與二項分布的比較 211
4.4.4 幾何分布 212
4.4.5 幾何分布的均值和方差 212
4.4.6 負二項分布 213
4.4.7 負二項分布隨機變數是幾何
分布隨機變數的和 214
均值和方差 214
4.4.9 多項分布 215
4.5 常態分配 219
4.5.1 常態分配的參數估計 225
4.5.2 獨立常態分配隨機變數的
線性組合 225
4.5.3 如何確定數據屬於正態
總體 226
4.6 對數常態分配 231
4.6.1 對數常態分配的參數估計 233
4.6.2 如何判定數據是否屬於對數
正態總體 234
4.7 指數分布 237
4.7.1 指數分布和泊松分布 238
4.7.2 指數分布的無記憶性 239
4.8 伽瑪分布和韋布爾分布 245
4.8.1 伽瑪分布 245
4.8.2 韋布爾分布 247
4.9 機率圖 251
4.10 中心極限定理 256
4.10.1 二項分布的正態逼近 259
4.10.2 連續性修正 260
4.10.3 連續性修正的精度 262
4.10.4 常態分配對泊松分布
的逼近 262
4.10.5 泊松分布的連續性修正 262
4.11 模擬 266
4.11.1 利用模擬來估計機率 267
4.11.2 均值和方差的估計 270
4.11.3 與誤差傳播的比較 270
4.11.4 利用模擬確定總體是否近
似常態分配 271
4.11.5 模擬在可靠性分析中
的套用 272
4.11.6 利用模擬數據估計偏差 274
4.11.7 自助法 275
4.11.8 參數和非參數自助法 276
第5章 置信區間 287
5.1 總體均值的大樣本置信區間 288
5.1.1 有關置信水平的補充說明 292
5.1.2 機率與置信水平 293
5.1.3 根據精度要求確定所需
樣本容量 295
5.1.4 單側置信區間 295
5.1.5 置信區間必須基於隨機樣本
給出 297
5.2 比例置信區間 301
5.3 總體均值的小樣本置信區間 306
5.3.1 學生t分布 306
5.3.2 當樣本包含異常值時不要使
用學生t分布 309
5.3.3 利用學生t分布建立置信
區間 309
5.3.4 如何判斷是否採用學生t
分布? 310
5.3.5 如果σ已知,則使用z表而
不是t曲線 312
5.4 兩個均值之差的置信區間 315
5.5 兩個比例之差的置信區間 318
5.6 兩個均值之差的小樣本置信
區間 322
5.6.1 總體具有相同方差的情況 325
5.6.2 不能因為樣本方差近似相等
就假定總體方差相等 326
5.7 數據對的置信區間 329
5.8 用模擬方法建立置信區間 336
5.8.1 利用自助法來建立置信
區間 340
5.8.2 用模擬方法來評價置信
區間 343
第6章 假設檢驗 353
6.1 總體均值的大樣本檢驗 353
6.2 從假設檢驗的結果中推斷出
結論 361
6.2.1 統計顯著性 362
6.2.2 P-值不是H0為真的機率 363
6.2.3 正確選擇零假設H0 363
6.2.4 統計顯著性與實際的意義
不相同 364
6.2.5 假設檢驗和置信區間
的關係 365
6.3 總體比例的檢驗 369
6.3.1 樣本容量必須大 370
6.3.2 與總體比置信區間的關係 372
6.4 總體均值的小樣本檢驗 374
6.5 兩個均值差的大樣本檢驗 379
6.6 兩個總體比例差的檢驗 385
6.7 兩個均值差的小樣本檢驗 391
6.7.1 兩個總體的方差相等
的情形 395
6.7.2 不要僅僅因為樣本方差近似
相等就假設總體方差相等 396
6.8 成對數據的假設檢驗 399
6.9 任意分布檢驗 405
6.9.1 Wilcoxon符號秩檢驗 405
6.9.2 平秩 408
6.9.3 零差值 408
6.9.4 大樣本逼近 409
6.9.5 Wilcoxon秩和檢驗 410
6.9.6 大樣本逼近 411
6.9.7 任意分布方法的假設條件 412
6.10 卡方檢驗 415
6.10.1 齊性的卡方檢驗 418
6.10.2 獨立性的卡方檢驗 420
6.11 方差相等的F 檢驗 426
6.11.1 F分布 426
6.11.2 關於方差相等檢驗的F
統計量 427
6.11.3 F檢驗對非正態
總體敏感 429
6.11.4 F檢驗不能證明兩個
方差相等 429
6.12 固定顯著性水平的
假設檢驗 430
6.12.1 臨界點和拒絕域 430
6.12.2 第I類錯誤和第II類
錯誤 432
6.13 功效 435
6.14 多重檢驗 444
6.15 利用隨機模擬進行假設
檢驗 448
6.15.1 利用自助置信區間檢驗
假設 449
6.15.2 隨機化檢驗 449
6.15.3 利用模擬估計功效 452
第7章 相關性與簡單線性回歸 463
7.1 相關性 463
7.1.1 相關係數的含義 467
7.1.2 相關係數是一個數 468
7.1.3 相關係數只能度量線性
關係 469
7.1.4 異常值 469
7.1.5 相關性不是因果關係 470
7.1.6 對總體相關係數的推斷 473
7.2 最小二乘直線 479
7.2.1 求解最小二乘直線方程 481
7.2.2 計算公式 482
7.2.3 估計值與真實值的差別 484
7.2.4 殘差與誤差的區別 484
7.2.5 不能在數據範圍外推斷 484
7.2.6 對非線性數據不能採用最小
二乘直線 485
7.2.7 最小二乘直線的
另一種含義 485
7.2.8 度量擬合優度 486
7.3 最小二乘係數的不確定度 495
7.3.1 x值的散布程度越大越好
(某種意義下) 497
7.3.2 斜率和截距的推導 498
7.3.3 平均回響的推導 501
7.3.4 觀測值的預測區間 504
7.3.5 解釋計算機輸出 506
7.4 假設條件的驗證與數據變換 512
7.4.1 殘差與擬合值的關係圖 512
7.4.2 變數變換 515
7.4.3 確定採用何種變換 516
7.4.4 變換並不總是適用 517
7.4.5 很難解釋點數較少
的殘差圖 517
7.4.6 異常值與影響點 520
7.4.7 除了變數變換以外的
其他方法 521
7.4.8 檢測獨立性和正態性 522
7.4.9 經驗模型與物理定律 523
第8章 多重回歸 541
8.1 多重回歸模型 541
8.1.1 係數的估計 542
8.1.2 平方和 542
8.1.3 統計量s2、R2和F 544
8.1.4 示例 545
8.1.5 多重回歸模型中假設條件
的驗證 548
8.2 混雜與共線性 558
8.3 模型選擇 567
8.3.1 確定模型中需要去除
的變數 569
8.3.2 最小子集回歸 574
8.3.3 逐步回歸 576
8.3.4 模型選擇程式有時會找出
一些無意義的模型 578
第9章 析因試驗 609
9.1 單因素試驗 609
9.1.1 完全隨機試驗 610
9.1.2 單因素方差分析 611
9.1.3 處理均值的置信區間 616
9.1.4 方差分析表 616
9.1.5 驗證假設條件 618
9.1.6 平衡和非平衡設計 619
9.1.7 方差分解恆等式 620
9.1.8 另一種參數化方法 620
9.1.9 功效 621
9.1.10 隨機效應模型 623
9.2 單因素試驗中的配對比較 630
9.2.1 Fisher的最小顯著性
差異方法 631
9.2.2 多重比較的Bonferroni
方法 634
9.2.3 多重比較的Tukey-Kramer
方法 635
9.3 雙因素試驗 642
9.3.1 雙因素方差分析 643
9.3.2 使用雙因素方差分析方法
進行假設檢驗 647
9.3.3 假設條件的驗證 651
9.3.4 加性模型不成立時,
不能用主效應解釋 652
9.3.5 雙因素方差分析與兩個單因
素方差分析的區別 654
9.3.6 互動作用圖 655
9.3.7 雙因素方差分析中的多重
比較 656
9.3.8 K=1時的雙因素方差分析 658
9.3.9 隨機因素 658
9.3.10 不平衡設計 658
9.4 隨機化完全區組設計 665
9.5 2p析因試驗 674
9.5.1 23析因試驗中的記號 674
9.5.2 23析因試驗中的效應估計 674
9.5.3 解釋計算機的輸出 678
9.5.4 2p析因試驗的效應估計 680
9.5.5 無重複析因試驗 681
9.5.6 運用機率圖檢測重要效應 684
9.5.7 分式析因試驗 684
第10章 統計質量控制 705
10.1 基本思想 705
10.1.1 收集數據—— 合理子組 706
10.1.2 控制與能力 706
10.1.3 過程控制必須連續進行 707
10.2 變數控制圖 708
10.2.1 控制圖的性能 714
10.2.2 美國西部電氣公司規則 717
10.2.3 S圖 718
10.2.4 比較S圖和R圖 722
10.2.5 樣本容量為1的樣本 722
10.3 屬性控制圖 728
10.3.1 p圖 728
10.3.2 屬性控制圖中處於控制界
限外的信號的解釋 730
10.3.3 C圖 730
10.4 累積和圖 733
10.5 過程能力 737
10.5.1 根據過程能力估計不符合
規格要求的個體比例 740
10.5.2 六西格碼質量 740
10.5.3 單側容限 741
附錄A 表格 745
附錄B 偏導數 777
附錄C 部分習題解答 779