內容簡介
本書是世界公認的《回歸分析》標準教材(aleadingtextbookonregression)。不僅從理論上介紹了當今統計學中用到的傳統回歸方法,還補充介紹了尖端科學研究中不太常見的回歸方法。難能可貴的是,作者有豐富的教學經驗和實際套用經驗,使得本書理論和套用並重,還給出實際套用中應該注意的問題。新版除利用Minitab,SAS,S-PLUS軟體外,還融入了*流行的JMP軟體和R軟體,來闡釋相關技術方法。配套資源很豐富,數據、教學PPT等可**下載。
圖書目錄
譯者序
前言
第1章 導引1
1.1 回歸與建模1
1.2 數據收集4
1.3 回歸的用途7
1.4 計算機的角色7
第2章 簡單線性回歸9
2.1 簡單線性回歸模型9
2.2 回歸參數的最小二乘估計9
2.2.1 β0與β1的估計9
2.2.2 最小二乘估計量的性質與回歸模型擬合13
2.2.3 σ2的估計14
2.2.4 簡單線性回歸模型的另一種形式15
2.3 斜率與截距的假設檢驗15
2.3.1 使用t檢驗16
2.3.2 回歸顯著性檢驗16
2.3.3 方差分析18
2.4 簡單線性回歸的區間估計20
2.4.1 β0、β1與σ2的置信區間20
2.4.2 回響變數均值的區間估計21
2.5 新觀測值的預測23
2.6 決定係數2
2.7 回歸在服務業中的套用25
2.8 使用SAS和R做回歸分析27
2.9 對回歸用途的若干思考29
2.10 過原點回歸31
2.11 極大似然估計35
2.12 回歸變數x為隨機變數的情形36
2.12.1 x與y的聯合分布36
2.12.2 x與y的正態聯合分布:相關模型37
習題40
第3章 多元線性回歸47
3.1 多元回歸模型47
3.2 模型參數的估計49
3.2.1 回歸係數的最小二乘估計49
3.2.2 最小二乘法的幾何解釋55
3.2.3 最小二乘估計量的性質55
3.2.4 σ2的估計56
3.2.5 多元回歸中散點圖的不適用性57
3.2.6 極大似然估計58
3.3 多元回歸中的假設檢驗59
3.3.1 回歸顯著性檢驗59
3.3.2 單個回歸係數的檢驗與回歸係數子集的檢驗61
3.3.3 X中列為正交列的特例65
3.3.4 一般線性假設的檢驗66
3.4 多元回歸中的置信區間68
3.4.1 回歸係數的置信區間68
3.4.2 回響變數均值的置信區間估計69
3.4.3 回歸係數的聯合置信區間70
3.5 新觀測值的預測72
3.6 病人滿意度數據的多元回歸模型73
3.7 對基本多元線性回歸使用SAS與R74
3.8 多元回歸中所隱含的外推法77
3.9 標準化回歸係數79
3.10 多重共線性82
3.11 回歸係數為什麼有錯誤的正負號84
習題85
第4章 模型適用性檢驗91
4.1 導引91
4.2 殘差分析91
4.2.1 殘差的定義91
4.2.2 殘差尺度化方法92
4.2.3 殘差圖97
4.2.4 偏回歸圖與偏殘差圖100
4.2.5 使用Minitab、SAS與R做殘差分析102
4.2.6 殘差的其他作圖與分析方法104
4.3 PRESS統計量105
4.4 離群點的探測與處理106
4.5 回歸模型的失擬108
4.5.1 失擬的正規檢驗109
4.5.2 通過近鄰點估計純誤差112
習題116
第5章 修正模型不適用性的變換與加權120
5.1 導引120
5.2 方差穩定化變換120
5.3 模型線性化變換123
5.4 選擇變換的分析方法12
5.4.1 對y進行變換:博克斯考克斯方法127
5.4.2 對回歸變數進行變換129
5.5 廣義最小二乘與加權最小二乘131
5.5.1 廣義最小二乘131
5.5.2 加權最小二乘133
5.5.3 若干實用問題133
5.6 帶有隨機效應的回歸模型135
5.6.1 子抽樣135
5.6.2 含有單一隨機效應的回歸模型的一般情形140
5.6.3 混合模型在回歸中的重要性142
習題142
第6章 槓桿與強影響的診斷149
6.1 探測強影響觀測值的重要性149
6.2 槓桿150
6.3 強影響的度量:庫克D距離152
6.4 強影響的度量:DFFITS與DFBETAS153
6.5 模型性能的度量155
6.6 探測強影響觀測值的群體156
6.7 強影響觀測值的處理156
習題157
第7章 多項式回歸模型158
7.1 導引158
7.2 單變數的多項式模型158
7.2.1 基本原理158
7.2.2 分段多項式擬合(樣條)162
7.2.3 多項式與三角式166
7.3 非參數回歸167
7.3.1 核回歸167
7.3.2 局部加權回歸168
7.3.3 最後的警告171
7.4 兩個或更多變數的多項式模型171
7.5 正交多項式177
習題180
第8章 指示變數185
8.1 指示變數的一般概念185
8.2 關於指示變數用途的評註194
8.2.1 指示變數與指定代碼回歸194
8.2.2 用指示變數代替定量回歸變數195
8.3 方差分析的回歸方法195
習題199
第9章 多重共線性203
9.1 導引203
9.2 多重共線性的來源203
9.3 多重共線性的影響205
9.4 多重共線性的診斷209
9.4.1 考察協方差矩陣209
9.4.2 方差膨脹因子212
9.4.3 X′X的特徵系統分析213
9.4.4 其他診斷量216
9.4.5 生成多重共線性診斷量的SAS代碼與R代碼217
9.5 處理多重共線性的方法217
9.5.1 收集額外數據217
9.5.2 模型重設218
9.5.3 嶺回歸218
9.5.4 主成分回歸225
9.5.5 有偏估計量的比較與評估230
9.6 使用SAS做嶺回歸與主成分回歸231
習題233
第10章 變數選擇與模型構建236
10.1 導引236
10.1.1 模型構建問題236
10.1.2 模型誤設的後果237
10.1.3 評估子集回歸模型的準則239
10.2 變數選擇的計算方法243
10.2.1 所有可能的回歸243
10.2.2 逐步回歸方法248
10.3 變數選擇與模型構建的策略252
10.4 案例研究:使用SAS研究Gorman和Toman瀝青數據254
習題266
第11章 回歸模型的驗證269
11.1 導引269
11.2 模型驗證的方法269
11.2.1 模型係數與預測值的分析270
11.2.2 收集新數據——確認性試驗271
11.2.3 數據分割272
11.3 來自試驗設計的數據279
習題280
第12章 非線性回歸導引282
12.1 線性回歸模型與非線性回歸模型282
12.1.1 線性回歸模型282
12.1.2 非線性回歸模型282
12.2 非線性模型的起源283
12.3 非線性最小二乘285
12.4 將非線性模型變換為線性模型287
12.5 非線性系統中的參數估計289
12.5.1 線性化289