《實驗數據分析(下冊)》介紹實驗和測量數據分析中涉及的機率和數理統計及相關的數學知識,內容包括機率論、經典數理統計、貝葉斯統計、蒙特卡羅方法、極小化方法和去彌散方法六個部分。特別討論了數據統計處理中的一些困難問題和近期國際上發展起來的新方法。書中分析了取自普通物理、核物理、粒子物理和工程技術問題的許多實例,注重物理問題與數學方法的結合,具體闡述了機率和數理統計及相關的數學方法在實際問題中的套用。書末附有詳盡的數理統計表,可供《實驗數據分析(下冊)》涉及的幾乎所有數據分析問題之需要,而無需查閱專門的數理統計表書籍。
基本介紹
- 書名:實驗數據分析
- 出版社:科學出版社
- 頁數:780頁
- 開本:5
- 定價:86.00
- 作者:朱永生
- 出版日期:2012年6月1日
- 語種:簡體中文
- ISBN:7030349571, 9787030349576
- 品牌:科學出版社
內容簡介,圖書目錄,文摘,
內容簡介
《實驗數據分析(下冊)》可供實驗物理工作者和大專院校相關專業師生、理論物理研究人員、工程技術人員以及從事自然科學和社會科學的數據測量和分析研究人員參考。
圖書目錄
前言
第12章 假設檢驗
12.1 假設檢驗的一般概念
12.1.1 原假設和備擇假設
12.1.2 假設檢驗的一般方法
12.1.3 檢驗的比較
12.1.4 分布自由檢驗
12.2 參數假設檢驗
12.2.1 簡單假設的奈曼-皮爾遜檢驗
12.2.2 複合假設的似然比檢驗
12.3 正態總體的參數檢驗
12.3.1 正態總體均值和方差的檢驗
12.3.2 兩個正態總體均值的比較
12.3.3 兩個正態總體方差的比較
12.3.4 多個正態總體均值的比較
12.4 擬合優度檢驗
12.4.1 似然比檢驗
12.4.2 皮爾遜χ 2檢驗
12.4.3 最小二乘、極大似然估計中的皮爾遜χ 2檢驗
12.4.4 擬合優度的一般χ 2檢驗
12.4.5 柯爾莫哥洛夫檢驗
12.4.6 斯米爾諾夫-克拉美-馮·邁希斯檢驗
12.5 信號的統計顯著性
12.5.1 實驗P值
12.5.2 信號的統計顯著性
12.6 獨立性檢驗
12.6.1 二維隨機變數分量的獨立性檢驗
12.6.2 多維隨機變數分量的獨立性檢驗
12.7 相關性檢驗
12.7.1 Pearson相關係數的檢驗
12.7.2 Spearman秩相關檢驗
12.7.3 Kendall τ相關檢驗
12.7.4 多變數Kendall協和係數檢驗
12.8 一致性檢驗
12.8.1 符號檢驗
12.8.2 兩子樣的遊程檢驗
12.8.3 遊程檢驗作為皮爾遜χ 2檢驗的補充
12.8.4 兩子樣的斯米爾諾夫檢驗
12.8.5 兩子樣的威爾科克森檢驗
12.8.6 多個連續總體子樣的克魯斯卡爾-瓦列斯秩檢驗
12.8.7 多個離散總體子樣的χ 2檢驗
第13章 貝葉斯統計
13.1 頻率機率和貝葉斯機率
13.2 貝葉斯公式和貝葉斯統計模型
13.2.1 貝葉斯公式
13.2.2 貝葉斯統計模型和貝葉斯推斷原則
13.2.3 先驗分布和後驗分布,先驗分布的選擇
13.3 貝葉斯統計推斷
13.3.1 統計決策的基本概念
13.3.2 貝葉斯參數點估計
13.3.3 經驗貝葉斯估計
13.3.4 貝葉斯參數區間估計
13.3.5 貝葉斯假設檢驗
第14章 蒙特卡羅法
14.1 蒙特卡羅法的基本思想
14.2 隨機數的產生及檢驗
14.2.1 隨機數的產生
14.2.2 隨機數的統計檢驗
14.3 任意隨機變數的隨機抽樣
14.3.1 直接抽樣方法
14.3.2 直接抽樣方法的推廣——變換抽樣
14.3.3 舍選抽樣方法
14.3.4 利用極限定理抽樣
14.3.5 複合分布的抽樣方法
14.3.6 近似抽樣方法
14.3.7 多維分布的抽樣
14.4 蒙特卡羅法計算積分
14.4.1 頻率法(均勻投點法)
14.4.2 期望值估計法
14.4.3 重要抽樣方法
14.4.4 半解析法
14.4.5 自適應蒙特卡羅積分
14.5 蒙特卡羅法套用於粒子傳播問題
第15章 極小化方法
15.1 引言
15.2 無約束極小化的一維搜尋
15.2.1 黃金分割法(0.618法)
15.2.2 斐波那契法
15.2.3 二次函式插值法(拋物線法)
15.2.4 進退法
15.3 無約束n維極值的解析方法
15.3.1 最速下降法(梯度法)
15.3.2 牛頓法
15.3.3 共軛方向法和共軛梯度法
15.3.4 變尺度法
15.4 無約束n維極值的直接方法
15.4.1 坐標輪換法
15.4.2 霍克-吉弗斯模式搜尋法
15.4.3 羅森布洛克轉軸法
15.4.4 單純形法
15.5 最小二乘Q 2函式和似然函式的極值問題
15.5.1 最小二乘Q 2函式極值
15.5.2 似然函式極值
15.6 局部極小和全域極小
15.6.1 格線法
15.6.2 隨機搜尋法
15.7 約束n維極值問題
15.7.1 變數代換法
15.7.2 罰函式法
15.8 參數的誤差估計
第16章 去彌散方法
16.1 去彌散問題的數學表述
16.2 回響矩陣求逆法
16.3 修正因子法
16.4 正規化去彌散的一般策略
16.5 正規函式
16.5.1 Tikhonov正規函式
16.5.2 基於極大熵原理的正規函式
16.5.3 貝葉斯統計的極大熵原理
16.5.4 基於交叉熵的正規函式
16.6 估計量的方差和偏差
16.7 正規參數的選擇
16.8 去彌散計算實例
16.9 數值計算
參考文獻
附表
示例索引
《現代物理基礎叢書》已出版書目
第12章 假設檢驗
12.1 假設檢驗的一般概念
12.1.1 原假設和備擇假設
12.1.2 假設檢驗的一般方法
12.1.3 檢驗的比較
12.1.4 分布自由檢驗
12.2 參數假設檢驗
12.2.1 簡單假設的奈曼-皮爾遜檢驗
12.2.2 複合假設的似然比檢驗
12.3 正態總體的參數檢驗
12.3.1 正態總體均值和方差的檢驗
12.3.2 兩個正態總體均值的比較
12.3.3 兩個正態總體方差的比較
12.3.4 多個正態總體均值的比較
12.4 擬合優度檢驗
12.4.1 似然比檢驗
12.4.2 皮爾遜χ 2檢驗
12.4.3 最小二乘、極大似然估計中的皮爾遜χ 2檢驗
12.4.4 擬合優度的一般χ 2檢驗
12.4.5 柯爾莫哥洛夫檢驗
12.4.6 斯米爾諾夫-克拉美-馮·邁希斯檢驗
12.5 信號的統計顯著性
12.5.1 實驗P值
12.5.2 信號的統計顯著性
12.6 獨立性檢驗
12.6.1 二維隨機變數分量的獨立性檢驗
12.6.2 多維隨機變數分量的獨立性檢驗
12.7 相關性檢驗
12.7.1 Pearson相關係數的檢驗
12.7.2 Spearman秩相關檢驗
12.7.3 Kendall τ相關檢驗
12.7.4 多變數Kendall協和係數檢驗
12.8 一致性檢驗
12.8.1 符號檢驗
12.8.2 兩子樣的遊程檢驗
12.8.3 遊程檢驗作為皮爾遜χ 2檢驗的補充
12.8.4 兩子樣的斯米爾諾夫檢驗
12.8.5 兩子樣的威爾科克森檢驗
12.8.6 多個連續總體子樣的克魯斯卡爾-瓦列斯秩檢驗
12.8.7 多個離散總體子樣的χ 2檢驗
第13章 貝葉斯統計
13.1 頻率機率和貝葉斯機率
13.2 貝葉斯公式和貝葉斯統計模型
13.2.1 貝葉斯公式
13.2.2 貝葉斯統計模型和貝葉斯推斷原則
13.2.3 先驗分布和後驗分布,先驗分布的選擇
13.3 貝葉斯統計推斷
13.3.1 統計決策的基本概念
13.3.2 貝葉斯參數點估計
13.3.3 經驗貝葉斯估計
13.3.4 貝葉斯參數區間估計
13.3.5 貝葉斯假設檢驗
第14章 蒙特卡羅法
14.1 蒙特卡羅法的基本思想
14.2 隨機數的產生及檢驗
14.2.1 隨機數的產生
14.2.2 隨機數的統計檢驗
14.3 任意隨機變數的隨機抽樣
14.3.1 直接抽樣方法
14.3.2 直接抽樣方法的推廣——變換抽樣
14.3.3 舍選抽樣方法
14.3.4 利用極限定理抽樣
14.3.5 複合分布的抽樣方法
14.3.6 近似抽樣方法
14.3.7 多維分布的抽樣
14.4 蒙特卡羅法計算積分
14.4.1 頻率法(均勻投點法)
14.4.2 期望值估計法
14.4.3 重要抽樣方法
14.4.4 半解析法
14.4.5 自適應蒙特卡羅積分
14.5 蒙特卡羅法套用於粒子傳播問題
第15章 極小化方法
15.1 引言
15.2 無約束極小化的一維搜尋
15.2.1 黃金分割法(0.618法)
15.2.2 斐波那契法
15.2.3 二次函式插值法(拋物線法)
15.2.4 進退法
15.3 無約束n維極值的解析方法
15.3.1 最速下降法(梯度法)
15.3.2 牛頓法
15.3.3 共軛方向法和共軛梯度法
15.3.4 變尺度法
15.4 無約束n維極值的直接方法
15.4.1 坐標輪換法
15.4.2 霍克-吉弗斯模式搜尋法
15.4.3 羅森布洛克轉軸法
15.4.4 單純形法
15.5 最小二乘Q 2函式和似然函式的極值問題
15.5.1 最小二乘Q 2函式極值
15.5.2 似然函式極值
15.6 局部極小和全域極小
15.6.1 格線法
15.6.2 隨機搜尋法
15.7 約束n維極值問題
15.7.1 變數代換法
15.7.2 罰函式法
15.8 參數的誤差估計
第16章 去彌散方法
16.1 去彌散問題的數學表述
16.2 回響矩陣求逆法
16.3 修正因子法
16.4 正規化去彌散的一般策略
16.5 正規函式
16.5.1 Tikhonov正規函式
16.5.2 基於極大熵原理的正規函式
16.5.3 貝葉斯統計的極大熵原理
16.5.4 基於交叉熵的正規函式
16.6 估計量的方差和偏差
16.7 正規參數的選擇
16.8 去彌散計算實例
16.9 數值計算
參考文獻
附表
示例索引
《現代物理基礎叢書》已出版書目
文摘
第12章假設檢驗
12.1 假設檢驗的一般概念
從第7章到第11章我們討論了參數估計問題,在這類問題中,隨機變數的分布函式的形式一般為已知,但其中包含著待估計的未知參數,參數估計就是根據子樣觀測值對未知參數的數值或置信區間進行統計推斷。如果被觀測的隨機變數的分布函式的確切形式未知,我們只能以假設的方式提出它所服從的分布,並從統計的觀點根據觀測值來判斷這一假設的合理性。這類問題是數理統計的又一重要內容,稱為統計假設的檢驗。
舉例來說,方向相反的高能量正負電子對撞,產生一對μ介子
e+ +e. .→ μ + +μ..
出射的μ.粒子與負電子e.之間的極角是一個隨機變數。假定測量了n個反應事例的值為.1,.2,……,.n,要求確定的分布是否具有C(1+acos2 .),0...π(12.1.1)的形式,其中C是歸一化常數,a是某個參數.這就是一個假設檢驗問題。
假設檢驗可以分為參數檢驗和非參數檢驗兩類,如果有待檢驗的是分布的某個參數是否等於某個規定值(分布函式形式已知,但包含未知參數),那么這屬於參數檢驗問題。比如上例中已知隨機變數,具有式(12.1.1)的分布,要求根據觀測值.1,.2,,.n檢驗未知參數a是否等於某個特定值a0,非參數檢驗所處理的問題是:被觀測的隨機變數所服從的分布是否具有某個特定的函式形式,或是從兩個總體的各自一組觀測值來檢驗這兩個總體是否有相同的分布等,在這種情況下,待檢驗總體的分布的函式形式,在假設檢驗完成前是無從知曉的。上例中,如果要根據一組觀測值.1,.2,……,.n來確定隨機變數。是否服從式(12.1.1)的分布(事先並不知道,分布的函式形式),則就是非參數檢驗問題。
12.1.1 原假設和備擇假設
參數檢驗的一般問題可表述如下:設總體X的機率分布F(x;.)的函式形式為已知,但其中包含未知參數,要求從總體的子樣測量值(x1,x2,,xn)來檢驗未知參數,是否等於某個指定值.0.對我們要驗證的假設記為H0:.=.0,(12.1.2)稱為原假設或零假設。參數假設檢驗問題的提出本身就意味著,總體X的真實分布的參數值既可能是H0規定的.0,也可能是不同於0的其他值。因此,與原假設相對,有 H1:.=..,..=.0稱為備擇假設或備選假設,參數,所有可能值的全體稱為容許假設,容許假設(除原假設H0以外)都可作為備擇假設,常見的參數備擇假設有如下類型:
H1:.=.1(.1為不等於.0的常數),(12.1.3)
H1:.>.0,(12.1.4)
H1:.<.0,(12.1.5)
H1:.=.0.(12.1.6)
如果假設對於參數的規定值是一個常數,或者說是參數空間中的單點集,則該假設稱為簡單假設;相反,假設對參數的規定值是參數空間中的非單點集,則稱為複合假設或複雜假設。於是式(12.1.2)和式(12.1.3)是簡單原假設和簡單備擇假設,而式(12.1.4)~ 式(12.1.6)是複合備擇假設。
非參數檢驗的一類問題是,待檢驗的總體X的分布F(x)是否等於某個特定函式G(x),或者總體X的分布F(x)與總體Y的分布G(x)是否相同,其原假設可表述為H0:F(x)=G(x), (12.1.7)
備擇假設可有不同的類型
H1:F(x)>G(x),(12.1.8)
H1:F(x) H1:F(x).=G(x). (12.1.10)
一個假設檢驗問題,就是利用待檢驗總體的子樣觀測值來決定,究竟應當接受原假設(拒絕備擇假設)還是應當拒絕原假設(接受備擇假設),至於原假設和備擇假設怎樣選擇,則是根據所要解決的具體問題來決定的。
式(12.1.4),式(12.1.5)的備擇假設對於待檢驗的參數的規定值,完全落在原假設.=.0的一側(上側或下側),這樣的檢驗稱為單側檢驗;式(12.1.6)備擇假設對的規定值落在H0:.=.0的兩側,稱為雙側檢驗.對於非參數檢驗的情形,式(12.1.8),式(12.1.9)是單側檢驗,式(12.1.10)是雙側檢驗。
12.1 假設檢驗的一般概念403
……
12.1.2 假設檢驗的一般方法
設X = {X1,X2,,Xn} 是從待檢驗總體抽取的隨機子樣,而U=U(X)為子樣統計量(見6.2節統計量的定義),在假設檢驗中稱為檢驗統計量,令W是U的值域,當零假設H0為真時,U落入W的一個子域R的機率用α表示,0.α.1,α = P (U ∈ R|H0)=R g(u|H0)du,(12.1.11)其中g(u|H0)是H0為真時統計量U的機率密度,一般α為一接近於零的正數,判斷待檢驗的假設是拒絕還是接受,是根據所謂小機率事件的原理,即機率很小的事件在一次隨機試驗中被認為是幾乎不可能發生的。因此,當我們有一組實際觀測值x1,x2,,xn並求出U的實際觀測值Uobs,如果它落在區域R之中,由於α很小,這一事件是小機率事件,因此,假設H0不大可能是正確的,我們稱在顯著性(水平)α上拒絕零假設H0而接受備選假設H1;反之,當Uobs落在子域W R內,則在水平α上接受H0而拒絕H1,對零假設H0作出接受或拒絕的判斷,通常稱為對H0作顯著性檢驗,子域R稱為拒絕域或臨界域,子域W-R則稱為接受域,臨界域與接受域分界點的統計量U的值Uc稱為臨界點或臨界值(圖12.1(a))。應當指出,在某些檢驗問題中,特別在某些雙側檢驗問題中,存在兩個分隔開的臨界域,因而有兩個臨界點,如圖12.1(b)所示。
圖12.1檢驗統計量U的臨界域R和接受域W-RUc(Uc.)為臨界值,g(u|H0)是H0為真時U的機率密度
由假設檢驗的上述判斷準則可知,即使零假設H0為真,但檢驗統計量U的實際觀測值仍然有α的機率落入拒絕域R,也就是說,當用Uobs來檢驗正確地反映觀測值的零假設時,有100α%的可能性將拒絕H0.這類錯誤稱為第一類錯誤,亦即棄真的錯誤,把本來正確的假設給否定了,為了減少棄真的錯誤,α應當取得儘可能地小。
此外,還可能出現第二類錯誤,即取偽的錯誤,當H0不為真但卻接受了H0.出現取偽錯誤的機率取決於備擇假設H1,它等於H1為真而U落入接收域W-R的機率β,β = P (U ∈ W . R|H1)= . W -R g(u|H1)du,(12.1.12)其中g(u|H1)表示H1為真時統計量U的機率密度.零假設H0對備擇假設H1的檢驗勢或勢函式定義為檢驗勢=1. β = P (U ∈ R|H1)=. R g(u|H1)du,(12.1.13) 即H1為真而統計量U落入零假設拒絕域R的機率。
圖12.2是假設檢驗中犯第一類錯誤的機率α和犯第二類錯誤的機率β的圖示,顯然,檢驗統計量U及臨界值Uc的合理選擇應當是使α儘可能地小,使檢驗勢1.β儘可能大,因而假設檢驗問題的癥結在於選擇適當的檢驗統計量U及其適當的臨界值Uc。
圖12.2參數假設檢驗中第一類錯誤的機率α和第二類錯誤的機率β
例12.1單個π0 和多個π0 事例的區分
考察在氫氣泡室中質子反質子湮滅產生的粒子,泡室只能顯示帶電粒子的徑跡,通過對徑跡的測量可確定帶電粒子的種類、飛行方向和動量;中性粒子則不能顯示和鑑別.pˉp反應的產物有許多事例觀測到四條徑跡,並可鑑別出它們是π± 介子,但測定了這些π介子的動量後發現,反應初態(pˉp)和反應末態(4個π介子) 之間不滿足能量和動量守恆,這表明,反應末態中還有“丟失”了的中性粒子沒有被觀測到,根據反應初態的能、動量和反應末態四個π介子的能、動量可以求出所謂的“丟失質量”(“丟失”的中性粒子的靜止能量之和),事例數的丟失質量分布稱為丟失質量譜,分析丟失質量譜可知,丟失的中性粒子可能是一個或多箇中性π0 介子,因此,pˉp反應事例可以分為產生一個π0 和產生多個π0 兩類.按照假設檢驗的概念,現在的問題可用下述零假設和備擇假設來表示:
H0:pˉp π+π+π.π.π0 ,→ H1:pˉp → π+π+π.π.M(M表示多個π0),丟失質量的平方m2 作為檢驗統計量,如果H0成立,即丟失了一個π0 ,那么m2 應當等於π0 質量的平方,即mπ2 0.顯然,臨界值mc2 的合理選擇應該是略高於mπ2 0.這樣,如果一個事例的丟失質量平方小於mc2 ,就有很大可能是產生一個π0 的事例,故接受H0是合理的;反過來若事例的丟失質量平方m2 大於mc2 ,那么有很大可能產生一個以上的π0 ,故應當拒絕H0而接受備擇假設H1,認為該事例是一個多π0 事件。
實驗中觀測到的全部事例的丟失質量譜一般都是連續分布,例如,圖12.3(a)就是一個典型的丟失質量譜直方圖,這是一個實驗分布,其中包含了測量誤差即實驗分辨函式的效應(見4.17.1節),這樣,儘管真實的丟失質量小於mπ2 0,但由於測量誤差,測得的m2 卻有一定的機率大於m2 π0;反之,真實的丟失質量大於m2 π0時,也有一定的機率實驗測定值卻小於mπ2 0,這就模糊了單π0 事件與多π0 事件的界限,使m2c 的選擇面臨兩難的境地。如果m2c 選得稍高於m2 π0,可以保證多π0 事例被誤認為單π0 事例的機率很小,即取偽錯誤的機率很小,但真實的單π0 事例卻有較大的可能損失掉(棄真的機率較大);反過來,若m2c 比mπ2 0大得多,雖然減小了棄真錯誤的機率,但取偽錯誤的機率卻由此增大了,這種情況在假設檢驗問題中是有代表性的,減小α和減小β這兩個要求常常互相牴觸,必須根據實際問題作適當的折中。……
12.1 假設檢驗的一般概念
從第7章到第11章我們討論了參數估計問題,在這類問題中,隨機變數的分布函式的形式一般為已知,但其中包含著待估計的未知參數,參數估計就是根據子樣觀測值對未知參數的數值或置信區間進行統計推斷。如果被觀測的隨機變數的分布函式的確切形式未知,我們只能以假設的方式提出它所服從的分布,並從統計的觀點根據觀測值來判斷這一假設的合理性。這類問題是數理統計的又一重要內容,稱為統計假設的檢驗。
舉例來說,方向相反的高能量正負電子對撞,產生一對μ介子
e+ +e. .→ μ + +μ..
出射的μ.粒子與負電子e.之間的極角是一個隨機變數。假定測量了n個反應事例的值為.1,.2,……,.n,要求確定的分布是否具有C(1+acos2 .),0...π(12.1.1)的形式,其中C是歸一化常數,a是某個參數.這就是一個假設檢驗問題。
假設檢驗可以分為參數檢驗和非參數檢驗兩類,如果有待檢驗的是分布的某個參數是否等於某個規定值(分布函式形式已知,但包含未知參數),那么這屬於參數檢驗問題。比如上例中已知隨機變數,具有式(12.1.1)的分布,要求根據觀測值.1,.2,,.n檢驗未知參數a是否等於某個特定值a0,非參數檢驗所處理的問題是:被觀測的隨機變數所服從的分布是否具有某個特定的函式形式,或是從兩個總體的各自一組觀測值來檢驗這兩個總體是否有相同的分布等,在這種情況下,待檢驗總體的分布的函式形式,在假設檢驗完成前是無從知曉的。上例中,如果要根據一組觀測值.1,.2,……,.n來確定隨機變數。是否服從式(12.1.1)的分布(事先並不知道,分布的函式形式),則就是非參數檢驗問題。
12.1.1 原假設和備擇假設
參數檢驗的一般問題可表述如下:設總體X的機率分布F(x;.)的函式形式為已知,但其中包含未知參數,要求從總體的子樣測量值(x1,x2,,xn)來檢驗未知參數,是否等於某個指定值.0.對我們要驗證的假設記為H0:.=.0,(12.1.2)稱為原假設或零假設。參數假設檢驗問題的提出本身就意味著,總體X的真實分布的參數值既可能是H0規定的.0,也可能是不同於0的其他值。因此,與原假設相對,有 H1:.=..,..=.0稱為備擇假設或備選假設,參數,所有可能值的全體稱為容許假設,容許假設(除原假設H0以外)都可作為備擇假設,常見的參數備擇假設有如下類型:
H1:.=.1(.1為不等於.0的常數),(12.1.3)
H1:.>.0,(12.1.4)
H1:.<.0,(12.1.5)
H1:.=.0.(12.1.6)
如果假設對於參數的規定值是一個常數,或者說是參數空間中的單點集,則該假設稱為簡單假設;相反,假設對參數的規定值是參數空間中的非單點集,則稱為複合假設或複雜假設。於是式(12.1.2)和式(12.1.3)是簡單原假設和簡單備擇假設,而式(12.1.4)~ 式(12.1.6)是複合備擇假設。
非參數檢驗的一類問題是,待檢驗的總體X的分布F(x)是否等於某個特定函式G(x),或者總體X的分布F(x)與總體Y的分布G(x)是否相同,其原假設可表述為H0:F(x)=G(x), (12.1.7)
備擇假設可有不同的類型
H1:F(x)>G(x),(12.1.8)
H1:F(x) H1:F(x).=G(x). (12.1.10)
一個假設檢驗問題,就是利用待檢驗總體的子樣觀測值來決定,究竟應當接受原假設(拒絕備擇假設)還是應當拒絕原假設(接受備擇假設),至於原假設和備擇假設怎樣選擇,則是根據所要解決的具體問題來決定的。
式(12.1.4),式(12.1.5)的備擇假設對於待檢驗的參數的規定值,完全落在原假設.=.0的一側(上側或下側),這樣的檢驗稱為單側檢驗;式(12.1.6)備擇假設對的規定值落在H0:.=.0的兩側,稱為雙側檢驗.對於非參數檢驗的情形,式(12.1.8),式(12.1.9)是單側檢驗,式(12.1.10)是雙側檢驗。
12.1 假設檢驗的一般概念403
……
12.1.2 假設檢驗的一般方法
設X = {X1,X2,,Xn} 是從待檢驗總體抽取的隨機子樣,而U=U(X)為子樣統計量(見6.2節統計量的定義),在假設檢驗中稱為檢驗統計量,令W是U的值域,當零假設H0為真時,U落入W的一個子域R的機率用α表示,0.α.1,α = P (U ∈ R|H0)=R g(u|H0)du,(12.1.11)其中g(u|H0)是H0為真時統計量U的機率密度,一般α為一接近於零的正數,判斷待檢驗的假設是拒絕還是接受,是根據所謂小機率事件的原理,即機率很小的事件在一次隨機試驗中被認為是幾乎不可能發生的。因此,當我們有一組實際觀測值x1,x2,,xn並求出U的實際觀測值Uobs,如果它落在區域R之中,由於α很小,這一事件是小機率事件,因此,假設H0不大可能是正確的,我們稱在顯著性(水平)α上拒絕零假設H0而接受備選假設H1;反之,當Uobs落在子域W R內,則在水平α上接受H0而拒絕H1,對零假設H0作出接受或拒絕的判斷,通常稱為對H0作顯著性檢驗,子域R稱為拒絕域或臨界域,子域W-R則稱為接受域,臨界域與接受域分界點的統計量U的值Uc稱為臨界點或臨界值(圖12.1(a))。應當指出,在某些檢驗問題中,特別在某些雙側檢驗問題中,存在兩個分隔開的臨界域,因而有兩個臨界點,如圖12.1(b)所示。
圖12.1檢驗統計量U的臨界域R和接受域W-RUc(Uc.)為臨界值,g(u|H0)是H0為真時U的機率密度
由假設檢驗的上述判斷準則可知,即使零假設H0為真,但檢驗統計量U的實際觀測值仍然有α的機率落入拒絕域R,也就是說,當用Uobs來檢驗正確地反映觀測值的零假設時,有100α%的可能性將拒絕H0.這類錯誤稱為第一類錯誤,亦即棄真的錯誤,把本來正確的假設給否定了,為了減少棄真的錯誤,α應當取得儘可能地小。
此外,還可能出現第二類錯誤,即取偽的錯誤,當H0不為真但卻接受了H0.出現取偽錯誤的機率取決於備擇假設H1,它等於H1為真而U落入接收域W-R的機率β,β = P (U ∈ W . R|H1)= . W -R g(u|H1)du,(12.1.12)其中g(u|H1)表示H1為真時統計量U的機率密度.零假設H0對備擇假設H1的檢驗勢或勢函式定義為檢驗勢=1. β = P (U ∈ R|H1)=. R g(u|H1)du,(12.1.13) 即H1為真而統計量U落入零假設拒絕域R的機率。
圖12.2是假設檢驗中犯第一類錯誤的機率α和犯第二類錯誤的機率β的圖示,顯然,檢驗統計量U及臨界值Uc的合理選擇應當是使α儘可能地小,使檢驗勢1.β儘可能大,因而假設檢驗問題的癥結在於選擇適當的檢驗統計量U及其適當的臨界值Uc。
圖12.2參數假設檢驗中第一類錯誤的機率α和第二類錯誤的機率β
例12.1單個π0 和多個π0 事例的區分
考察在氫氣泡室中質子反質子湮滅產生的粒子,泡室只能顯示帶電粒子的徑跡,通過對徑跡的測量可確定帶電粒子的種類、飛行方向和動量;中性粒子則不能顯示和鑑別.pˉp反應的產物有許多事例觀測到四條徑跡,並可鑑別出它們是π± 介子,但測定了這些π介子的動量後發現,反應初態(pˉp)和反應末態(4個π介子) 之間不滿足能量和動量守恆,這表明,反應末態中還有“丟失”了的中性粒子沒有被觀測到,根據反應初態的能、動量和反應末態四個π介子的能、動量可以求出所謂的“丟失質量”(“丟失”的中性粒子的靜止能量之和),事例數的丟失質量分布稱為丟失質量譜,分析丟失質量譜可知,丟失的中性粒子可能是一個或多箇中性π0 介子,因此,pˉp反應事例可以分為產生一個π0 和產生多個π0 兩類.按照假設檢驗的概念,現在的問題可用下述零假設和備擇假設來表示:
H0:pˉp π+π+π.π.π0 ,→ H1:pˉp → π+π+π.π.M(M表示多個π0),丟失質量的平方m2 作為檢驗統計量,如果H0成立,即丟失了一個π0 ,那么m2 應當等於π0 質量的平方,即mπ2 0.顯然,臨界值mc2 的合理選擇應該是略高於mπ2 0.這樣,如果一個事例的丟失質量平方小於mc2 ,就有很大可能是產生一個π0 的事例,故接受H0是合理的;反過來若事例的丟失質量平方m2 大於mc2 ,那么有很大可能產生一個以上的π0 ,故應當拒絕H0而接受備擇假設H1,認為該事例是一個多π0 事件。
實驗中觀測到的全部事例的丟失質量譜一般都是連續分布,例如,圖12.3(a)就是一個典型的丟失質量譜直方圖,這是一個實驗分布,其中包含了測量誤差即實驗分辨函式的效應(見4.17.1節),這樣,儘管真實的丟失質量小於mπ2 0,但由於測量誤差,測得的m2 卻有一定的機率大於m2 π0;反之,真實的丟失質量大於m2 π0時,也有一定的機率實驗測定值卻小於mπ2 0,這就模糊了單π0 事件與多π0 事件的界限,使m2c 的選擇面臨兩難的境地。如果m2c 選得稍高於m2 π0,可以保證多π0 事例被誤認為單π0 事例的機率很小,即取偽錯誤的機率很小,但真實的單π0 事例卻有較大的可能損失掉(棄真的機率較大);反過來,若m2c 比mπ2 0大得多,雖然減小了棄真錯誤的機率,但取偽錯誤的機率卻由此增大了,這種情況在假設檢驗問題中是有代表性的,減小α和減小β這兩個要求常常互相牴觸,必須根據實際問題作適當的折中。……