統計檢驗

統計檢驗

統計檢驗亦稱“假設檢驗”。根據抽樣結果,在一定可靠性程度上對一個或多個總體分布的原假設作出拒絕還是不拒絕(予以接受)結論的程式。決定常取決於樣本統計量的數值與所假設的總體參數是否有顯著差異。這時稱差異顯著性檢驗。檢驗的推理邏輯為具有機率性質的反證法。例如,在參數假設檢驗中,當對總體分布的參數作出原假設 H0 後,先承認總體與原假設相同, 然後根據樣本計算一個統計量,並求出該統計量的分布,再給定一個小機率(一般為 0.05,0.01 等,視情況而定),確定拒絕原假設 H0 的區域(拒絕域)。

求抽樣分布,選擇,統計量,判定,

求抽樣分布

在做了必要的假設之後,我們就能用數學推理過程來求抽樣分布了。由於數學上已經取得的成果,實際上統計工作者要做的這項工作往往並不是真的去求抽樣分布的數學形式,而是根據具體需要,確定特定問題的統計檢驗應該採用哪種分布的數學用表。

選擇

顯著性水平和否定域
有了與問題相關的抽樣分布,我們便可以把所有可能的結果分成兩類:一類是不大可能的結果;另一類人們預料這些結果很可能發生。既然如此,如果我們在一次實際抽樣中得到的結果恰好屬於第一類,我們就有理由對機率分布的前提假設產生懷疑。在統計檢驗中,這些不大可能的結果稱為否定域。如果這類結果真的發生了,我們將否定假設;反之就不否定假設。機率分布的具體形式是由假設決定的,假設肯定不止一個。在統計檢驗中,通常把被檢驗的那個假設稱為零假設(或稱原假設,用符號H0表示),並用它和其他備擇假設(用符號H1表示)相對比。值得注意的是,假設只能被檢驗,從來不能加以證明。統計檢驗可以幫助我們否定一個假設,卻不能幫助我們肯定一個假設。為了使檢驗更嚴格、更科學,還需要更多的東西。首先,我們必須確定冒犯第一類和第二類錯誤的風險的程度;其次,要確定否定域是否要包含抽樣分布的兩端。第一類錯誤是,零假設H0實際上是正確的,卻被否定了。第二類錯誤則是,H0實際上是錯的,卻沒有被否定。第二類錯誤是,零假設H0實際上是錯誤的,卻沒有被否定。遺憾的是,不管我們如何選擇否定域,都不可能完全避免第一類錯誤和第二類錯誤,也不可能同時把犯兩類錯誤的危險壓縮到最小。對任何一個給定的檢驗而言,第一類錯誤的危險越小,第二類錯誤的機率就越大;反之亦然。一般來講,不可能具體估計出第二類錯誤的機率值。第一類錯誤則不然,犯第一類錯誤的機率是否定域內各種結果的機率之和。由於犯第一類錯誤的危險和犯第二類錯誤的危險呈相背趨向,所以統計檢驗時,我們必須事先在冒多大第一類錯誤的風險和多大第二類錯誤的風險之間作出權衡。被我們事先選定的可以犯第一類錯誤的機率,叫做檢驗的顯著性水平(用α表示),它決定了否定域的大小。如果抽樣分布是連續的,否定域可以建立在想要建立的任何水平上,否定域的大小可以和顯著性水平的要求一致起來(後面的正態檢驗就如此)。如果抽樣分布是非連續的,就要用累計機率的方法找出一組構成否定域的結果。即在已知機率分布表上,從兩端可能性最小的機率開始向中心累計,直至機率之和略小於選定的顯著性水平為止。在許多場合,我們能預測偏差的方向,或只對一個方向的偏差感興趣。每當方向能被預測的時候,在同樣顯著性水平的條件下,單側檢驗比雙側檢驗更合適。因為否定域被集中到抽樣分布更合適的一側,可以得到一個比較大的尾端。這樣做,可以在犯第一類錯誤的危險不變的情況下,減少了犯第二類錯誤的危險。

統計量

完成了上述工作之後,接下來就是做一次與理想試驗儘量相同的實際抽樣(比如實際做一次重複拋擲硬幣的試驗),並從獲取的樣本資料算出檢驗統計量。檢驗統計量是關於樣本的一個綜合指標,但與第九章參數估計中將要討論的統計量有所不同,它不用作估測,而只用作檢驗。

判定

假設檢驗系指拒絕或保留零假設的判斷,又稱顯著性檢定。在選擇否定域並計算檢驗統計量之後,完成最後一道手續,即根據試驗或樣本結果決定假設的取與舍。如果結果落在否定域內,將在已知犯第一類錯誤機率的條件下,否定零假設。反之,如果結果落在否定域外,則不否定零假設,與此同時,就有了犯第二類錯誤的危險。

相關詞條

熱門詞條

聯絡我們