定義
假設檢定是
推論統計中用於檢驗統計假設的一種方法。而“統計假設”是可通過觀察一組
隨機變數的模型進行檢驗的科學
假說。一旦能估計未知
參數,就會希望根據結果對未知的真正參數值做出適當的推論。
統計上對參數的假設,就是對一個或多個參數的論述。而其中欲檢驗其正確性的為
零假設(null hypothesis),零假設通常由研究者決定,反應研究者對未知參數的看法。相對於
零假設的其他有關參數之論述是
備擇假設(alternative hypothesis),它通常反應了執行檢定的研究者對參數可能數值的另一種(對立的)看法(換句話說,備擇假設通常才是研究者最想知道的)。
說明
假設檢定的過程,可以用法庭的審理來說明。先想像法庭上有一名被告,假設該被告是清白的,而檢察官必須要提出足夠的證據去證明被告的確有罪。 在證明被告有罪前,被告是被假設為清白的。
假設被告清白的假設,就相當於
零假設(null hypothesis)。
假設被告有罪的假設,則是
備擇假設(alternative hypothesis)。
而檢察官提出的證據,是否足以確定該被告有罪,則要經過檢驗。 這樣子的檢驗過程就相當於用T檢驗或Z檢驗去檢視研究者所蒐集到的統計資料。
檢驗過程
在統計學的文獻中,假設檢驗發揮了重要作用。假設檢驗大致有如下步驟:
最初研究假設為真相不明。
第一步是提出相關的零假設和備擇假設。這是很重要的,因為錯誤陳述假設會導致後面的過程變得混亂。
第二步是考慮檢驗中對樣本做出的統計假設;例如,關於
獨立性的假設或關於觀測數據的分布的形式的假設。這個步驟也同樣重要,因為無效的假設將意味著試驗的結果是無效的。
在零假設下推導檢驗統計量的分布。在標準情況下應該會得出一個熟知的結果。比如檢驗統計量可能會符合學生t-分布或
常態分配。
選擇一個
顯著性水平(
α),若低於這個機率閾值,就會拒絕零假設。最常用的是 5% 和 1%。
根據在零假設成立時的檢驗統計量T分布,找到數值最接近備擇假設,且機率為顯著性水平 (α)的區域,此區域稱為“拒絕域”,意思是在零假設成立的前提下,落在拒絕域的機率只有α。
針對檢驗統計量T,根據樣本計算其估計值tobs。
若估計值tobs未落在“拒絕域”,接受零假設。若估計值tobs落在“拒絕域”,拒絕零假設,接受備擇假設。
例子
淑女品茶是一個有關假設檢驗的著名例子,費雪的一個女同事聲稱可以判斷在奶茶中,是先加入茶還是先加入牛奶。費雪提議給她八杯奶茶,四杯先加茶,四杯先加牛奶,但隨機排列,而女同事要說出這八杯奶茶中,哪些先加牛奶,哪些先加茶,
檢驗統計量是確認正確的次數。零假設是女同事無法判斷奶茶中的茶先加入還是牛奶先加入,備擇假設為女同事有此能力。
若單純以機率考慮(即女同事沒有判斷的能力)下,八杯都正確的機率為1/70,約1.4%,因此“拒絕域”為八杯的結果都正確。而測試結果為女同事八杯的結果都正確,在統計上是相當顯著的的結果。
相關條目
方差分析或
變方分析(
Analysis of variance,簡稱
ANOVA)為數據分析中常見的
統計模型,主要為探討連續型(Continuous)資料型態之因變數(Dependent variable)與類別型資料型態之自變數(Independent variable)的關係,當自變項的因子中包含等於或超過三個類別情況下,檢定其各類別間平均數是否相等的統計模式,廣義上可將T檢定中方差相等(Equality of variance)的合併T檢定(Pooled T-test)視為是方差分析的一種,基於T檢定為分析兩組平均數是否相等,並且採用相同的計算概念,而實際上當方差分析套用在合併T檢定的分析上時,產生的F值則會等於T檢定的平方項。
方差分析依靠
F-分布為機率分布的依據,利用平方和(Sum of square)與自由度(Degree of freedom)所計算的組間與組內均方(Mean of square)估計出F值,若有顯著差異則考量進行
事後比較或稱多重比較(Multiple comparison),較常見的為Scheffé's method、Tukey-Kramer method與Bonferroni correction,用於探討其各組之間的差異為何。