由來,套用,前提假設,單樣本t檢驗,配對樣本t檢驗,獨立雙樣本t檢驗,電腦軟體,另請參閱,
由來
學生t檢驗是威廉·戈塞為了觀測釀酒品質於1908年所提出的,“學生”則是他的筆名。基於克勞德·健力士(Claude Guinness)聘用從牛津大學和劍橋大學出來的最好的畢業生,以將生物化學及統計學套用到健力士工業流程的創新政策,戈斯特受僱於都柏林的健力士釀酒廠擔任統計學家。戈斯特提出了t檢驗以降低啤酒質量監控的成本。戈斯特於1908年在《Biometrika》期刊上公布t檢驗,但因其老闆認為其為商業機密而被迫使用筆名,統計學論文內容也跟釀酒無關。實際上,其他統計學家是知道戈斯特真實身份的。
今日,它更常被套用於小樣本判斷的置信度。
套用
最常用t檢驗的情況有:
- 單樣本檢驗:檢驗一個常態分配的總體的均值是否在滿足零假設的值之內,例如檢驗一群軍校男生的身高的平均是否符合全國標準的170公分界線。
- 雙樣本檢驗:其零假設為兩個常態分配的總體的均值之差為某實數,例如檢驗二群人的身高之平均是否相等。這一檢驗通常被稱為學生t檢驗。但更為嚴格地說,只有兩個總體的方差是相等的情況下,才稱為學生t檢驗;否則,有時被稱為Welch檢驗。以上談到的檢驗一般被稱作“未配對”或“獨立樣本”t檢驗,我們特別是在兩個被檢驗的樣本沒有重疊部分時用到這種檢驗方式。
- “配對”或者“重複測量”t檢驗:檢驗同一統計量的兩次測量值之間的差異是否為零。舉例來說,我們測量一位病人接受治療前和治療後的腫瘤尺寸大小。如果治療是有效的,我們可以推定多數病人接受治療後,腫瘤尺寸應該是變小了。
- 檢驗一條回歸線的斜率是否顯著不為零。
前提假設
大多數的t檢定之統計量具有t=Z/k的形式,其中Z與k是已知資料的函式。Z通常被設計成對於對立假說有關的形式,而k是一個尺度參數使t服從於t分布。以單樣本t檢驗為例,其中為樣本平均數,n為樣本數,為總體標準差。至於k在單樣本t檢驗中為,其中為樣本的標準偏差。在符合零假說的條件下,t檢定有以下前題:
- Z服從標準常態分配
- (n-1)k服從自由度(n-1)的卡方分布
- Z與k互相獨立
單樣本t檢驗
檢驗零假說為一群來自正態分配獨立樣本xi之母體期望值μ為μ0可利用以下統計量
配對樣本t檢驗
配對樣本t檢驗可視為單樣本t檢驗的擴展,不過檢驗的對象由一群來自正態分配獨立樣本更改為二群配對樣本之觀測值之差。
若二群配對樣本x1i與x2i之差為di=x1i−x2i獨立且來自正態分配,則di之母體期望值μ是否為μ0可利用以下統計量
獨立雙樣本t檢驗
樣本數及方差相等
若二群獨立樣本x1i與x2i具有相同之樣本數n,並且彼此獨立及來自二個方差相等的正態分配,則二群母體之期望值差μ1-μ2是否為μ0可利用以下統計量
該統計量t在零假說:μ1-μ2=μ0為真的條件下服從自由度為2n−2的t分布。
樣本數不相等但方差相等
若二群獨立樣本x1i與x2j具有不相同之樣本數n1與n2,並且彼此獨立及來自二個方差相等的正態分配,則二群母體之期望值之差μ1-μ2是否為μ0可利用以下統計量
該統計量t在零假說:μ1-μ2=μ0為真的條件下服從自由度為n1+n2−2的t分布。
樣本數及方差皆不相等
若二群獨立樣本x1i與x2j具有相等或不相同之樣本數n1與n2,並且彼此獨立及來自二個方差不相等的正態分配,則二群母體之期望值之差μ1-μ2是否為μ0可利用以下統計量