定義
秩和檢驗(rank sum test)又稱順序和檢驗,它是一種非參數檢驗(nonparametric test)。它不依賴於總體分布的具體形式,套用時可以不考慮被研究對象為何種分布以及分布是否以知,因而實用性較強。
背景
在總體分布任意的情形下,檢驗配對的試驗數據所在總體的分布位置有無顯著差異,往往可以利用符號檢驗的方法實現。但是符號檢驗只考慮差數的正負號,而不考慮差數的絕對值差異,會導致部分試驗信息損失,結果較為粗略。為了避免符號檢驗方法的這一缺陷,Wilcoxon提出了一種改進方法,稱為Wilcoxon秩和檢驗(rank sum test)。這種方法同時考慮了差異的方向和差異的大小,較之符號檢驗更為有效。而對於成組的試驗數據所在總體的分布位置有無差異,也可以採用類似的方法進行檢驗。
秩和檢驗是通過將所有觀察值(或每對觀察值差的絕對值)按照從小到大的次序排列,每一觀察值(或每對觀察值差的絕對值)按照次序編號,稱為秩(或秩次)。對兩組觀察值(配對設計下根據觀察值差的正負分為兩組)分別計算秩和進行檢驗。除了比較各對數據差的符號外,這種方法還進一步比較了各對數據差值大小的秩次高低,因此其檢驗效率較符號檢驗為高。
特點
多個樣本兩兩比較的秩和檢驗
同樣的,多個樣本組比較的秩和檢驗,如拒絕H0,只說明比較各組的總體分布位置不同或不全相同,應在此基礎上進行兩兩比較,常用Nemenyi法。
秩和檢驗的優缺點
秩和檢驗的優點是(1)不受總體分布限制,適用面廣;(2)適用於等級資料及兩端無確定值的資料;(3)易於理解,易於計算。缺點是符合
參數檢驗的資料,用秩和檢驗,則不能充分利用信息,
檢驗功效低。
3.套用中的注意事項:
(1)注意套用條件;
(2)編秩時相同值要取平均秩次;
(3)相同秩次較多時,統計量要校正。
秩和檢驗常用軟體
spss軟體,只要輸入數據,選擇合適的參數,就可以很快得到結果。
類型
配對
對配對比較的資料應採用符號秩和檢驗(signed-rank test),其基本思想是:若檢驗假設成立,則差值的總體分布應是對稱的,故正負秩和相差不應懸殊。檢驗的基本步驟為:
(1)建立假設;
H0:差值的總體中位數為0;
H1:差值的總體中位數不為0;檢驗水準為0.05。
(2)算出各對值的代數差;
(3)根據差值的絕對值大小編秩;
(4)將秩次冠以正負號,計算正、負秩和;
(5)用不為“0”的對子數n及T(任取T+或T-)查檢驗界值表得到P值作出判斷。
應注意的是當n>25時,可用正態近似法計算u值進行u檢驗,當相同秩次較多時u值需進行校正。
成組
兩樣本成組資料的比較套用Wilcoxon秩和檢驗,其基本思想是:若檢驗假設成立,則兩組的秩和不應相差太大。其基本步驟是:
(1)建立假設;
H0:比較兩組的總體分布相同;
H1:比較兩組的總體分布位置不同;檢驗水準為0.05。
(2)兩組混合編秩;
(3)求樣本數最小組的秩和作為檢驗統計量T;
(4)以樣本含量較小組的個體數n1、兩組樣本含量之差n2-n1及T值查檢驗界值表;
(5)根據P值作出統計結論。
同樣應注意的是,當樣本含量較大時,套用正態近似法作u檢驗;當相同秩次較多時,套用校正公式計算u值。
多樣
多個樣本比較的秩和檢驗可用Kruskal-Wallis法,其基本步驟為:
(1)建立假設;
H0:比較各組總體分布相同;
H1:比較各組總體分布位置不同或不全相同;檢驗水準為0.05。
(2)多組混合編秩;
(3)計算各組秩和Ri;
(4)利用Ri計算出檢驗統計量H;
(5)查H界值表或利用卡方值確定機率大小。
應注意的是當相同秩次較多時,應計算校正Hc
等級
這類資料的特點是無原始值,只知其所在組段,故套用該組段秩次的平均值作為其秩次,在此基礎上計算秩和並進行假設檢驗,其步驟與兩組或多組比較秩和檢驗相同。需注意的是由於樣本含量較多,相同秩次也較多,套用校正後的u值和H值。