概念
在Wilcoxon符號秩檢驗中,它把觀測值和零假設的中心位置之差的絕對值的秩分別按照不同的符號相加作為其檢驗統計量。它適用於T檢驗中的成對比較,但並不要求成對數據之差di服從常態分配,只要求對稱分布即可。檢驗成對觀測數據之差是否來自
均值為0的總體(產生數據的總體是否具有相同的均值)。
檢驗步驟
正負
符號檢驗和威爾科克森符號秩檢驗,都可看作是就成對觀察值而進行的參數方式的T檢驗的代用品,
非參數檢驗具有無需對
總體分布作假定的優點,而就成對觀察值作的參數方式的T檢驗,必須假定有關的差別總體服從
常態分配。
該方法具體步驟如下:
(1)對i=1,...,n,計算∣Xi-M0∣,它們代表這些樣本點到M0的距離。
(2)把上面的n個絕對值排序,並找出它們的n個秩,如果它們有相同的樣本點,每個點取平均秩(如1,4,4,5的秩為1,2.5,2.5,4)。
(3)令W+等於Xi-M0>0的∣Xi-M0∣的秩的和,而W-等於Xi-M0<0的∣Xi-M0∣的秩的和。
(4)對雙邊檢驗H0:M=M0<=>H1:M≠M0,在零假設下,W+和W-應差不多。因而,當其中之一很小時,應懷疑零假設。在此,取檢驗統計量W=min(W+,W-)
(5)根據得到的W值,利用統計軟體或查Wilcoxon符號秩檢驗的分布表以得到在零假設下的p值。如果n很大要用正態近似:得到一個與W有關的正態隨機變數Z的值,再用軟體或查常態分配表得到p值。
(6)如果p值較小(比如小於或等於給定的顯著性水平,譬如0.05)則可以拒絕零假設。如果p值較大則沒有充分的證據來拒絕零假設,但不意味著接受零假設。
套用舉例
下面是分別用高錳酸鉀法和EDTA法對某生長期蛋雞
配合料鈣含量進行的7次測定結果(湖北省飼料質量監督檢驗站2002年常規檢測樣品),比較兩種方法測定結果差異是否顯著。
首先按大小順序對兩對觀測值之差di進行等級排序,並加上
正負號,分別計算正負等級之和:T+=21,T-=-7。
高錳酸鉀法和EDTA法測定蛋雞配合料鈣含量結果(%)
編號
| 高錳酸鉀法
| EDTA法
| di
| 等級
|
1
| 1.26
| 1.24
| 0.02
| 4.5
|
2
| 1.24
| 1.28
| -0.04
| -7
|
3
| 1.24
| 1.21
| 0.03
| 6
|
4
| 1.25
| 1.25
| 0
| 1.5
|
5
| 1.26
| 1.26
| 0
| 1.5
|
6
| 1.25
| 1.24
| 0.01
| 3
|
7
| 1.24
| 1.22
| 0.02
| 4.5
|
假設兩種方法檢測飼料中鈣含量結果無顯著差異,即檢驗:
H0:兩種方法檢測結果無顯著差異;
H1:兩種方法檢測結果有差異。
查附表得到,對於α=0.05的
雙側檢驗,n=7 時,T0.025=4。由於 T+=21> T0.025 ,則接受H0,可以認為兩種方法測定飼料鈣含量結果並無顯著差異。
T臨界值表
單側α
| 雙側α
| n值
| 5
| 6
| 7
| 8
| 9
| 10
| 11
| 12
| 13
| 14
| 15
| 16
|
0.05
| 0.10
| T值
| 1
| 2
| 4
| 6
| 8
| 11
| 14
| 17
| 21
| 26
| 30
| 36
|
0.025
| 0.05
| | 1
| 2
| 4
| 6
| 8
| 11
| 14
| 17
| 21
| 25
| 30 |
0.01
| 0.02
| | | 0
| 2
| 3
| 5
| 7
| 10
| 13
| 16
| 20
| 24 |
0.005
| 0.01
| | | | 0
| 2
| 3
| 5
| 7
| 10
| 13
| 16 | 19 |
檢驗比較
符號檢驗利用了觀測值和零假設的中心位置之差的符號進行檢驗,但是它並沒有利用這些差的大小(體現於差的絕對值大小)所包含的信息。因此,在符號檢驗中,每個觀測值點相應的正號或負號僅僅代表了該點在中心位置的哪一邊,而並沒有表明該點距離中心的遠近。如果把各觀測值距離中心遠近的信息考慮進去,自然比僅僅利用符號要更有效。這也是引進Wilcoxon符號秩檢驗的宗旨。
注意:該檢驗需要假定樣本點X1,X2...,Xn來自連續對稱總體分布(符號檢驗不需要這個假設)
在這個假定下,總體中位數等於均值。它的檢驗目的和符號檢驗是一樣的,即要檢驗H0:M=M0(相對於各種單雙邊的備選假設)
威爾科克森
弗蘭克·威爾科克森(Frank Wilcoxon,1892—1965),美國統計學家、化學家。
威爾科克森出生在愛爾蘭科克附近格倫加里夫城堡的一個富有的美國家庭。父親是一位詩人、野外工作者和狩獵者。當他還在孩提時,父母即回到美國,因此,威爾科克森的童年,是在哈得孫河畔,紐約的克蒂斯克爾渡過的。
威爾科克森的早期教育,是從家庭教師得到的。他青年時代,在紐約港做過商船水手,在西維吉尼亞一個偏僻地區管理過煤氣抽送站,當過樹醫,以後進入賓夕法尼亞軍事學院,1917年畢業,獲得理學士學位。但他並不喜歡軍事管理體制,認為這不符合他的個人自由觀念。
在軍事學院畢業後,威爾科克森曾在密西根霍頓的阿特拉斯電力公司工作,並於1920年進入拉特格斯大學學習化學。1921年,他獲得了理科碩士學位,繼續在科內爾大學作研究生,並擔任助教,於1924年獲物理化學方面的哲學博士學位。此後,他成為赫克舍研究員。1926年5月,他與匹茲堡的一位研究生弗雷德里卡·費西亞絲(Frederica Facius)女士結為伉儷。在以後的生活中,他們對統計學會有著共同的愛好,一起定期參加戈登研究會在化學和化學工程統計方面的活動。
1927年,威爾科克森離開科內爾大學,到尼科爾斯·科珀公司組織的、位於紐約容克斯的博伊斯·湯普森植物研究所,擔任農作物保護高級研究員。1928年,威爾科克森轉到尼科爾斯·科珀公司工作。1929年,博伊斯·湯普森研究所從赫爾曼·弗雷奇基金會得到一筆補助金,又請威爾科克森回去領導殺蟲藥劑和真菌作用研究小組。從此,他與這個研究所結下不解之緣,中間雖然幾度離開,但卻與它保持著長期的合作。直到他退休後,還為研究所擔任統計方面的業餘顧問。
在此期間,威爾科克森從1929年起,除開博伊斯·湯普森研究所的專職工作外,還利用晚上時間,為布魯克林理工學院的研究生講授物理、化學課程;並於1934—1935年期間到前蘇聯進行訪問,考察了解前蘇聯的計畫經濟生活的“巨型實驗”。1941年,他辭去研究所和學校的工作,到艾奧華擔任雷文納軍械廠控制實驗室主管。1943年,他成為康乃狄克州斯坦福美國氨基氰公司的殺蟲藥劑和真菌劑小組的領導。1950年,他轉到了紐約珀爾河一個公司的勒德爾實驗室,並在這裡創建了一個統計諮詢組,從事統計諮詢工作,直到1957年退休。
威爾科克森對統計的研究,開始於早期在博伊斯·湯普森研究所。當時,他對奧爾頓(C·R·Orton)的溫室研究、反覆實驗、有機易變種籽處理感到興趣。正好羅納德·費暄(Ronald · A·Fisher,1890—1962)的《研究人員用的統計方法》一書的第一版在這時出版,威爾科克森和同事生物學家丹尼(F·E·Denny)、化學工程師尤登(W·J·Youden,1900—1971)、昆蟲學家布利斯(C·I ·Bliss)等就組織成立了一個小組來對該書進行研究,受到很大啟發。此後,便對統計學更加感到興趣,閱讀了大量有關著作。
威爾科克森在統計學方面,可以說是自學成材的。他對統計學的最大貢獻是他提出的等級評定法,即非參數檢驗法。
威爾科克森的第一篇統計著作是在1945年發表的,題目是《統計學在植物病理學方面的某些套用》。緊接著,他於同年又在《生物統計學》雜誌第一卷上,發表了《用等級評定法進行個體比較》的重要文章,提出了很有價值的等級評定法。他所發展的等級評定法的兩個奠基石:“雙樣本等級和統計量”與“單樣本(或配對樣本)符號等級統計量”,現在已為眾所周知,被用他的名字命名為“威爾科克森等級和統計量”與“威爾科克森符號等級統計量”。次年,他又在《生物統計學學報》上發表了《用等級評定法分組數據的個體比較》,再次論證了他的等級評定法。他的這兩個統計量,在發展等級評定法方面是令人鼓舞的推動力,是統計學中非參數法的中心主題。
威爾科克森檢驗與古典t檢驗比較,具有許多優點:(1)計算容易、快速;(2)套用精確的顯著性水平,而不用限制性的正態假設;(3)對游離樣本觀察值相對地不那么靈敏;(4)在數據的某些單調變換情況下具有不變性;(5)適用於有序數據的情況;(6)對寬闊的可替換分布組具有優越功效性質;(7)對有趣的位置參數無分布置信限通過轉換具有實用性。
威爾科克森的等級評定法使他在統計界獲得很高聲譽。但是,也有一些人對他的成果持批評態度,認為他對雙樣本問題,並未談到不等樣本含量通過等級和統計量的處理,而是由曼(H· R·Mann,1925—)和惠特尼(D · R ·Whitney)來解決的。還有些人引證克魯斯卡爾(W·H·Kruskal,1919—)1957年關於等級和檢驗歷史的淵博文章,表明對雙樣本檢驗,曾經有人在時間上早於威爾科克森提出過獨立的建議或接近有關這類方法。在早些時候的教材中,例如霍特林(H · Hotelling,1895—1973)和帕勃斯特(M·R·Pabst)1936年及弗里德曼(M·Friedman,1912—)1937年對等級已有套用。美國統計學家布拉德利(L· A · Bradley,1923—)和霍蘭德爾(M · Hollander,1941—)則認為:這些評價“並未使威爾科克森的光輝貢獻為之失色”。因為“這裡有一個基本的觀念:用等級值代替實際樣本值,從而相對地減少複雜分布理論的簡單計算,同時還獲得許多統計上的好處。而且,威爾科克森能夠對他的方法作出簡要的、非數學方式的描述本身,就減少了許多沒有受過統計訓練的潛在使用者可能的顧慮,從而促進了等級評定法的廣泛套用。”
五十年代後期,威爾科克森把他的研究引向深化,他仔細地研究如何使等級評定法獲得滿意的性質,能夠套用於更複雜數據的情況。他對雙向分類以及等級總和的聯合分布感到很大興趣。
六十年代,他著重研究了多重比較法和非參數序貫分析。他在1964年對其1947年著作《某些快速近似統計方法》中關於多重比較法的結論進行了修正,使之成為人們更能接受的重要統計方法。同時,他認為,基於等級在固定樣本大小情況下被證明如此成功,它們應當推廣到獲得的數據是有序的和在樣本中的觀察值數目本身是隨機量的情況。他的這一觀點,導致了他和布拉德利等人在六十年代中期合作發展了許多序貫等級評定法。1966年,他和丹尼爾(Cuthbert Daniel,1904—)合作,發表了《因素2p-q方案穩健性與線性及二次趨勢的對比》文章,提出了可能對某些線性二次趨勢穩健的析因實驗設計。
威爾科克森非常關心統計教育。他堅持正規教學差不多有二十年之久,他為自然科學方面學生開的統計方法論課程,聽講的人數超過了註冊學生人數。他堅持,如果對問題沒有正確的最終數字答案,即使所用的方法是正確的,也不給予評定等級的榮譽。他在1957年退休後,除了從事統計諮詢活動和統計科學研究外,還於1960年到佛羅里達州立大學新創辦的統計系擔任業餘講師。他的知識和經驗對這個新成立的系貢獻很大。
威爾科克森是美國統計協會的成員,他在統計方面的活動直到他的生命終結。
威爾科克森興趣廣闊,才華橫溢,他是一個充滿熱情的樂於把自己的知識、興趣和生活之樂傳給周圍世界的人。他對音樂有很深修養,是一位伴奏音樂家,擅長彈奏吉它,還會其它幾種弦樂器。他熟悉多種語言,在三十年代中期訪問蘇聯時,掌握了熟練的俄語閱讀知識;在他去世前一年,他認真研究了荷蘭文;在他母親失明後,他研究了盲文。他喜歡數學遊戲、智力測驗、計算圖表、研究求積儀。他對統計學的教學充滿熱忱,講課深入淺出,生動活潑,深受學生們的愛戴。他經常使用一個長頸瓶,裡面裝著兩串不同顏色的珠子,塞上瓶口,來摸擬雙樣本等級檢驗。他曾經對民間使用的一種用兩根L形鐵杖來探尋埋管道和水管線的“魔”杖(即一種用迷信方法來探尋礦脈、水源用的木叉式探礦杖)感到興趣,在參加戈登研究會時,對漢普頓中學的許多管道的位置和線路進行了探尋,並找了各種地質學家和物理學家進行磋商,企圖為之找出某種解釋。他喜歡大自然和野外活動,如騎腳踏車,爬樹等。他在中年時,同妻子經常騎腳踏車作度假旅行,一天跑100英里。在佛羅里達州立大學時,他購置了一輛本田機車,經常騎著它去工作。他對自己的爬樹能力感到自豪,直到七十多歲時摔了一跤,才減少了這方面的活動。他在一次乘獨木船旅行後,由於心臟病突發,於1965年11月18日在佛羅里達州的塔拉哈西去世,終年七十三歲。
威爾科克森還是
美國科學促進協會的成員,戈登研究會在化學和化學工程統計方面早期的主席。美國質量控制學會化學部每年都要對在《工程測量學》雜誌上發表的最好的文章頒發“威爾科克森獎”。佛羅里達州立大學為了表示對他的崇敬,將該校統計圖書館和閱覽室命名為弗蘭克·威爾科克森紀念室。
威爾科克森的主要統計著作有:
1.《用等級評定法進行個體比較》,1945年;
2.《某些快速近似統計方法》,1947年;
3.《等級相關法》,與J·T·里奇菲爾德合作,1955年;
4.《用於篩選實驗的兩個序貫雙樣本組的等級檢驗》,與L·J·羅茲、R·A·布拉德利合作,1963年;
5.《因素2-方案穩健性與線性及二次趨勢的對比》,與C·丹尼爾合作,1966年;
6.《在雙向分類中等級總和範圍的實際公布》,與P·鄧-蘭金合作,1966年;
7.《對威爾科克森等級和檢驗與威爾科克森符號等級檢驗的臨界值及機率水平》,與S·K·凱蒂、R·A·威爾科克斯合作,1970年。