行為定義
統計學的基本概念之一假設檢驗中,待檢驗的有關總體分布的一項命題的假設稱為原假設。假設是否正確,要用從總體中抽出的樣本進行檢驗,與此有關的理論和方法,構成假設檢驗的內容。設
A是關於總體分布的一項命題,所有使命題
A成立的總體分布構成一個集合
h0,稱為原假設(常簡稱假設)。使命題
A不成立的所有
總體分布構成另一個集合
h1,稱為
備擇假設。如果
h0可以通過有限個實參數來描述,則稱為參數假設,否則稱為非參數假設(見
非參數統計)。如果
h0(或
h1)只包含一個分布,則稱原假設(或備擇假設)為
簡單假設,否則為
複合假設。對一個假設
h0進行檢驗,就是要制定一個規則,使得有了樣本以後,根據這規則可以決定是接受它(承認命題
A正確),還是拒絕它(否認命題
A正確)。這樣,所有可能的樣本所組成的空間(稱
樣本空間)被劃分為兩部分HA和HR(HA的補集),當樣本
x∈HA時,接受假設
h0;當
x∈HR時,拒絕
h0。集合HR常稱為檢驗的
拒絕域,HA稱為接受域。因此選定一個檢驗法,也就是選定一個拒絕域,故常把檢驗法本身與拒絕域HR等同起來。
針對假設檢驗中"對一個具體問題,在相同的顯著性水平α下進行假設檢驗,如果交換原假設和備擇假設,得到的結論可能完全相反"這一問題進行分析,並給出根據實際問題的要求如何正確建立原假設和備擇假設的方法。
設定策略
在實證分析中,樣本的數據生成過程是未知的,因此原假設的合理設定是單位根檢驗的一個首要問題,它直接影響檢驗式的選擇和檢驗的結果。
ADF(DF)和PP檢驗是廣為套用的單位根檢驗方法,針對它們提出的原假設和檢驗式的設定方法有圖示法,Dolado等(1990)提出的一般檢驗程式,Schwen(1987)提出的以
ARIMA模型為原假設的方法等等。這些設定方法或者沒有考慮原假設的可信度,或者沒有考慮單位根檢驗的可靠。我們的模擬試驗表明原假設的錯誤設定將導致嚴重的誤導、那么該如何依據給定的樣本數據合理設定原假設呢?
圖示法和Dolado等提出的一般檢驗程式是實證分析中常被採用的設定原假設和檢驗式的方法。前者的基本思想是通過分析樣本序列的趨勢圖,確定原假設和檢驗式是否含有漂移或趨勢項,後者是直接設定原假設和檢驗式為一般形式,然後通過檢驗檢驗式中漂移和趨勢項的顯著性,修正原假設和檢驗式。它們的共同特點是依據樣本序列的特徵直接設定原假設和檢驗式,以DF臨界值為檢驗標準進行ADF(DF)和PP檢驗。
Schwen(1987)研究結果表明,經濟和金融時序的數據生成過程模型通常含有MA成分,而且當原假設的誤差項為高度負相關的MA(1)過程時,以DF臨界值為檢驗標準的ADF(DF)和PP檢驗通常存在非常嚴重的檢驗水平扭曲問題。於是在考慮原假設可信度的前提下,他提出了以ARIMA模型為原假設,並以統計量的實際分位數為臨界值的檢驗方法。這種檢驗方法考慮了原假設的可信度,又在一定程度上修正了檢驗水平的扭曲。
原假設的設定是
單位根檢驗的首要問題。通過剖析以往單位根檢驗原假設設定存在的缺陷,在同時考慮原假設的可信度和檢驗可靠性的前提下,靳庭良提出了單位根檢驗原假設的一種合理的設定策略及改進的檢驗程式。該單位根檢驗程式中原假設的設定、檢驗式和臨界值的確定均以樣本序列的數據生成過程為依據,與傳統單位根檢驗程式相比更具有科學性,同時也提高了檢驗的可靠性。其缺陷是數據生成過程模型的估計對檢驗結果可能產生一定的影響,因此,研究新檢驗程式的檢驗結果對數據生成過程模型估計的敏感性對進一步完善單位根檢驗理論無疑具有重要意義。
備擇假設
在確立原假設與備擇假設時應遵循以下兩個原則:
(1)原假設是在一次試驗中有絕對優勢出現的事件,而備擇假設在一次試驗中不易發生(或幾乎不可能發生)的事件。因此,在進行單側檢驗時,最好把原假設取為預想結果的反面,即把希望證明的命題放在備擇假設上。
(2)將可能犯的嚴重錯誤看作第一類錯誤,因為犯第一類錯誤的機率可以通過a的大小來控制。犯第二類錯誤的機率夕是無法控制的。如醫生對前來問診的病人作診斷時,可能會犯“有病看成無病”或者“無病看成有病’的錯誤,相比較而言,“無病看成有病“的錯誤更嚴重,故應將“問診人有病”作為原假設。而在某項疾病普查中,將“被檢查人有病’作為原假設就不恰當了。
假設檢驗是統計分析的一種重要方法,正確的理解假設檢驗過程中由於文換原假設與備擇很設所引發的結論的差異,對於我們理解假設檢驗的思想以及掌握其方法都是十分重要的。只有更好地掌握假設檢驗的思想方法,才能在實踐中套用假設檢驗方法解決實際問題。