序貫判別法是判別分析中套用的類似序貫抽樣的一種方法。一般判別法要求對每個樣品的每個指標都要測量,序貫判別法類似序貫抽樣檢驗,它是採取逐項指標測定,當能作出判斷時,其餘指標就不需要測量了。所以序貫判別法可以節省樣品的指標,但一般參加構成判別式的樣品必須足夠多。
基本介紹
- 中文名:序貫判別法
- 外文名:sequential judgment method
- 所屬學科:數學
- 所屬問題:統計學(判別分析)
- 相關概念:序貫抽樣檢驗
基本原理,算法步驟,序貫判別法的套用,
基本原理
序貫判別法是一種對多母體離散型數據建立序貫判別模型的方法,其基本思想是,對樣本數據,套用貝葉斯逆機率公式的方法,把判別一個子樣歸屬於多個母體中的某一母體的文題,歸結為計算已知各指標值的條件下各母體的機率分布。當對各指標值一無所知時,客觀上有一組先驗機率,可理解為各母體出現的慨率。而當某幾項指標值已知時,先驗機率就變成為後驗機率。然而先驗與後驗是相對的,實際上前k項指標值已知時各母體發生的機率。又是推算獲知第(k+1)項指標時各條件機率的先驗機率。不斷地以上一步的後驗機率作為下一步的先驗機率,就保證了判別的序號進行。
為了選擇最有效的後繼指標,必須選定一個量來刻畫不同母體的可區分性。對於離散型情形,我們通過給定樣本值的條件下各母體間的熵來反映該條件下樣本歸屬的不確定性。顯然這種條件熵越小,肯定樣本的歸屬就越容易。我們就是從條件墒最小的原則出發來制定序貫判別規則的。
算法步驟
(1)利用全部樣本從所有候選的指標中選出一個,使得在這個指標的不同取值情形下諸母體間熵的平均值最小;
(2)構想觀察了該指標之後可能的各種結果。針對不同結果把原來的“訓練樣本”分成相應的幾部分,隨即分別向各部分“學習”。從其餘候選的指標中分別選出後繼的最佳指標,使得在其不同取值的情況下諸母體間熵的平均值最小;
(3)當諸總體間的熵已經較小或當再增加新的指標不能使熵有較大的減少時,便停止選用後繼的指標,判別樹的這—枝叉便告結束;
(4)對每—樹枝分別作(2)和(3),直到全部樹枝達到樹梢為止。最終完成了序貫判別樹的建立。
序貫判別法的套用
序貫判別法在經濟狀態識別中的套用
套用序貫判別法進行經濟狀態識別步驟如下:
(1)邀請多名經濟學家和有實踐工作經驗的經濟工作者,對經濟運行中可能出現的狀態進行分類,界定其經濟特徵和數量表現;
(2)選擇較大數量的樣本(如巨觀經濟指標的月度數據)作為”訓練樣本”。請專家確每一樣本應歸屬的經濟狀態(在判別時要使每一樣本僅歸屬一個狀態);
(3)對“訓練樣本”進行“學習”,建立序貫判別樹,並使用訓練樣本檢查此判別樹的判別效果,當此判別樹通過檢驗後方可使用;
(4)對待識別樣本套用此判別樹作序貫判別,判定其總體的歸屬,確定該樣本的狀態。