雙重篩選逐步回歸

雙重篩選逐步回歸

雙重篩選逐步回歸亦稱多對多雙重篩選逐步回歸法。多個因變數與多個自變數建立回歸式時,不僅對自變數進行篩選,而且對因變數也同時進行篩選。並且依因變數和自變數的關係將因變數進行分組。具體地說設有p個因變數y1,y2,…yp,q個自變數x1,x2,…xq。若自變數的一部分僅對因變數的一部分有顯著的相關關係,不妨設y1,y2,…yp1與x1,x2,…xq1有顯著的相關關係則將它們建立回歸式,剔除相關不顯著的一些自變數和因變數。若另一部分yp1+1,yp1+2,…yp2與xq1+1,xq1+2,…xq2有顯著的相關關係,則再將它們建立回歸式,剔除相關不顯著的一些自變數和因變數。如此繼續下去,直到所有因變數都建立回歸式為止。這樣建立多組的回歸式,組和組之間因變數不會有相同的,而自變數可能有共同的。這種方法稱為多個因變數和多個自變數的雙重篩選逐步回歸法。

基本介紹

  • 中文名:雙重篩選逐步回歸
  • 所屬學科:數學
  • 所屬問題:統計學(多元統計分析)
  • 別稱:多對多雙重篩選逐步回歸法
雙重篩選逐步回歸的概念,雙重篩選逐步回歸的基本思想,雙重篩選逐步回歸的步驟,

雙重篩選逐步回歸的概念

多重多元線性回歸分析的計算工作量很大,而且較為繁瑣,所以人們往往是將多個自變數對每一個因變數逐個進行回歸建立回歸模型,但這種做法會丟失多個因變數之間相關的信息,而雙重篩選逐步回歸分析,可以解決上述這類問題。
多個自變數與多個因變數建立回歸方程時,不僅要對自變數進行篩選,而且對因變數也要進行篩選,所謂篩選即保留與之密切關係的變數,剔除與之無關緊要的變數,並且根據因變數和自變數的關係將因變數進行分組。例如研究自變數
對因變數
的回歸方程時,如自變數的一部分僅對因變數的一部分有較密切的關係,不妨設
有較密切的關係,而另一部分因變數
有密切關係,…,如此等等,因此,就希望將它們分組建立回歸方程,此時
一定不會有共同的變數,而對於
可能有共同的變數,因為一個自變數可能對許多因變數甚至是全部因變數都有影響,這種方法就是多重篩選逐步回歸法

雙重篩選逐步回歸的基本思想

多重篩選逐步回歸的基本思想是:首先選一個因變數,不妨記為Y1,對它來篩選所有的自變數,在自變數篩選結束後,再考慮在未入選的因變數中選第二個因變數,不妨記為Y2,這時已有兩個因變數Y1,Y2入選,因此要考慮Y1,Y2是否有剔除的,如果沒有剔除的,則轉入對Y1,Y2來篩選自變數,直到自變數篩選過程結束,再轉入進行因變數的篩選,重複上述步驟,直到因變數和自變數既沒有剔除也沒有引入時為止,這時就建立第一組回歸方程。其次從原始數據中刪除第一組回歸方程中已人選的因變數的資料,比如p1個,自變數的數據均不刪除,重複整個過程直到因變數都有了回歸方程才停止。
在上述計算過程中,由於對自變數和因變數都要進行篩選,因此需給出四個檢驗統計量。而且每次對變數(包括自變數、因變數)進行篩選都要對相應的相關係數陣作消去變換,因此,一開始將m+p個變數的相關係數陣R寫成三個矩陣:一個記為S1,當自變數進行篩選時,對它進行消去變換;一個記為S,當因變數篩選時,對它進行消去變換;一個記為S2,不管是對自變數還是因變數進行篩選對它都要做消去變換。

雙重篩選逐步回歸的步驟

設自變數為
,因變數為
,為計算方便,將
記為
,取n次觀測數據,於是原始數據矩陣為
第一步:計算m個自變數和p個因變數的相關係數矩陣
第二步:建立第一組回歸方程
1.由於要建立第一組回歸方程,所以,令
,把
記為
2.給定引入變數的臨界值F和剔除變數的臨界值F,取臨界值F≥F≥0以保證逐步篩選變數過程在有限步後停止。
3.選取第一個因變數
4.逐個檢查是否需要剔除自變數。
5.逐個檢查是否需要引入自變數。
6.逐個檢查是否需要剔除因變數。
7.考慮引入因變數。
8.建立第一組回歸方程。
第三步:在原始資料陣中全部刪去已入選第一組回歸方程中的因變數的資料,而自變數的資料均不刪去,再重複整個過程,可求出第二組回歸方程。如此往復,直到全部因變數都有回歸方程為止。

相關詞條

熱門詞條

聯絡我們