基本介紹
有些時候,要使用Y對X的
回歸模型來預測給出了新觀察值Y的X的取值,這就是逆預測或統計控制。下面用兩個例子來說明。
1.某貿易聯合會分析人員對聯合會的15個企業進行回歸,研究某產品銷售價格(Y)與成本(X)之間的關係,如果已知不屬於這個貿易聯合會的某企業的銷售價格Yh(新),要估計該企業的成本,Xh(新)。
2.以50個病例為基礎進行過某種新藥劑量(X)與類固醇減少水平(T)之間的回歸分析。某醫生正在治療一個新病人,要求把新病人的類固醇水平降到Yh(新),他想估計出應給病人開的新藥劑量Xh(新)。
兩種情況
統計控制(statistical control)(或校準)就是利用Y對X
j的回歸方程,來預測給出新觀察值Y的X
j的取值,這就是逆預測問題。在給定
條件下,X
j估計值需分下面兩種情況來考慮。
1.若Y與X
j均為隨機變數,則預測和控制兩問題地位是平等的。於是可把應變數看作新自變數,而把原自變數看作新應變數,重新擬合
線性回歸方程即可。
2.一般的控制問題,多用在自變數是非隨機變數的場合(實驗室、臨床試驗研究中多見),因此不能像上面那樣反轉變數進行分析。這種情況下,預測和控制是兩個性質不同的問題。控制中,X雖未知,但是一個非隨機變數;而預測中,預測對象Y是隨機變數。
案例分析
回歸預測
如果回歸直線
經過檢驗,線性相關顯著,就可以用它來作變數的預測。對任一給定的
,相應的
一般是以回歸直線上對應值
為中心的服從常態分配的隨機變數,設這個隨機變數y的方差為
,則
。
此式表明,當
時,對應y值以0.95的機率落入區間
,這個區間稱為y的0.95預測區間,
稱為y的點預測值。
y的方差往往未知,但可以證明它的方差近似為
一般為方便起見,近似取1.96為2,則上述區間近似為
,取
。
由於x值是變化的,因此y的預測區間上下限是平行於回歸直線的兩條直線
,如圖1(a)、(b)所示。
回歸控制
如果希望y落在區間
內,則x取值區間可由圖1中直線
對應關係確定。
設