正交多項式回歸

正交多項式回歸

正交多項式回歸是用正交多項式表安排試驗和回歸分析處理數據。它與用最小二乘法配製的一般多項式回歸不同,其回歸係數的估計是互相獨立的,若統計檢驗某一回歸係數與零無顯著性差異,只需從回歸方程中刪去這一項,而無需對其他的回歸係數重新進行計算。

多項式回歸雖然是一種有效的統計方法,但這種方法存在著兩個缺點:一是計算量較大,特別是當自變數個數較多,或者自變數冪較高時,計算量迅速增加;二是回歸係數間存在著相關性,從而剔除一個變數後還必須重新計算求出回歸係數。

當自變數x的取值是等間隔時,可以利用正交性原理有效地克服上述缺點。這種多項式回歸方法就是正交多項式回歸。

基本介紹

  • 中文名:正交多項式回歸
  • 外文名:Orthogonal polynomial regression
  • 分類:統計方法
  • 學科:數理科學
  • 用途:處理數據
正交多項式,數學模型,回歸係數的顯著性檢驗,程式框圖,

正交多項式

對於定義在區間上[a,b]的一個函式系
,如果其中任何兩個函式在此區間上的積分為零,而他們之中每個函式自乘的積分不等於零,即
則稱此函式係為在此區間上關於權函式
的正交函式系。
時稱之為規範的正交函式系;當此函式系中每一個函式均為多項式時稱之為正交多項式(系)。

數學模型

設變數y和x的n組觀測數據服從以下k次多項式
分別是x的一次,二次,...,k次多項式,
是一些適當選擇的常數,如何選擇將在下面討論(i=1,2,…,n)。將(2)式帶入(1)式,則有
比較(3)和(1)式可知,二者係數間存在簡單的函式關係,只要求出
,就可以求出
若把
看作新的自變數,則(3)式就成為一個k元線性模型,其結構矩陣為
正規方程為
其中
在多項式回歸中遇到的困難是解正規方程係數矩陣的工作量太大,可以使其對角線上的元素不為零,而其餘元素均為零,從而簡化計算,而且同時消去了係數間的相關性。
對於
我們可以通過選擇係數
使得
從而使
則正規方程組為
回歸係數為
滿足(7)和(8)式的多項式組…我們稱之為正交多項式
在正交多項式回歸中自變數的選擇是等間隔的,設間隔為h,x0=a, 則
若令
是1至n的正整數。
為簡化問題,用
代替x作為自變數。在條件許可時,取自變數x1=1,x2=2,…,xn=n。當x1=1,x2=2,…,xn=n時有
,這時驗證以下多項式是正交的,即
顯然,當x取正整數時,
不一定是整數,為了克服這給計算上帶來的困難,取
使x取正整數時
是整數。可以驗證用正交多項式
代替
所求得的回歸方程與用正交多項式
所求得的回歸方程是完全一樣的。
對於正交多項式
不同的n相對應的
時的值以及Si值都已製成正交多項式表,根據正交多項式表,可以計算出回歸方程的係數。令
回歸方程為
由於正交多項式回歸係數之間不存在相關性,因此某一項如果不顯著,只要將它剔除即可,而不必對整個回歸方程重新計算。

回歸係數的顯著性檢驗

正交多項式回歸方程與回歸係數的顯著性檢驗可利用正交多項式的性質按表1進行。經檢驗不顯著的高次項可以剔除,將其效應併入殘差平方和,自由度也同時併入,如果對回歸方程精度不滿意,可以增加高次項,而已經計算出的結果不必重算。
表1 正交多項式回歸方差分析表
方差來源
平方和
自由度
均方
F
顯著性
回歸

k


一次項


1


二次項


1


...
...
...
...
...
...
k次項


1


殘差

n-k-1

總計

n-1

程式框圖

1.數學模型:
2.變數及數組說明:
J-正確讀入數據的控制變數;
N-試驗組數;
M-所取正交多項式項數;
X(I)-存自變數數值;
Y(I)-存因變數數值;
Z(I)-存Y(I)的平方項;
E(I,1)-存在正交多項式一次項
E(I,2)-存在正交多項式二次項
E(I,3)-存在正交多項式三次項
(其中I=1,…N);
S(J)-結構矩陣逆矩陣元素 J=1,2,3;
B(J)-常數項矩陣B J=1,2,3;
D(J)-回歸係數 J=0,1,2,3;
Q(J)-偏回歸平方和 J=0,1,2,3;
S0-剩餘平方和;
S-標準離差;
S1-總平方和;
F(J)-F檢驗值。
3.程式框圖:
見如下圖1
圖1圖1

相關詞條

熱門詞條

聯絡我們