加權最小二乘法是對原模型進行加權,使之成為一個新的不存在異方差性的模型,然後採用普通最小二乘法估計其參數的一種數學最佳化技術。
基本介紹
- 中文名:加權最小二乘法
- 外文名:weighted least square method
- 實質:數學最佳化技術
- 方式:最小化誤差的平方和
- 所屬學科:數學
定義,疊代加權最小二乘法,加權最小二乘法估計,舉例,
定義
一般最小二乘法將時間序列中的各項數據的重要性同等看待,而事實上時間序列各項數據對未來的影響作用應是不同的。一般來說,近期數據比起遠期數據對未來的影響更大。因此比較合理的方法就是使用加權的方法,對近期數據賦以較大的權數,對遠期數據則賦以較小的權數。加權最小二乘法採用指數權數Wn-i,0<W<1,加權以後求得的參數估計值應滿足:
![](/img/2/186/afe771b377facf6890e81fce33a1.jpg)
以直線模型
為例,其加權的剩餘平方和為:
![](/img/0/030/542bf4386f9bf5faa46a5767efcf.jpg)
![](/img/a/442/945e6d4f79236442bb9eae59d3d8.jpg)
對上式分別求a和b的偏導數,得到標準方程組:
![](/img/1/bd9/5f6fdae3f5ca57ec444b3112dd95.jpg)
對上述方程解出a和b,就得到加權最小二乘法直線模型。套用加權最小二乘法,W的取值不同,解出的a,b也不同,因此W值取多少,需要經分析後確定。
疊代加權最小二乘法
假設用作Ω對角線值倒數的個體方差未知,且不能被輕易估計,但已知它們是結果變數均值的一個函式:
。那么,如果結果變數的期望值E[Yi]=μ和關係函式的形式f()是已知的,這就是一個非常直觀的估計過程。不幸的是。儘管方差結構與均值函式的相關性非常普遍,但是相對來說,我們不太知道這一相關的確切形式。
![](/img/3/4c4/19c88ee45c2ba7d695c07d07dac6.jpg)
這個問題的一個解決方法是疊代地估計權重,在每一輪估計中用均值函式提升估汁。因為
,因此係數估計
提供了一個均值估計,反過來也是一樣。因此算法用漸進提升的權重來疊代估計這些量。過程如下:
![](/img/3/a2e/37a64cac787987f16c4b8dfcbd4e.jpg)
![](/img/c/d20/f808e5bccbaf3030f8502a60c781.jpg)
1.為權重設定起始值,一般等於1(也就是沒有權重的回歸):1/vi(1)=1,並且構建對角線矩陣Ω,防止以零做除數。
2.以現有的權數用加權最小二乘法估計β。第j個估計是:
。
![](/img/8/78b/9973be5d6668403d540b94301cc0.jpg)
3.用新估計的均值向量1/vi(j+1)=VAR(μi)更新權數。
4.重複第二步和第三步直到收斂(也就是
足夠接近於0)。
![](/img/a/1b7/7cfb3740277dce582fc96a9176f7.jpg)
在滿足指數族分布的一般條件下,疊代加權最小二乘的程式得到似然函式的眾數,然後產生未知係數向量
的最大似然估計。進一步地.由
產生的矩陣與
的方差矩陣按照預期成機率收斂。
![](/img/c/d20/f808e5bccbaf3030f8502a60c781.jpg)
![](/img/1/aae/bf4e7f67b8c20ee277a37135330a.jpg)
![](/img/c/d20/f808e5bccbaf3030f8502a60c781.jpg)
因為我們在廣義線性模型中確定了一個明確的連線函式,所以多元正態方程的形式可以修改為包括這一嵌入的轉化:
![](/img/a/2fc/8968ea40d5d570e9b93c339cbaf5.jpg)
很明顯,線上性模型的情況下,當連線僅僅是恆等函式時,上述方程就可以簡化。對於廣義線性模型,IWLS操作的總體策略相當簡單:用費歇得分的牛頓--萊福遜算法反覆地套用於修正的上述常規方程。對於精闢細緻的分析和這一操作的擴展,讀者可以參看格林(Green.1984)和德爾皮諾(del Pino,1989)的論述。
加權最小二乘法估計
考慮各個觀測數據誤差分布的不同,定義加權目標函式
![](/img/5/705/c2dd86bf8bad6637230f49385522.jpg)
將
代入式(1),並令
![](/img/2/f3d/2f49f72a5ab51294873350f9189b.jpg)
![](/img/6/d75/d32f30406e740486269679a02cfa.jpg)
![](/img/9/493/75a9e9870e84830ff851a72e49aa.jpg)
![](/img/5/d93/3e9344ba042185ea560c1033dff1.jpg)
![](/img/d/c62/1dcc4b86970fafa2ddb617e5a6a3.jpg)
![](/img/e/2f0/2397374c3c85f8abf67143e8e463.jpg)
![](/img/e/2f0/2397374c3c85f8abf67143e8e463.jpg)
設a是
估計的真值,估計誤差
的協方差矩陣
![](/img/e/2f0/2397374c3c85f8abf67143e8e463.jpg)
![](/img/7/85a/017d70fa9977b8e513119f6c74cb.jpg)
![](/img/b/621/28b5ccaf66beee3d825214478bce.jpg)
將
代入到式(3)中,得
![](/img/5/47b/24d80ca9ab21cee7a98d3d1f7dcb.jpg)
![](/img/c/7a0/454a022a181cc9713d3a72988cda.jpg)
將式(5)代入到式(4)中,整理得
![](/img/6/572/6e292867a959f2a8704c672def76.jpg)
其中
![](/img/e/17c/288479af6a0e5e45ab764b2148e3.jpg)
可以證明,若取加權矩陣
![](/img/2/6bf/b16687cbcd5b56be557f6e814a25.jpg)
![](/img/4/4e8/1fd81e30de16e14aa46891e0feaa.jpg)
![](/img/7/dcd/9d978ac0f7b262bea4366c4bd33d.jpg)
![](/img/7/e58/c8391e7727bc823242eedf1c54cd.jpg)
![](/img/8/3b1/523f1449aa3900dbbe33b115c57f.jpg)
![](/img/6/dc4/30c187ab4edd57eb5baa303ab1db.jpg)
易知最小二乘法估計誤差協方差A與馬爾可夫估計誤差協方差AMV相等,即A=AMV。因此,選用權矩陣
![](/img/c/f3e/ed6690115ae27fa2ebe8c7866a6c.jpg)
![](/img/c/b0c/ebe2c4648ddbe65b307d3e96573c.jpg)
![](/img/6/e33/12e0a85fe0d4ec3310cbdb6f2b31.jpg)
![](/img/d/b92/19ecd36f01aae8682021dc6e94c8.jpg)
舉例
通過最小二乘法擬合線性趨勢方程。
![某海關口岸關稅額直線模擬計算表 某海關口岸關稅額直線模擬計算表](/img/b/a6e/nBnauQ2MjFTOxMjY1UTYwEzMycDMjVjNwMmNkBjZ4cjZ0MDM0YjYhRWZhZ2LtVGdp9yYpB3LltWahJ2Lt92YuUHZpFmYuMmczdWbp9yL6MHc0RHa.jpg)
將表中數據代入公式![](/img/1/bd9/5f6fdae3f5ca57ec444b3112dd95.jpg)
![](/img/1/bd9/5f6fdae3f5ca57ec444b3112dd95.jpg)
得:
,解得a=66.95,b=8;所得趨勢方程為:![](/img/9/7c8/8da7df0d98dfe70ed821e0487866.jpg)
![](/img/4/5e7/82150c89b727d1721a5bdbd908d3.jpg)
![](/img/9/7c8/8da7df0d98dfe70ed821e0487866.jpg)
比較兩種估計方法的結果(具體數據見下表),可以看出,加權最小二乘法的近期誤差比遠期誤差小,這就是加權最小二乘法的優勢所在。
![兩種估計方法的誤差比較 兩種估計方法的誤差比較](/img/c/90b/nBnauQzMiJTMhFmYwATMkNGZzYWZzMTNiJzMkZ2YwcDZzkzY5AzN2U2MldzLtVGdp9yYpB3LltWahJ2Lt92YuUHZpFmYuMmczdWbp9yL6MHc0RHa.jpg)