隨機逼近

簡介

隨機逼近是一種參數的估計方法。它是在有隨機誤差干擾的情況時，用逐步逼近的方式估計參數的方法。

1951年，H.羅賓斯和S.門羅首先研究了此問題的一種形式：設因素x的值可由試驗者控制，x的“回響”的指標值為Y ，當取x之值x進行試驗時，回響Y可表為Y=h(x)+ε ，式中h(x) 為一未知函式， ε 為隨機誤差。

設目標值為A ，要找這樣的x ，使h(x)=A。分別以Y-A和h(x)-A代替Y和h(x) 。不妨設A=0 ，問題就在於找方程h(x)=0 的根x。例如若x為施藥量，Y為衡量藥物反應的某種生理指標，則問題在於找出施藥量x ，以使該生理指標控制於適當的值A。

典型的隨機逼近問題可描述為：

令

是同分布的隨機序列，已知ε_t 和 x 的某一函式

，欲求

的解，式中 E 表示對ε_t求數學期望，但並不知道

的分布，函式

的確切形式也可能是未知的，然而，對任何選定的 x 值，都能得到（或觀測到）

的值。例如，觀測值為

，要求從觀測值估計出參數 x，則取隨機逼近算法

式中數列

1951年，羅賓斯(Robbins,H.) 和門羅(Monro,S.) 對

加了一定條件後證明

這時隨機逼近的奠基工作。

在有的問題中，要找到的不是 h(x) 的零點，而是

的極值點

，它滿足

這時觀測到的仍是

，而不是

，故上述算法已不能用於逼近

。基弗 (Kiefer,J.C.) 和維爾弗維茨 (Wolfowitz,J.) 給出求極值的逼近算法

數列 at 滿足上述同樣條件則可逼近極值點

。

1951年以來，隨機逼近的研究已取得了很大的進展。在理論上，討論了量測誤差不獨立的情形和帶約束條件的情形，以及h(x) 具有更一般性質的情形。也考慮了時間連續時的算法和修正係數b_j 的選擇，並對算法的漸近性質作了深入的研究。在方法上，也從純機率發展到結合使用微分方程等工具。

從羅賓斯、門羅以來，隨機逼近的研究進一步取得了很大進展。討論了觀測誤差不獨立的情況和帶約束條件的情況，以及 h(x) 具有更一般性質的情形，並且把機率的方法結合使用了微分方程等工具。隨機逼近在最最佳化問題、系統辨識、適應控制器等方面都有套用。