隨機逼近是一種參數的估計方法。它是在有隨機誤差干擾的情況時,用逐步逼近的方式估計參數的方法。
基本介紹
- 中文名:隨機逼近
- 外文名:stochastic approximation
- 方式:逐步逼近
- 背景:隨機誤差干擾
- 作用:估計某一特定值
- 屬性:數理統計方法
- 研究時間:1951年
簡介,典型問題,深入的研究,
簡介
隨機逼近是一種參數的估計方法。它是在有隨機誤差干擾的情況時,用逐步逼近的方式估計參數的方法。
1951年,H.羅賓斯和S.門羅首先研究了此問題的一種形式:設因素x的值可由試驗者控制,x的“回響”的指標值為Y ,當取x之值x進行試驗時,回響Y可表為Y=h(x)+ε ,式中h(x) 為一未知函式, ε 為隨機誤差。
設目標值為A ,要找這樣的x ,使h(x)=A。分別以Y-A和h(x)-A代替Y和h(x) 。不妨設A=0 ,問題就在於找方程h(x)=0 的根x。例如若x為施藥量,Y為衡量藥物反應的某種生理指標,則問題在於找出施藥量x ,以使該生理指標控制於適當的值A。
典型問題
典型的隨機逼近問題可描述為:
令
是同分布的隨機序列,已知εt 和 x 的某一函式
,欲求











在有的問題中,要找到的不是 h(x) 的零點,而是
的極值點
,它滿足
這時觀測到的仍是
,而不是
,故上述算法已不能用於逼近
。基弗 (Kiefer,J.C.) 和維爾弗維茨 (Wolfowitz,J.) 給出求極值的逼近算法








深入的研究
1951年以來,隨機逼近的研究已取得了很大的進展。在理論上,討論了量測誤差不獨立的情形和帶約束條件的情形,以及h(x) 具有更一般性質的情形。也考慮了時間連續時的算法和修正係數bj 的選擇,並對算法的漸近性質作了深入的研究。在方法上,也從純機率發展到結合使用微分方程等工具。
從羅賓斯、門羅以來,隨機逼近的研究進一步取得了很大進展。討論了觀測誤差不獨立的情況和帶約束條件的情況,以及 h(x) 具有更一般性質的情形,並且把機率的方法結合使用了微分方程等工具。隨機逼近在最最佳化問題、系統辨識、適應控制器等方面都有套用。