隨機逼近是一種參數的估計方法。它是在有隨機誤差干擾的情況時,用逐步逼近的方式估計參數的方法。
基本介紹
- 中文名:隨機逼近
- 外文名:stochastic approximation
- 方式:逐步逼近
- 背景:隨機誤差干擾
- 作用:估計某一特定值
- 屬性:數理統計方法
- 研究時間:1951年
簡介,典型問題,深入的研究,
簡介
隨機逼近是一種參數的估計方法。它是在有隨機誤差干擾的情況時,用逐步逼近的方式估計參數的方法。
1951年,H.羅賓斯和S.門羅首先研究了此問題的一種形式:設因素x的值可由試驗者控制,x的“回響”的指標值為Y ,當取x之值x進行試驗時,回響Y可表為Y=h(x)+ε ,式中h(x) 為一未知函式, ε 為隨機誤差。
設目標值為A ,要找這樣的x ,使h(x)=A。分別以Y-A和h(x)-A代替Y和h(x) 。不妨設A=0 ,問題就在於找方程h(x)=0 的根x。例如若x為施藥量,Y為衡量藥物反應的某種生理指標,則問題在於找出施藥量x ,以使該生理指標控制於適當的值A。
典型問題
典型的隨機逼近問題可描述為:
令 是同分布的隨機序列,已知εt 和 x 的某一函式,欲求
的解,式中 E 表示對εt求數學期望,但並不知道的分布,函式的確切形式也可能是未知的,然而,對任何選定的 x 值,都能得到(或觀測到)的值。例如,觀測值為,要求從觀測值估計出參數 x,則取隨機逼近算法
式中數列
1951年,羅賓斯(Robbins,H.) 和門羅(Monro,S.) 對加了一定條件後證明
這時隨機逼近的奠基工作。
在有的問題中,要找到的不是 h(x) 的零點,而是 的極值點,它滿足這時觀測到的仍是,而不是,故上述算法已不能用於逼近。基弗 (Kiefer,J.C.) 和維爾弗維茨 (Wolfowitz,J.) 給出求極值的逼近算法
數列 at 滿足上述同樣條件則可逼近極值點。
深入的研究
1951年以來,隨機逼近的研究已取得了很大的進展。在理論上,討論了量測誤差不獨立的情形和帶約束條件的情形,以及h(x) 具有更一般性質的情形。也考慮了時間連續時的算法和修正係數bj 的選擇,並對算法的漸近性質作了深入的研究。在方法上,也從純機率發展到結合使用微分方程等工具。
從羅賓斯、門羅以來,隨機逼近的研究進一步取得了很大進展。討論了觀測誤差不獨立的情況和帶約束條件的情況,以及 h(x) 具有更一般性質的情形,並且把機率的方法結合使用了微分方程等工具。隨機逼近在最最佳化問題、系統辨識、適應控制器等方面都有套用。