動態規劃粘性解方法及其在最優控制問題中的套用

《動態規劃粘性解方法及其在最優控制問題中的套用》是依託北京理工大學,由孫兵擔任項目負責人的青年科學基金項目。

基本介紹

  • 中文名:動態規劃粘性解方法及其在最優控制問題中的套用
  • 依託單位:北京理工大學
  • 項目負責人:孫兵
  • 項目類別:青年科學基金項目
項目摘要,結題摘要,

項目摘要

最優控制問題是現代控制理論的核心問題之一,尋找最優反饋控制,是控制理論夢寐以求的目的。除去一般線性系統的LQ或LQG問題及其少量個別例子外,對一般非線性系統,特別是無窮維系統,最優控制問題的最優反饋律的解析求解是不可能的。所以數值求解是唯一可能且有實踐意義的途徑。目前的數值求解最優控制主要是基於Pontryagin極大值原理的打靶法。該方法有兩個主要問題,一是要猜測初值,二是求出的控制是開環的。粘性解概念的引入使得藉助於動態規劃方法找到最優反饋控制變得可能:值函式是HJB方程的唯一的粘性解。本課題主要研究基於動態規劃粘性解理論數值求解最優反饋控制的動態規劃粘性解方法,該方法對於有效求解最優控制問題,在理論和套用上具有非常重要的意義。本項目將特別關注分布參數系統,提出一般的算法並證明算法的收斂性。

結題摘要

尋找最優反饋控制,是控制理論夢寐以求的目的。除去一般線性系統的 LQ 或 LQG 問題及其少量個別例子外,對一般非線性系統,特別是無窮維系統,最優控制問題的最優反饋律的解析求解是不可能的。所以數值求解是唯一可能且有實踐意義的途徑。傳統的方法局限性較大,可用性不強。本課題利用動態規劃方法的粘性解理論,採用數值求解 HJB 方程構造最優反饋控制的方法,用計算方嚮導數代替數值求解 HJB 方程的梯度計算,給出了一個全新的無維數災難的數值求解最優反饋控制的一般算法,並給出了嚴格的收斂性理論證明。算法簡單易行,適應性強,為求解最優反饋控制的研究建立了重要的理論基礎,同時也給具體的工程實踐提供了一種高效的求解方法,在理論和套用上具有非常重要的意義,使動態規劃在最優反饋控制的研究中發揮出它應有的作用。進而,採用該算法,我們對一些工業自動化及生物醫學領域裡有實際意義的集中和分布參數系統的最優控制問題進行了研究,得出了一系列有意義的重要結果。

相關詞條

熱門詞條

聯絡我們