數值求解最優控制: 動態規劃方法

數值求解最優控制: 動態規劃方法

《數值求解最優控制: 動態規劃方法》是依託中國科學院數學與系統科學研究院,由郭寶珠擔任項目負責人的面上項目。

基本介紹

  • 中文名:數值求解最優控制: 動態規劃方法
  • 項目類別:面上項目
  • 項目負責人:郭寶珠
  • 依託單位:中國科學院數學與系統科學研究院
項目摘要,結題摘要,

項目摘要

尋找最優反饋是控制理論夢寐尋以求的目標. 但是除去一般線性系統的LQ 或LQS問題外及其少量個別例子外, 對一般非線性系統, 特別是無窮維系統,最優控制問題的最優反饋律的解析求解是不可能的. 所以數值求解是唯一可能且有實踐意義的途徑. 目前的數值求解最優反饋律主要是基於Pontryagin極大值原理的打靶法. 這個方法有兩個主要的問題, 一是要猜測初值, 二是求出的控制是開環的. 本項目採取完全不同的途徑,即數值求出由Bellman動態規劃導出的HJB 方程為基礎的最優反饋控制數值解. HJB方程的解由1980年代發展的粘性解理論所保證. 即最優控制問題的值函式是相應的HJB方程的粘性解. 基於粘性解理論數值求解最優反饋控制剛開始於我們已經開展的幾個成功的數值求解最優反饋控制的例子, 本項目將提出一般的算法並證明算法的收斂性,特別關注分布參數系統.

結題摘要

本項目的主要目的是用動態規劃方法數值求解最優控制。 是十分艱難的研究課題, 沒有現成的結果可用。 我們發展了離散的HJB方程粘性解的數值解算法, 徹底證明了收斂性。再利用HJB方程的解提出計算具有反饋形式的數值最優控制的算法, 並嚴格的證明了收斂性。 考慮到HJB方程的數值解並不是全部有用, 所以我們圍繞最優控制提出了一種局部算法, 在HJB方程解用過之後就不再保存, 所以算法有效克服了維數災難。 可惜局部算法的收斂性雖然用數值實驗所證實, 但由於一些可能的HJB數值的缺乏, 理論上收斂性還在進行。算法用到了HIV-AIDS治療模型, 取得了成功。 本項目執行期間發表雜誌論文22篇, 專著一本。 7篇主要國際會議論文。

相關詞條

熱門詞條

聯絡我們