基於自適應動態規劃的脈衝系統最佳化方法研究

《基於自適應動態規劃的脈衝系統最佳化方法研究》是依託上海大學,由王小華擔任項目負責人的青年科學基金項目。

基本介紹

  • 中文名:基於自適應動態規劃的脈衝系統最佳化方法研究
  • 項目類別:青年科學基金項目
  • 項目負責人:王小華
  • 依託單位:上海大學
中文摘要,結題摘要,

中文摘要

脈衝系統作為一類新型系統,已成為控制領域和微分方程領域的交叉研究熱點。實用的最佳化方法對脈衝系統的最佳化實現具有關鍵作用,本項目擬採用基於自適應動態規劃(Adaptive Dynamic Programming, ADP)的理論和方法,針對定時/變時脈衝系統的無限時間最優控制問題進行研究。首先採用目標函式誤差為最優判斷條件,以神經網路作為函式擬合工具,構建脈衝ADP線上疊代最佳化算法,求解脈衝最優控制;其次將建立脈衝ADP算法對應的目標函式疊代序列,證明脈衝ADP算法的收斂性,考慮神經網路擬合精度對算法收斂性的影響,分析脈衝ADP最佳化方法對系統參數的魯棒性和對初始控制率策略的魯棒性;最後對典型的脈衝最佳化問題進行仿真驗證。通過本項研究,可望揭示自適應動態規劃方法對於脈衝系統最佳化的適用性,建立對定時/變時脈衝系統一般適用的線上脈衝ADP最佳化方法。

結題摘要

通過2011.1-2014.12三年的研究,本項目的預期研究目標已基本達到。 該項目基於自適應動態規劃(Adaptive Dynamic Programming, ADP)的理論和方法,針對定時/變時脈衝系統的無限時間最優控制問題進行了研究。通過本項目研究,構建了脈衝最優控制的疊代數值計算方法,通過ADP的值疊代和策略疊代的交替進行,最終漸進地獲得最優脈衝控制數值解。本項研究針對定時脈衝系統和變時脈衝系統,構建了不同的ADP線上和離線算法,並從理論上闡明脈衝ADP算法的收斂性,揭示自適應動態規劃方法對於脈衝系統最佳化的適用性,解決脈衝系統的最佳化問題。主要成果如下: 1. 針對線性脈衝系統最佳化問題,提出了基於自適應動態規劃的線上和離線定時算法。採用單神經網路的HDP(Heuristic Dynamic Programming)結構,交替進行值疊代和策略疊代,以值疊代的相對誤差為判斷準則,漸進地獲得最優脈衝控制數值解。證明了相關算法的收斂性已經證明,並通過仿真展示了算法的正確性。 2.針對非線性定時脈衝系統最佳化問題,由於在策略疊代和值疊代的時候,同時存在泛函最佳化和函式最佳化問題,在策略疊代的時候,採用變分法的思路,進行范函極值的求取,在值疊代疊代中,採用梯度法,進行函式極值的最佳化。將兩種思路融合在一起,可解決非線性定時脈衝最佳化問題。證明了相關算法的穩定性,並通過仿真展示了算法的有效性。 3. 對於變時脈衝系統,通過變分法,給出了變時脈衝系統最佳化的一階條件,並提出了以脈衝發生後目標函式對狀態的偏導數(協態)為輸出的單神經網路自適應校正結構,實現目標函式的最佳化。通過系統仿真說明了算法的有效性。

相關詞條

熱門詞條

聯絡我們