基於自適應動態規劃的脈衝系統最佳化方法研究

中文摘要

脈衝系統作為一類新型系統，已成為控制領域和微分方程領域的交叉研究熱點。實用的最佳化方法對脈衝系統的最佳化實現具有關鍵作用，本項目擬採用基於自適應動態規劃(Adaptive Dynamic Programming, ADP)的理論和方法，針對定時/變時脈衝系統的無限時間最優控制問題進行研究。首先採用目標函式誤差為最優判斷條件，以神經網路作為函式擬合工具，構建脈衝ADP線上疊代最佳化算法，求解脈衝最優控制；其次將建立脈衝ADP算法對應的目標函式疊代序列，證明脈衝ADP算法的收斂性,考慮神經網路擬合精度對算法收斂性的影響，分析脈衝ADP最佳化方法對系統參數的魯棒性和對初始控制率策略的魯棒性；最後對典型的脈衝最佳化問題進行仿真驗證。通過本項研究，可望揭示自適應動態規劃方法對於脈衝系統最佳化的適用性，建立對定時/變時脈衝系統一般適用的線上脈衝ADP最佳化方法。

結題摘要

通過2011.1-2014.12三年的研究，本項目的預期研究目標已基本達到。該項目基於自適應動態規劃(Adaptive Dynamic Programming, ADP)的理論和方法，針對定時/變時脈衝系統的無限時間最優控制問題進行了研究。通過本項目研究，構建了脈衝最優控制的疊代數值計算方法，通過ADP的值疊代和策略疊代的交替進行，最終漸進地獲得最優脈衝控制數值解。本項研究針對定時脈衝系統和變時脈衝系統，構建了不同的ADP線上和離線算法，並從理論上闡明脈衝ADP算法的收斂性，揭示自適應動態規劃方法對於脈衝系統最佳化的適用性，解決脈衝系統的最佳化問題。主要成果如下： 1. 針對線性脈衝系統最佳化問題，提出了基於自適應動態規劃的線上和離線定時算法。採用單神經網路的HDP(Heuristic Dynamic Programming)結構，交替進行值疊代和策略疊代，以值疊代的相對誤差為判斷準則，漸進地獲得最優脈衝控制數值解。證明了相關算法的收斂性已經證明，並通過仿真展示了算法的正確性。 2.針對非線性定時脈衝系統最佳化問題，由於在策略疊代和值疊代的時候，同時存在泛函最佳化和函式最佳化問題，在策略疊代的時候，採用變分法的思路，進行范函極值的求取，在值疊代疊代中，採用梯度法，進行函式極值的最佳化。將兩種思路融合在一起，可解決非線性定時脈衝最佳化問題。證明了相關算法的穩定性，並通過仿真展示了算法的有效性。 3. 對於變時脈衝系統，通過變分法，給出了變時脈衝系統最佳化的一階條件，並提出了以脈衝發生後目標函式對狀態的偏導數(協態)為輸出的單神經網路自適應校正結構，實現目標函式的最佳化。通過系統仿真說明了算法的有效性。

基於自適應動態規劃的脈衝系統最佳化方法研究

基本介紹

中文摘要

結題摘要

相關詞條

熱門詞條