拋物型非線性系統的魯棒實時自適應疊代最佳化控制研究

《拋物型非線性系統的魯棒實時自適應疊代最佳化控制研究》是依託東北大學,由羅艷紅擔任項目負責人的青年科學基金項目。

基本介紹

  • 中文名:拋物型非線性系統的魯棒實時自適應疊代最佳化控制研究
  • 項目類別:青年科學基金項目
  • 項目負責人:羅艷紅
  • 依託單位:東北大學
中文摘要,結題摘要,

中文摘要

本項目將研究拋物型非線性系統基於自適應疊代動態承棗體規劃的魯棒實時最優控制問題。擬解決目前對非線性拋物型系統無窮維最優控制的求解難題,建立以自適應動態規劃為基礎的一套新的理論體系和求解方案,開闢求解非線性拋物型系統最優控制的新途徑。主要研究內容包括:1. 研究基於自適應疊代動態規劃理論的慢系統最優控制問題;2. 深入研究包括快慢兩個子系統的整個拋物型系統基於自適應動態規劃的混合最優控制問題;3. 研究基於自適應動態規劃的不確定拋物型非線性系統的魯棒最優控制問題;4. 針對分散式系統拒榆的快慢分解和不確定性,建立一種統一有效的自適應動態規劃方法使得對喇提淚於拋物型系統可以直接求解其魯棒實時的混合最優控制。上述研究成果將為非線性拋物型系統的魯棒混合最優控制理論提供新的思路,豐富最優控制理論的研究內容,同時為複雜工業實際中非線性拋物型系統的分析和控制提供必要的科學理論依據和關鍵技術保證。

結題摘要

本項目針奔局和敬對一類拋物型分布參數系統,首次建立了線上自適應疊代最佳化的概念,並在多種狀態和控制約束以及模型不確定條件下,提出了幾種新型的自適應動態規划算法,包括雙啟發式動態規划算法,兩階段二次疊代算法,混合疊代二人零和算法,單階段多人非零和算法,構建了基於自適應動態規劃的分布參數系統最佳化控制的理論構架,解決了拋物型分布系統難以精確建模和線上最優控制的關鍵理論問題,建立了混合魯棒最優控制下整個閉環系統的穩定性和整體算法的收斂性,並探索了整體系統的性能指標同自適應動態規劃中的拓撲網路參數之間的定量關係,提出了魯棒最優控制器的參數設計及自適應調節方法。項目在研期間,負責人較為系統地研究了幾類無限時間和有限時間最優鎮連肯驗定控制、最優跟蹤控制以及零和與非零和對策問題,其中關於非線性系統跟蹤控制的結果為國際首例,08年至今一直引領著國內外學者爭相研究和跟進。對於鎮定問題,針對執行器帶有飽和或死區特性以及控制方向未知等難點,提出非二次泛函和Nussbaum函式來處理非企刪照線性函式隱含控制輸入的問題,首次建立了狀態和控制約束下線上最優控制的一般框架;對於跟蹤問題,針對系統動態未知以及時變目標軌跡無法依據定常系統處理等難點,提出了基於輸入/輸出數據的魯棒近似最優跟蹤控制策略,建立了新型的數據驅動模型來重構未知系統動態,並且構建了全新增廣子系統,開闢了時變最優跟蹤控制的新思路;對於對策問題,針對非線性系統帶有外界擾動和建模不確定性等難點,提出了全新的線上自適應策略學習方案,利用神經網路作為線上參數近似結構,設計執行網路和擾動網路使得代價函式最小化和最大化,有效求解了系統的納什均衡點。在促多體雅本項目完成過程中,主要從理論方面進行了深層次的研究,在科學出版社出版專著1部,在美國Springer出版社出版專著1部,發表論文23篇,其中 SCI檢索12篇(在IEEE 會刊發表長文4篇),發表專利4項,指導畢業碩士生6人,協助指導畢業博士生3人。由於自適應動態規劃方面的突出工作,項目負責人2012年開始擔任國際IEEE計算智慧型協會的自適應動態規劃與增強學習技術局委員,並擔任了2011、2013和2014年IEEE Symposium on Adaptive Dynamic Programming and Reinforcement Learning的程式委員會委員,並在2014的會議上組織了專題小組並擔任主席。

相關詞條

熱門詞條

聯絡我們