非線性系統魯棒鎮定與跟蹤控制的自適應動態規劃方法

非線性系統魯棒鎮定與跟蹤控制的自適應動態規劃方法

《非線性系統魯棒鎮定與跟蹤控制的自適應動態規劃方法》是依託天津大學,由楊雄擔任項目負責人的青年科學基金項目。

基本介紹

  • 中文名:非線性系統魯棒鎮定與跟蹤控制的自適應動態規劃方法
  • 項目類別:青年科學基金項目
  • 項目負責人:楊雄
  • 依託單位:天津大學
項目摘要,結題摘要,

項目摘要

本項目將研究非線性系統魯棒鎮定與跟蹤控制的自適應動態規劃方法。擬解決目前針對非線性系統存在輸入受限、包含不確定項、動態信息完全未知等特點的控制器設計難題,建立以自適應動態規劃方法為基礎的一套新的理論分析體系和設計方案,開闢求解非線性系統魯棒鎮定與跟蹤控制的新途徑。主要研究內容包括:1.研究輸入存在約束情況下不確定非線性系統魯棒鎮定的自適應動態規劃方法。2.研究不確定非線性系統魯棒保成本跟蹤控制的自適應動態規劃方法。3.研究動態信息完全未知情況下非線性系統魯棒最優控制的自適應動態規劃方法。4.構建非線性系統魯棒鎮定與跟蹤控制的實驗平台,通過仿真實驗驗證上述方法的有效性與優越性。本項目研究將為非線性系統魯棒控制理論的發展提供新的思路,豐富最優控制理論和魯棒控制理論以及神經網路科學的研究內容,同時將推動智慧型控制理論和我國自動化技術的深入發展。

結題摘要

隨著人工智慧和計算機技術的發展,現代生活和生產過程中所涉及的系統具有種類多、規模大、結構複雜以及非線性程度高等特徵。一般地,人們難以針對這些系統建立精確的數學模型。然而,在實際生產過程中,人們通常需要使這些系統達到魯棒鎮定、跟蹤既定目標以及實現最佳化的目的。在此背景下,本項目開展非線性系統魯棒鎮定與跟蹤控制的自適應動態規劃方法研究。首先,本項目基於自適應動態規劃框架提出了辨識-評判的強化學習算法結構,設計出針對具有不匹配不確定項的非線性系統魯棒控制器。在這之後,本項目建立了單一評判網路的自適應動態規划算法結構,用於研究具有不匹配不確定項的非線性魯棒最優控制問題。該算法結構在執行過程中既不需要初始穩定條件,又不需要持續性激勵條件。其次,本項目提出了積分強化學習算法,用於研究系統輸入存在約束情況下的未知非線性系統魯棒鎮定問題。該算法在執行過程中,不需要獲取系統的先驗信息,僅利用系統運行過程中產生的數據來設計魯棒控制器。基於該積分強化學習方法,本項目進行了一些延伸研究,如:一般非線性系統的狀態調節和未知非線性大系統的魯棒鎮定。再次,本項目建立了觀測-評判網路的自適應動態規劃結構,實現了對未知非線性大系統目標的漸近跟蹤。此外,作為延伸研究,本項目基於類似的網路結構設計了事件觸發機制下的魯棒最佳化控制器。最後,通過 MATLAB 仿真軟體和基準模型(如倒立擺)以及實際問題(如電力系統)等,本項目中建立的控制方法的有效性得到了較好驗證。本項目的順利開展,有效推動了神經網路和非線性最優控制的理論研究。同時,該項目建立了最優控制和魯棒控制的橋樑,提供了研究魯棒控制的新思路。此外,本項目中的一些方法在電力系統中的成功套用,為理論套用於實際系統奠定了基礎。

相關詞條

熱門詞條

聯絡我們