最優控制算法

基本介紹

極大值原理和動態規劃從理論方面研究了最優控制所應遵循的方程和條件，而最優控制算法則是從計算方面來確定最優控制形式的具體方法和步驟（見最最佳化方法）。從總體上看，最優控制算法可分為間接法和直接法兩大類。對於給定的一類控制問題可由最優控制理論導出用以決定最優控制的條件和方程，可用有關的計算方法求出其解，這類方法稱為間接法。對難以定出有關最優控制的條件和方程的一類問題，須用數值方法直接求其近似解，這類方法稱為直接法。不管是間接法還是直接法，在大多數情況下，都要藉助數值求解算法。隨著電子計算機技術的發展，用數值方法求解最優控制問題變得越來越有效和廣泛，原來不可行的一些算法已逐漸成為可行。

基本評價

評價最優控制算法的兩個主要問題是：①算法的收斂性或數值穩定性，它是保證計算過程能達到正確結果的前提。②算法的計算複雜性，這對實時控制具有特別重要的意義。一個好的算法應使計算量和存儲量儘可能小,以便能由儘可能簡單的計算機來實現計算。此外,好的算法還應具有較好的數值穩定性，即計算的結果對初始數據和運算過程的誤差不過於敏感,以及處理“病態“問題的能力。典型的最優控制算法有:求解由極大值原理導出的微分或差分方程的兩點邊值問題的各種算法，對動態規劃中的貝爾曼方程進行數值求解的算法，求解線性二次型最優控制問題的黎卡提方程的各種算法，處理控制或狀態受約束問題的罰函式法，在控制策略的函式空間中利用搜尋尋優或梯度尋優技術和牛頓－拉夫森方法等直接求解非線性系統最優控制問題的算法等。其中，非線性系統的開環最優控制問題和線性二次型最優控制問題的算法套用尤多。

部分內容介紹

非線性系統的開環最優控制算法　這類控制問題的提法是，在非線性系統的狀態方程

夶=f(x，u，t)，x(t0)=x0，　t0≤t≤tf　(1)

的約束下，尋找一個控制u(t)使性能指標泛函

(2)

為最小。這裡u為m維控制向量函式,x為n維狀態向量函式,f為n維向量函式,t0是起始時間,tf為終止時間。性能指標泛函中第一項積分表示與控制過程有關的指標，而第二項K則表示僅與終態和終止時間有關的指標。
對x和u的變化範圍不加限制的情形，可把非線性規劃中的共軛梯度法、變尺度法等推廣來求解上面給出的問題。其關鍵在於計算泛函J(u)對於u的梯度墷J(u)：

(3)

式中

H(x，u，λ，t)=L(x，u，t)+λTf(x，u，t)　 (4)

是哈密頓函式。這裡上標T表示轉置,而λ是n維伴隨向量，它滿足方程

(5)

用共軛梯度法求解上述問題的算法為
① 任選一個初始控制u0，且令i=0。
② 用ui從t0到tf求積狀態方程(1),得到xi(t),後再用ui和xi從tf到t0反向求積伴隨方程(5)以得到λi(t)。再利用ui、xi和λi計算。
③ 令　gi=H
hi=gi+βi-1hi-1
其中βi-1=/，h0=g0，而符號表示=(xT(t)y(t))dt即兩個向量（此例中為x和y）的內積。
④ 若gi=0，停止；否則進行⑤。
⑤ 用一維搜尋法求出μi>0使

最優控制算法

基本介紹

基本介紹

基本評價

部分內容介紹

相關詞條

熱門詞條