原理簡介
極大值原理
maximum principle
最優控制理論中用以確定使受控系統或運動過程的給定性能指標取極大或極小值的最優控制的主要方法。在工程領域中很大一類最優控制問題都可採用極大值原理所提供的方法和原則來定出最優控制的規律。在理論上,極大值原理還是
最優控制理論形成和發展的基礎。極大值原理是對分析力學中古典變分法的推廣,能用於處理由於外力源的限制而使系統的輸入(即控制)作用有約束的問題。極大值原理是20世紀50年代中期
蘇聯學者Л.С.龐特里亞金提出的,有關這一原理的主要結果及其嚴格的數學證明,都發表在後來出版的《最優過程的數學理論》一書中。
最優控制問題
四個要素
最優控制問題是從大量的工程實際問題(特別是航天和航空技術問題)中提煉出來的一個控制理論問題。最優控制問題有四個要素。
受控系統
通常採用狀態方程(見
狀態空間法)的形式,它是狀態向量
x的一階微分方程
夶=
f(x,u,t),其中
u為控制向量,
t為時間變數。在最一般的情況下,受控系統是非線性(見
非線性控制系統)和時變(見
時變系統)的,所以
f(x,u,t)為非線性和時變的向量函式。
容許控制
工程實際因素的限制決定了控制器的允許類型。一個容許控制只能在控制的容許類中選取。用U表示系統的控制的允許類,則在數學上可將容許控制u表示為u∈U。通常U受到封閉性的邊界限制。
目標集
在控制作用下系統狀態所要達到的
目標區。這個目標區可以是一個給定的點,也可以是一個給定的區域。用
tf表示運動過程的末時刻,
x(
tf)表示末時刻系統的狀態,則目標集常可用向量等式
g1(
x(
tf),
tf)=0、向量不等式
g2(
x(
tf),
tf)≤0來描述。
性能指標
反映和評價系統性能優劣的指標。性能指標的形式由實際問題來決定,通常有兩種類型:表示系統在末時刻狀態的性能指標稱為末值型性能指標,記為
S(
x(
tf),
tf);用特定函式的積分表示系統運動過程中的性能的指標稱為積分型性能指標,記為式1其中
t0為初始時刻。性能指標的一般形式為 式2稱為混合型性能指標。性能指標值的大小依賴於控制作用的整體
u(·)的選擇,而不是取決於控制
u在t時刻的值;因此
J【
u(·)】是控制函式
u(·)的函式(稱為
u(·)的泛函)。
表述
最優控制問題可表述為:尋求一個容許控制u(t),以使受控系統從某個給定的初始狀態x(t0)=x0齣發,在末時刻tf達到目標集,並且使性能指標泛函J【u(·)】達到極小值或極大值。如果這個問題是有解的,那么就稱求得的容許控制為最優控制,記為u*(t);而系統狀態方程在u*(t)作用下的解稱為最優軌線,記為x*(t);相應的極小或極大性能指標值J【u*(·)】,稱為最優指標值。在數學上,最優控制問題的實質,是對受約束的泛函J【u(·)】求極值的問題,其中的約束條件為系統的狀態方程、目標集方程和容許控制域。
基本形式
對於定常系統的最優控制問題的極大值原理可表述如下:如果最優控制問題的
數學模型為:受控系統
夶=
f(
x,u),
x(
t0)=
x0,
t∈【
t0,
tf】
目標集g1(x(tf))=0 ,g2(x(tf))≤0
性能指標J【u(·)】=S(x(tf))
末時刻tf自由
則u*(t)為最優控制、x*(t)為最優軌線和tf為最優末時刻的必要條件有五項。
① x*(t)滿足方程(式3)
② λ(t)滿足方程(式4)式中(式5)稱為給定問題的哈密頓函式,λ^T(
t)為λ(
t)的轉置。λ(
t)稱為狀態
x(
t)的伴隨狀態,而其方程稱為伴隨方程。
③ λ(
tf)滿足方程(式6)式中
μ0≥0為標量,
μ和v為向量,它們是不全為零的待定量,且有v
g2(
x*(
tf))=0,通常稱此條件為橫截條件。
④
u*(
t)滿足條件(式7)⑤ 確定
t壚的方程為(式8)極大值原理的名稱就來自於條件④。據此定出最優控制
u*(
t)的關係式後,最優控制問題的求解就歸結為對運動方程及其初始條件
x(
t0)和伴隨方程及其末時刻條件λ(
tf)聯合求解,這種問題稱為兩點邊值問題。更一般形式的最優控制問題(包括受控過程為
時變系統、性能指標為積分型指標或混合型指標、末狀態的約束方程為更複雜的形式等情況)的極大值原理的結果都可由上述基本形式導出。
最優控制的類型
在一般情況下,由極大值原理定出的最優控制是時間變數
t的函式
u*(
t),稱為程式控制或開環控制。程式控制的主要缺點,是不能消除或抑制由於參數的變動和環境的變化對系統造成的擾動。最優控制的另一類形式是表示為狀態變數
x*(
t)的函式
u*(
x*),實質上是一種
狀態反饋,稱為綜合控制或閉環控制,其優點是對抑制擾動有利。原則上極大值原理能夠用來確定綜合控制形式的最優控制,但除了一些典型的最優控制問題外,對於一般的情況決定綜合控制往往相當困難。在工程領域中,最為常見的一種綜合控制形式是所謂的砰-砰控制。在這類控制形式中,根據系統的運動狀況,最優控制
u*的各個
控制變數在整個過程中分段地取為
容許控制範圍的正最大值或負最大值。砰-砰控制的原理是把最優控制問題歸結為:將
狀態空間劃分為兩個區域,一個區域對應於
控制變數取正最大值,另一個區域對應於控制變數取負最大值。這兩個區域的分界面稱為開關面,而決定砰-砰控制的具體形式的關鍵就是決定開關面。砰-砰控制形式的最優控制常用於
最速控制系統和
最省燃料控制系統。在正常情況下,砰-砰控制的控制變數由正最大值躍變到負最大值的次數是有限的,只有在躍變瞬時控制變數可取值於限制範圍的任何值。但對於某些問題,砰-砰控制中至少存在一個時間區間,其中控制變數可取為限制範圍的任意值,這類問題稱為奇異最優控制問題。對於奇異最優控制問題,僅由極大值原理的條件還不足以確定奇異時間區間內的最優控制
u*與最優軌線
x*間的關係即綜合控制的形式。
LQ 問題
線性二次型性能指標的最優控制問題。在LQ問題中,受控系統為線性系統,運動方程具有形式
夶=
A(
t)
x+
B(
t)
u;性能指標是狀態
x和控制
u的一個二次型函式的積分,可表示為(式9)其中加權陣
S和
Q為半正定對稱陣,
R為正定對稱陣;控制
u的各個控制變數的取值範圍不受限制。根據極大值原理很容易定出LQ問題的最優控制(式10)它是一種線性
狀態反饋形式的綜合控制。其中
R^-1表示矩陣
R的逆,
B^T(
t)表示矩陣
B(
t)的轉置,而
P(
t)為正定對稱矩陣,是如下的矩陣黎卡提微分方程(式11)的解:在工程領域中,很多情況下受控系統是定常系統,即其運動方程為
夶=
Ax+
Bu,且取初時刻
t0=0,而末時刻
tf=∞,性能指標泛函為(式12)這時只要矩陣對(
A,B)為能控(見
能控性),矩陣對(
A,C)為能觀測(見
能觀測性),其中
C為由分解Q=
CC^T導出的矩陣,那么最優控制
u*=-
Kx*具有狀態
x*的線性定常反饋的形式,反饋矩陣
K=
R^-1
B^T
P,P為如下的矩陣黎卡提代數方程(式13)的解這類控制問題的優點是反饋矩陣
K為常數,可由計算機事先通過計算定出,不必在控制系統中引入計算機進行實時控制。LQ問題在工程上常稱為
線性調節器問題。
次優控制
對於較為複雜的受控系統,即使系統為線性的情況,最優控制問題的求解也常有大量的計算。採用次優控制,可在保證性能指標值足夠接近最優性能值的同時,顯著地減少
問題求解的計算量。實現次優控制的主要的途徑是把複雜的受控系統通過適當的方法化為兩個較為簡單的子受控系統,並且針對子系統來計算最優控制,再綜合地作必要的修正。實現系統分解的途徑有非奇異
攝動方法和奇異攝動方法。對控制函式的修正需按期望性能指標值對最優性能值的接近程度來確定;要求接近的程度越高,修正計算量也就越大。特別是對於要求計算機實時控制的受控系統,為了避免過大的計算量或避免增加控制系統在組成上的複雜性,常常更宜採用次優控制以代替最優控制。
推廣
極大值原理不僅可用於解決連續形式的受控系統的最優控制問題,而且還被推廣於處理離散形式的受控系統的最優控制問題。
離散最優控制問題的極大值原理稱為離散極大值原理。極大值原理對求解
分布參數系統的最優控制問題也很有效,相應的方法稱為分布參數系統的極大值原理。