微分對策

研究兩個或多個決策人的控制作用同時施加於一個由微分方程描述的運動系統時實現各自最優目標的對策過程的理論。微分對策的最優策略所應滿足的必要條件,可象最優控制理論中的極大值原理那樣導出。微分對策實質上是一種雙(多)方的最優控制問題,而通常的最優控制問題可看成是單人微分對策。微分對策還可推廣到由差分方程描述的離散時間動態系統,因而常常更廣義地稱為動態對策。

基本介紹

  • 中文名:微分對策
  • 外文名:Differential Game
  • 提出者:R.艾薩克斯
  • 提出時間:20世紀40年代
  • 套用學科:數學、經濟等
  • 適用領域範圍制導系統人造衛星
理論簡介,理論發展,構成要素,相關信息,套用領域,軍事領域,經濟領域,

理論簡介

微分對策(Differential Game)的研究始於20世紀40年代。R.艾薩克斯在1965年對完全對抗的二人零和對策問題的研究,奠定了微分對策理論的基礎。微分對策已套用於軍事、公安、工業控制、航天航空、環境保護、海洋捕撈、經濟管理和市場競爭等方面。微分對策所提供的數學模型還可能套用於更多的方面
微分對策微分對策
例如,在微分對策中,套用突變論的概念可導致對不連續性和奇異性進行分類研究。此外,還可探討當約束條件、控制策略或合作關係處於模糊情況時(見模糊控制)的微分對策問題。在對策問題中,決策人都以對方的行為模型作為自己決策的依據,因此微分對策的研究與心理學、人工智慧、行為科學等學科都有密切的關係。

理論發展

自 20 世紀 50 年代初以來,由於制導系統攔截飛行器的引入、 人造衛星的發射和航天中有關機動追擊問題的需要,美國著名的 Rand 公司在空軍資助下,以美國數學家 Issacs 博士為首的組織開展了對抗雙方都能自由決策行動的理論追逃問題研究。他們把現代控制理論中的一些概念、 原理與方法引入對策論中,取得了突破性的成果, 撰寫了 4 篇研究報告,形成了微分對策的最初研究成果。
1965 年,Issacs整理出版了《微分對策》一書,這是世界上第一部微分對策的專著。該書的出版標誌著微分對策理論的誕生。此後,由於軍事方面的原因,微分對策的研究引起了世界各國的普遍關注,特別是美國和前蘇聯,美蘇出於軍備競賽的需要,對空戰、 核飛彈與人造衛星攔截、 電子戰等方面提出了各種類型的微分對策模型,使得軍事微分對策得以迅速發展。1971 年,美國科學家 Friedman 採用了兩個近似離散對策序列精確定義了微分對策,建立了微分對策值與鞍點存在性理論,從而奠定了微分對策理論的數學基礎。自《微分對策》出版以來,微分對策理論與套用有了很大發展。除了定量微分對策和定性微分對策不斷完善外,隨機微分對策、 多人合作微分對策、 非合作微分對策和主從微分對策等方面的研究也取得了很大進展。除了 Issacs,Nash,Friedman外,Krasovskii,Leitmannt 和Petrosjan等均對微分對策理論的發展作出了傑出的貢獻。
美國著名數學家Nash 最先將微分對策理論引入經濟學研究領域,並由於他的出色工作而獲得了諾貝爾經濟學獎。近年來,經濟學領域中對微分對策的研究十分活躍。周邊經濟和微經濟等方面的許多課題都可用微分對策的理論來研究。
我國對微分對策的研究起步較晚,研究人員也不多,以張嗣瀛院士為代表的研究群體用現代控制理論的思想和方法對微分對策作過系統的研究,提出了雙邊控制的“定量極值原理”和“定性極值原理”。

構成要素

構成各類微分對策的要素可歸結為:
①參與對策的各方(決策人)具有不同的利益。
②決策人根據自己擁有的信息作決策。
③按照對策規則,決策人的地位可能不同。
④對策的結局由諸決策人的控制作用共同決定。對應這些要素的不同情況,可將微分對策作各種形式的分類。按照對策人的數目分類,如n人微分對策,n可取為2、3、…。按照結局分類,如結局的得失在連續範圍內變化的問題稱定量(程度)微分對策,結局取“贏”或“輸”二者居一的問題稱定性(種類)微分對策。也可按照決策人利益的性質分類,如決策人的利益為對抗時稱零和微分對策(即各方得失總和為零),決策人有競爭又有合作時稱非零和微分對策(如上下級之間,共同壟斷同一市場的幾個公司之間)。
微分對策微分對策
按照決策人間合作程度,又有組隊最優、納什平衡帕雷托最優和協商策略等多種形式。在上下級多人決策問題中,通常要求上級決策人先宣布自己的策略,下級按照自身利益作出回響。這種策略如能使下級的行動符合上級的目標,這類微分對策便稱為上下級對策(斯塔克爾貝格對策)或激勵對策。此外,依對策問題中動態系統類型,還有偏微分對策(動態系統用偏微分方程描述)和隨機微分對策(存在隨機的干擾或觀測誤差的微分對策)。在微分對策中,決策人擁有信息的多寡,對決策的自由度和結局的優劣有明顯的影響。定量地分析這些影響,並對用於信息採集和傳輸(或破壞對方的採集與傳輸)的費用與可能取得的收益進行權衡的問題,稱為信息分配和信息結構問題。

相關信息

二人零和微分對策
這是研究最多和套用較廣的一種微分對策,其動態過程可用以下狀態方程(見狀態空間法)描述: 式中各個變數的含義可用追躲問題為例來說明。狀態變數 x及其導數凧 表示追方和躲方間的相對位置和相對速度等;u為追方的控制作用,v為躲方的控制作用,它們共同決定x的變化;t表示時間。再用性能指標 描寫追擊的總效果,它可能是脫靶量、命中時間等。式中T是對策終止時間,它由反映結局(例如擊中)的條件Ψ[x(T)]=0來確定。二人零和微分對策問題的求解,按提法的不同有兩種情況。
微分對策微分對策
①在定量微分對策的提法中,追方選擇u使J儘量小,而躲方選擇v使J儘量大,因此問題的解u*、v*應滿足
J(u*,v)≤J(u*,v*)≤J(u,v*)
這樣的(u*,v*)稱為鞍點策略。在一定條件下,最優控制理論中的極大值原理可推廣套用於這類問題。這種“雙方極值原理”指出了鞍點策略應滿足的必要條件: 式中u*(t),v*(t)對於一切t∈[t0,T]均滿足以上條件,分別表示對v取極大值與對u取極小值,而哈密頓函式規定為 其中λi(t)為協態變數,它滿足伴隨方程和邊界條件,這裡μ 為正值常數乘子。各式中的x(t)是與鞍點策略(u*,v*)相對應的最優軌線。在套用雙方極值原理來解決具體的微分對策問題時,除了最優控制理論中所遇到的共同性難點(如解兩點邊值問題)以外,還會由於min和max運算而引入許多間斷性、奇異曲面等問題。奇異曲面的研究非常重要,它關係到問題的求解是否完整。在微分對策中可以出現一些具有新性質的奇異曲面,它們比單方最優控制問題中的奇異曲面要複雜得多。對於奇異曲面,尚未建立起系統的理論和計算方法。
微分對策微分對策
②在定性微分對策的提法中,只考慮某種結局能否實現的問題(如擊中或捕獲),可用x(t)能否達到目標集Ψ(x)≤0來描述。追方選擇u(t)力圖實現此目標,而躲方選擇v(t)力圖避免此目標。若雙方控制能力具有一定均勢,則x處於某一區域內時可以捕獲而在另一區域時能夠逃逸。這兩個區域稱為捕獲區和逃逸區,它們的分界面稱為界柵(或壁壘)。微分對策為追逃問題提供了在競爭環境中較為深刻實用的數學模型。在空空飛彈的設計中,最優控制和微分對策都被套用於制導規律的研究。微分對策對目標加速度估值誤差不敏感,比最優控制更適用於設計攔截機動目標地飛彈。
微分對策微分對策

套用領域

軍事領域

微分對策理論起源於軍事問題,由於國防和軍事目的的需要,軍事領域中的微分對策研究一直是微分對策理論發展的動力和熱點。特別在當今世界,高科技手段在軍事中的廣泛套用,使得軍事領域中的微分對策問題研究顯得尤為重要。
基於安全保密的原因,軍事領域中的微分對策研究的最新資料很難在公開發表的文獻中找到,但可以想像,該領域中的微分對策研究將與電子信息技術緊密結合,以微分對策的數值算法研究為重點方向。一些較為實用的控制方法,如自適應控制、 學習控制等將在這類微分對策的研究中發揮重要作用。由於科學技術在現代戰爭中的套用,多目標多任務的協同作戰是現代戰爭的一個重要特徵,因此,多人微分對策的研究也將成為軍事領域中的微分對策研究的重要課題。

經濟領域

近年來,經濟領域中的微分對策研究非常活躍,許多巨觀經濟中的多邊競爭、 合作問題均可用微分對策的理論和方法解決,為決策者提供可靠的決策方案。同時,經濟領域中的微分對策的研究也豐富和發展了微分對策理論。
Engwerda、Fershtman 和 Kamien ,Levine 和 Brociner 在微分對策方面的大量研究工作均基於經濟領域中的實際問題,他們在套用微分對策的思想和方法解決經濟問題方面取得了一系列重要成果,為微分對策基礎理論的發展做出了重要貢獻。由於現代社會信息技術的發展,經濟領域中的合作、 競爭將更加激烈,涉及多個方面,因此,多人微分對策的研究必將成為經濟領域中微分對策研究的主要課題。

相關詞條

熱門詞條

聯絡我們