隊決策理論

全體決策者有一個共同的目標函式，但每個決策者作決策時卻依賴各不相同而又相關的信息的決策理論，簡稱隊論。隊是全體成員有一個共同目標的一種組織。隊中成員之間的關係是合作關係而不是對抗關係。隊論是從信息結構的觀點來研究決策問題的。其主要特徵是，每一個決策者基於所接收到的各不相同而又相關的信息來作各自的決策。為了實現共同目標，所有決策者應協調他們的行動。

發展簡史隊論原是經濟學家在不完全信息的約束下建立經濟模型時提出來的，後來推廣到工程技術和其他學科。1955年，J.馬爾沙克奠定了隊論的基礎。他研究了在一個組織內如何協調各成員的工作。1962年，R.拉德納把隊論置於可靠的數學基礎上。雖然他們兩人的研究主要在靜態方面，但他們得到的結果可在形式上確定決策問題的信息結構。1972年，何毓琦和祝開景把拉德納的工作推廣到動態情況，後又進行了許多研究，擴大了研究範圍，提出了一些的算法。

隊決策模型隊決策模型有自然狀態、決策變數集合、觀測信息函式集合、策略集合和損失函式等五個基本要素。

自然狀態指問題的不確定成分，包括隨機初始條件、測量噪聲、不確定參數和隨機擾動等信息。這些信息又稱先驗信息,用一個隨機變數向量ξ=(ξ1,…，ξi，…，ξn)表示，機率分布用P（ξ）表示。n是系統狀態的維數。這種信息在開始制定決策時為每個決策者已知。

決策變數集合u屌{u1,…，ui,…，um}。其中元素ui為第i個決策者的決策。ui也可以是向量，這時可將它分解為多個決策者，但他們均占有同樣的信息。當同一決策者在不同時間制定多個決策時，若基於不同的信息，就應看成不同的決策者。m是決策者數目。

觀測信息函式集合z屌{z1,…，zi，…，zm}。其中元素zi為第i個決策者在制定決策時所接收到的信息,包括先驗信息ξ和由通信傳來的其他決策者的決策信息ui。即zi是ξ和uj的函式，記為 zi=ηi(ξ，uj)，j=1，2，…，m，j厵i。一般來說，這一信息與第 k個決策者接收到的信息是不同的。集合η屌{η1,…,ηi，…，ηm}稱為信息結構。若zi只依賴於ξ而與其他決策者所作的決策uj無關，則zi只是ξ的函式,記為zi=ηi(ξ)。信息結構對全體決策者均為已知。

策略集合γ屌{γ1,…,γi,…,γm}。又稱決策規則，相當於控制問題的控制律。其中元素 γi為第i個決策者採用的策略。第i個決策者接收了信息zi之後,必定據此作出某種決策ui,因而ui是zi的函式，記為ui=γi(zi)。這裡的γi(i=1,2,…,m)稱為策略。

損失函式又稱支付函式、價值函式,用來評價各種決策後果所遭受的損失。它是ξ和u的函式,記為L(ξ,u)。常假定L(ξ,u)可用適當的效用單位來表示。

研究內容根據信息結構形式的不同，隊論研究的問題分為靜態隊決策、部分嵌套動態隊決策和動態隊決策。

靜態隊決策簡稱靜隊。指第 i個決策者作決策時用到的信息只依賴於ξ而與其他決策者的決策無關，即ui=γi(zi)=γi(ηi(ξ))。若一組策略已經給定，則損失函式可記為L（ξ，u）=L（u=γ（η(ξ)），ξ）。ξ是隨機變數，對ξ取期望值,用符號Eξ表示。於是,靜隊要解決的問題是求γ壟（i=1，2，…，m），使目標函式J(γ)=Eξ【L(u=γ(η(ξ)，ξ)】為最小。這是一個確定型最最佳化問題，稱為正常策略型。除非問題比較簡單，例如損失函式為二次型，ξ是均值為零的高斯隨機變數，η(ξ)為線性函式（簡稱線性二次型高斯問題），γ的維數較低,否則要從整體上直接解出γ壟(i=1,2,…,m)是十分困難的。

隊決策理論

基本介紹

相關詞條

熱門詞條