隨機對策

隨機對策

隨機對策是一類帶有隨機因素的多步對策。對策論亦稱博弈論,是運籌學的一個重要分支。它所研究的是n(n≥2)個決策者在某種對抗或競爭的局勢下,如何各自作出決策,從而使自己得到自己儘可能最有利的結果。隨機對策是一類帶有隨機因素的多步對策。

基本介紹

  • 中文名:隨機對策
  • 外文名:stochastic game
  • 適用範圍:數理科學
定義,對策論,多步對策,

定義

隨機對策是一類帶有隨機因素的多步對策。
隨機對策[stochastic game] 隨機對策的框架如下:
狀態空間是一個可測空間
對任意
,第 i 個局中人的行動空間是可測空間
,記
是一個轉移機率,對任意
,P(a/ω,s)表示今天的狀態為
,行動為
時明天的狀態為
的機率。
對任意
,第 i 個局中人的支付函式
,其中
為折扣因子,
是第 i 個局中人的階段支付函式,
為初始狀態,
為階段 t 時的行動,狀態
由轉移機率和
確定。

對策論

[game theory]
對策論亦稱博弈論,是運籌學的一個重要分支。它所研究的是n(n≥2)個決策者在某種對抗或競爭的局勢下,如何各自作出決策,從而使自己得到自己儘可能最有利的結果。
1944年,馮·諾依曼(J.von Neumann)和莫根施特恩(O.Morgenstern)出版了《博弈論與經濟行為》一書,宣告了對策論的誕生,也奠定了對策論的基礎。
1944年,諾貝爾經濟獎授予納什(J.F.Nash)等3位對策論學者,從而確認了對策論對經濟論對核心重要性。
除此之外,對策論在政治學、軍事學、心理學、生物學等領域都有非常廣泛和深刻的套用。

多步對策

[multistep game]
多步對策指局中人的每個策略須由多次行動實現的對策。在多步對策中,每個局中人的策略由一系列行動所組成。通常,局中人最初選擇的只是他的一個策略中的某一具體行動,在其他局中人選擇了他們的策略中的某一行動後,這個局中人再採取新的行動,直到對策結束。
例如,象棋、橋牌比賽等均可視為多步對策。

相關詞條

熱門詞條

聯絡我們