隨機對策是一類帶有隨機因素的多步對策。對策論亦稱博弈論,是運籌學的一個重要分支。它所研究的是n(n≥2)個決策者在某種對抗或競爭的局勢下,如何各自作出決策,從而使自己得到自己儘可能最有利的結果。隨機對策是一類帶有隨機因素的多步對策。
基本介紹
- 中文名:隨機對策
- 外文名:stochastic game
- 適用範圍:數理科學
定義,對策論,多步對策,
定義
隨機對策是一類帶有隨機因素的多步對策。
隨機對策[stochastic game] 隨機對策的框架如下:
狀態空間是一個可測空間
。

對任意
,第 i 個局中人的行動空間是可測空間
,記
。








對任意
,第 i 個局中人的支付函式
,其中
為折扣因子,
是第 i 個局中人的階段支付函式,
為初始狀態,
為階段 t 時的行動,狀態
由轉移機率和
確定。








對策論
[game theory]
1944年,諾貝爾經濟獎授予納什(J.F.Nash)等3位對策論學者,從而確認了對策論對經濟論對核心重要性。
除此之外,對策論在政治學、軍事學、心理學、生物學等領域都有非常廣泛和深刻的套用。
多步對策
[multistep game]
多步對策指局中人的每個策略須由多次行動實現的對策。在多步對策中,每個局中人的策略由一系列行動所組成。通常,局中人最初選擇的只是他的一個策略中的某一具體行動,在其他局中人選擇了他們的策略中的某一行動後,這個局中人再採取新的行動,直到對策結束。
例如,象棋、橋牌比賽等均可視為多步對策。