演化方程

概念

演化方程是揭示動態對策變化規律的方程。即：

這裡考慮的是一個動態兩人零和對策：

式中X_k={x(k)}，Y_k={y(k)}分別表示局中人Ⅰ和局中人Ⅱ在k時刻的策略集，A_k是依賴於策略x(k)和y(k)的局中人Ⅰ的贏得函式，z(k)是狀態變數，f_k(·)是某個函式，當初態z(0)已知時，局中人Ⅰ在整個對策過程的贏得為

動態對策

動態對策是與同步對策相對的概念，它意味著局中人按一定順序相繼作出若干步決策。動態對策理論通常依賴於以下基本假設：

(1)每個局中人了解每一結局的後果，且確信其對手也了解這一點。

(2)每個局中人能完全記住自己及對手已作出的所有策略選擇。

對於動態對策通常考慮兩種均衡概念：子對策精練納什均衡與貝葉斯均衡。

設對一展開型對策的每個決策結點x，指定了機率μ(x)，使得對每個信息集H，有

。對於信息集H、在H行動的局中人i及某個混合策略組σ=(σ_i，σ_-i)，若對i的任何其他混合策略_i，i在策略組(σ_i，σ_-i)下從H 開始的期望收益不小於在(_i，σ_-i)下從H開始的期望收益，即：E[u_i|H，μ，σ_i，σ_-i]≥E[u_i|H，μ，_i，σ_-i]，則說σ對H是序列合理的。若σ對所有信息集 H是序列合理的，且當P_rob(H |σ)>0時，對任何x∈H有：P_rob(x|σ)=μ(x)P_rob(H|σ)，則稱σ為弱完全貝葉斯均衡，簡稱為WPBE。 WPBE必為納什均衡，反之則未必。

貝葉斯均衡

貝葉斯均衡是不完全信息博弈(貝葉斯博弈)的均衡概念，靜態的不完全信息博弈的均衡被稱為貝葉斯納什均衡，動態的不完全信息博弈的均衡被稱為精煉的貝葉斯納什均衡。解決不完全信息的方法是使用哈薩尼轉換。

靜態貝葉斯博弈記為G={a₁，…，a_n;θ₁， …，θ_n;p₁，…，p_n;u₁，…，u_n}。其中a_i是第i個博弈方採取的行動(純策略)，a_i∈A_i(θ_i)，A_i(θ_i)是第i個博弈方類型依存的行動空間；θ_i是第i個博弈方的類型，Θ_i是第i個博弈方的類型空間；p_i是第i個博弈方的類型為θ_i(θ_i∈Θ_i)的機率。 u_i是第i個博弈方的效用，u_i=u_i(a₁，…，a_i，…， a_n;θ₁，…，θ_i，…，θ_n)=u_i(a_i，a_-i;θ_i，θ_-i)。其中θ_-i=(θ₁，…，θ_i-1，θ_i+1，…，θ_n)。

定義一：如果對所有的i，a_i*∈A_i(θ_i)，使得：

則a=(a₁，…，a_n)就稱為一個(純策略)貝葉斯納什均衡。混合策略的貝葉斯納什均衡的定義類似。其中p_i(θ_-i|θ_i)是第i個博弈方在已知自己的類型為θ_i時判定其他博弈方類型屬於θ_-i的機率。

在動態博弈中，記S_i(θ_i)為第i個博弈方類型依存的策略空間，s_i∈S_i(θ_i)是S_i中的一個特定的策略。記a_-i=(a₁，…，a_i-1，a_i+1，…，a_n)是在第h個信息集上參與人i觀測到其他參與人的行動組合。記p(θ_-i|a_-i)是第i 個博弈方在觀測到a_-i後關於θ_-i的後驗機率。

演化方程

基本介紹

概念

動態對策

貝葉斯均衡

貝葉斯博弈

子對策精練納什均衡

相關詞條

熱門詞條