局勢演化方程,或者說,每個玩家的策略演化方程,都是由他們所採用的策略更新規則(strategy updating rule)來決定的。在理論研究中常用的策略更新規則一般是由專家們設計出來的。短視最優回響就是一種常用的策略更新規則。
基本介紹
- 中文名:短視最優回響
- 外文名:myopic best response adjustment(MBRA)
概念
站在玩家i的立場上,考查其他人在t時刻的策略 ,選擇對付他們的最佳策略,記作
那么
(情況1)如果 屬於 ,則選 ;
(情況2)如果 不屬於 ,那么
1)確定型(記作MBRA-D):選擇最小下標j,使 ,然後選定
2)機率型(記作MBRA-P):以相同的機率 任選一個
對於短視最優回響,各玩家更新時間很重要.我們對此做以下劃分:
(1)時間串聯型(sequential MBRA):一個時刻只有一個玩家更新策略.它還可以細分
1、周期型串聯(periodical MBRA):玩家按順序輪流更新:
2、隨機型串聯(stochastic MBRA):每個玩家以相同的機率(p=去)被選上更新自己做策略.
(2)時間並聯型(parallel MBRA):所有玩家同時更新他們的策略.d:u,-t,演化方程即為
(3) 時間級聯型(cascading MBRA):雖然所有玩家同時更新他們的策略,但當玩家更新它的策略時,它知道並使用玩家j(i<J)的新策略.即