短視最優回響

概念

站在玩家i的立場上，考查其他人在t時刻的策略

，選擇對付他們的最佳策略，記作

那么

(情況1)如果

屬於

，則選

；

(情況2)如果

不屬於

，那么

1）確定型(記作MBRA-D)：選擇最小下標j，使

，然後選定

2）機率型(記作MBRA-P)：以相同的機率

任選一個

對於短視最優回響，各玩家更新時間很重要．我們對此做以下劃分：

（1）時間串聯型(sequential MBRA)：一個時刻只有一個玩家更新策略．它還可以細分

1、周期型串聯(periodical MBRA)：玩家按順序輪流更新：

2、隨機型串聯(stochastic MBRA)：每個玩家以相同的機率(p=去)被選上更新自己做策略．

（2）時間並聯型(parallel MBRA)：所有玩家同時更新他們的策略．d：u,-t，演化方程即為

（3）時間級聯型(cascading MBRA)：雖然所有玩家同時更新他們的策略，但當玩家更新它的策略時，它知道並使用玩家j(i<J)的新策略．即

基本介紹