石頭剪刀布博弈(Rock paper scissors)是一種雙人博弈,雙方各有三種策略,即石頭、剪刀、布,而策略之間有循環克制關係:石頭克制剪刀,剪刀克制布,布克制石頭。
基本介紹
- 中文名:石頭剪刀布博弈
- 外文名:Rock paper scissors
歷史背景,簡介,均衡分析,相關實驗,變體,
歷史背景
最早提到石頭剪刀布博弈的是中國明代作家謝肇淛所著的《五雜組》一書,書中寫到石頭剪刀布博弈可以追溯到中國漢代(公元前206年至公元220年)。在書中,這種博弈被稱為“手勢令”。
簡介
石頭剪刀布是在全球範圍內很常見的遊戲,它的基本玩法是兩人同時用手比出自己選擇的策略,如果一方策略恰好克制另一方,則克制對方的一方獲勝,被克制的一方失敗;如果兩人選擇的策略相同則視為平局。三種策略是循環克制的,只使用其中一種或兩種策略都很容易被對手針對,該博弈的唯一納什均衡是玩家均等機率地使用三種策略。
石頭剪刀布的相關行為實驗驗證了納什均衡對玩家策略的預測,總體上玩家選擇三種策略的比例相同,但玩家在某一局的行為並非是完全隨機選擇三種策略之一,而是與之前的策略與之前輸贏的結果有關。
均衡分析
不妨設玩家在一次博弈中獲勝時的收益為1,失敗時的收益為-1,平局時的收益為0。由此可以得到下面的收益矩陣:
玩家1\玩家2 | 石頭 | 剪刀 | 布 |
石頭 | 0,0 | 1,-1 | -1,1 |
剪刀 | -1,1 | 0,0 | 1,-1 |
布 | 1,-1 | -1,1 | 0,0 |
首先可以注意到,任何純策略組合不可能成為納什均衡。這是因為如果一方使用純策略,如石頭,那么對方就一定會使用相克制的策略(使用布)來獲得最高的1收益,而被克制的一方只能獲得收益-1。此時被克制的一方一定可以單方面改變策略來提高收益。故石頭剪子布博弈不存在純策略納什均衡。
下面考慮使用混合策略的情形,設雙方使用石頭,剪刀,布的機率分別為和 。此時如果策略組合是納什均衡,則意味著玩家1分別使用石頭、剪刀、布這三種策略來面對玩家2的策略時的收益是相等的,否則玩家1就可以通過只使用收益最高的那一種策略來提高收益,這與納什均衡的定義矛盾。故下面的方程成立:
再結合,可以得到。同理可以求出,故石頭剪刀布博弈的唯一納什均衡為 ,也即雙方均等機率地選擇三種策略。
相關實驗
在2014年的一項石頭剪刀布博弈實驗中,玩家在小範圍內與其他玩家隨機相遇,進行重複多輪的石頭剪子布博弈。研究人員一共招募了360名實驗者,並把他們分為60個6人小組,而後每小組隨機配對玩石頭、剪子、布遊戲,總計300輪,每一輪中獲勝的實驗者能夠獲得一定的獎勵。結果表明總體上玩家選擇石頭、剪子、布的比例相等,但玩家在某一局的具體決策不是完全隨機的,而是與上一局的選擇與結果有關。具體來說:
- 無論上一輪的結果如何,玩家有重複上一輪選擇的傾向,也即上一輪出石頭,下一輪更有可能出石頭;
- 如果玩家在上一輪中獲勝,那么他更有可能重複上一輪的選擇;如果玩家在上一輪中失敗,那么他更有可能選擇能夠克制對手上一輪策略的策略。
這些觀察到的策略被總結為“贏留輸變”(贏家保持現狀輸家做出改變)。這項研究建立了條件反應模型(conditional response),該模型的預測結果與真實的實驗數據很契合。
變體
合作,背叛,不參與的公共品博弈
在石頭剪刀布博弈中,石頭克制剪刀,剪刀克制布,布克制石頭。如果在有限群體中反覆進行石頭剪刀布博弈,那么當大多數人選擇石頭時,選擇克制石頭的策略布會帶來最高的收益,故此時群體中大多數人會轉而選擇布策略;而在大多數人選擇布時,選擇克制布的策略剪刀會帶來最高的收益,故此時群體中大多數人會轉而選擇剪刀策略;而在大多數人選擇剪刀時,選擇克制剪刀的策略會帶來最高的收益,故此時群體中大多數人會轉而選擇石頭策略。從上面的分析可以看出,群體的狀態會在大多數人選擇石頭,大多數人選擇布,大多數人選擇剪刀之間循環。這種循環實際上也可被複製動力學等模型嚴格導出。而在有合作,背叛,不參與三種策略的公共品博弈中的策略演化有著相似的策略循序現象,可以看作是石頭剪刀布博弈的一種變體。
在公共品博弈中,參與人的策略可以抽象為兩種:合作,將自己所有的初始資金投入公共池中;背叛,不向公共池中投入任何初始資金。背叛策略是克制合作策略的,因為公共池中的收益由所有人均分,而背叛者由於不向公共池中投入資金,收益會比合作者高。如果我們引入第三種策略:不參與公共品博弈,選擇不參與公共品博弈將直接獲得一個固定數值的收益,此數值高於只有背叛者參與的公共品博弈中的參與者所獲得的收益,但低於只有合作者參與的公共品博弈中的參與者所獲得的收益。此時從某種程度上說,合作策略克制不參與策略,而不參與策略克制背叛策略。背叛、合作、不參與這三種策略構成了類似石頭、剪刀、布的三種循環克制的策略,這樣的公共品博弈可以視為石頭剪刀布博弈的變體。