髒臉博弈

髒臉博弈

髒臉博弈(Dirty face game)描述了下面的情景:三人同坐在一起,每個人都只能觀察到其他人的臉是否是髒的,而無法看到自己的臉。實際上三人的臉都是髒的,三人都在笑其他人臉上是髒的,但其中一人突然意思到了自己的臉也是髒的。他是如何推理出自己臉是髒的呢?此例子常被用於說明博弈論中共同知識(Common knowledge)這一概念。

基本介紹

  • 中文名:髒臉博弈
  • 外文名:Dirty face game
背景,共同知識,其他案例,

背景

髒臉博弈出自英國數學家Littlewood的書籍A Mathematician's Miscellany,作者在給出了上述情景後也給出了解答:假設三人分別為A,B與C。A突然想到,為什麼B沒有意識到C笑的是正是B自己呢?這恰好能說明自己的臉是髒的。若A的臉不是髒的,那么B就會疑惑如果自己的臉也不是髒的,那么C在笑誰呢?但是B並沒有這樣想,所以我自己,也就是A的臉也一定是髒的。
在上述推理中,A不僅知道“三人中至少有一人的臉是髒的”(在一些髒臉博弈的版本中,該信息由第三方直接告知,而原文在大家都在笑暗示了這一點),並且還知道“B也知道三人中至少有一人的臉是髒的”,從而推出了自己的臉也是髒的。這種A和B都知道信息X,A還知道B知道信息X,B也知道A知道信息X,A還知道B知道自己知道信息X的遞歸式的信息結構在博弈論中被稱為共同知識。

共同知識

在一個多人博弈中,如果所有玩家都知道信息X,那么信息X被稱為知識;如果所有玩家都知道信息X且都知道別人也知道信息X,且都知道別人也知道自己知道別人知道X,如此遞歸下去直到無窮,那么信息X被稱為共同知識。比如某一第三方對所有玩家公開宣布了信息X,且所有玩家均是完全理性的,那么信息X就成為了共同知識。這一概念最早被美國邏輯學家David Lewis在其著作中提出,隨後由Robert Aumann給出了嚴格的數學表達式。
如何判斷某一信息是否是共同知識有著多種不同的方法,這些方法往往要涉及到狀態空間,信息劃分以及知識運算元等複雜的知識,這裡不詳細說明。簡單來說,狀態空間就是所有可能發生的情形組成的集合;信息劃分是站在某一玩家的角度,對狀態空間集合中可區分的狀態進行劃分;知識運算元則代表了玩家信息劃分的一種性質。
信息X是共同知識還是知識,會影響到玩家的策略選擇,這種信息結構的更新導致的策略改變,在下面的紅帽子博弈中體現的非常明顯,這一故事與髒臉博弈具有類似的設定:
甲,乙,丙三人坐在一起參加考試,每個人都被戴上了紅帽子或白帽子,三人實際戴的都是紅帽子,但每人都只能看到別人頭上帽子的顏色。此時考官對三人宣布:你們三個人中至少有一人戴的是紅帽子。考官問甲,你的帽子顏色是什麼,甲說不知道。考官再問乙,你的帽子顏色是什麼,乙說不知道。最後考官問丙,你的帽子顏色是什麼,丙回答自己的帽子顏色是紅色。丙是如何得知自己帽子顏色的呢?
在上面的故事中,我們所有可能發生的情況共有8種,如果我們將三人的帽子顏色依次組成三元組,那么狀態空間為{(白,白,白),(白,白,紅) ,(白,紅,白) ,(白,紅,紅) ,(紅,白,白) ,(紅,白,紅) ,(紅,紅,白) ,(紅,紅,紅)}。每個人的思考過程如下。
甲的思考如下:被問到自己帽子顏色時,甲僅知道乙和丙的帽子顏色為紅色,且至少有一人帽子為紅色,故他無法區分當前狀態是(白,紅,紅)還是(紅,紅,紅),故只能回答不知道。但實際上甲回答不知道為乙和丙提供了額外的信息:即排除了(紅,白,白)這一情況,因為三個人中至少有一人戴的是紅帽子為共同知識,乙和丙知道甲知道這一知識,若甲看到乙和丙均戴白帽一定會推出自己戴的是紅帽,從而直接回答紅帽。換言之,甲一定看到1頂白帽或沒有人戴白帽。
乙的思考如下:被問到自己帽子顏色時,由於類似的原因,乙無法區分當前狀態是(紅,白,紅)還是(紅,紅,紅),只能回答不知道。但乙回答不知道為丙提供了額外的信息:即排除了(白,紅,白)這種情況,原因類似;還排除了(紅,紅,白)這種情況,這是因為丙知道乙知道甲一定看到1頂白帽或沒有人戴白帽,假如丙是白帽,乙就可以立刻推出自己戴的是紅帽,從而直接回答紅帽。
丙正是通過上述的推理,排除了(紅,紅,白)這種情況,從而得知了自己戴的正是紅帽。

其他案例

猜數字
A與B的額頭上各貼著寫有某個正整數的紙片,這兩個正整數是連續的(即較大的數比較小的大1),每個人都只能看到別人額頭上的數字。第三方輪流詢問這兩名玩家他自己額頭上的數字是什麼,玩家有兩種選擇:選擇說“我不知道”而跳過這次猜數字的機會,或者選擇進行猜測說出一個數字。但每名玩家只有一次說出數字的機會。
在猜數字遊戲與紅帽子博弈類似,兩個未知的正整數是連續的為共同知識,而說出“我不知道”時實際提供了額外的信息。例如第1輪如果A說出“我不知道”,則B可排除自己的額頭上的正整數為1的情形,B再說出“我不知道”則排除了A的額頭上是2的情形等等,具體過程不再贅述。該推理過程隨著正整數的增大而逐漸複雜,但是共同知識的無限遞歸的信息結構使得推理過程仍然可靠。
髒臉博弈的行為實驗
實際中人們運用共同知識進行兩步以及多步的推理不是一件容易的事情。Weber做過一個關於髒臉博弈的行為實驗,實驗以2人小組或3人小組的方式開展。下面介紹一下在2人小組的實驗情況。每人都有80%的可能抽到X牌(類似於“髒臉”),20%的可能抽到O牌,但實驗人員會保證至少有一個參與人會抽到X牌(這個信息是共同知識)。每個參與人只能看到對方的牌,看不到自己的牌。然後請2位參與人同時做決定,選擇“Up”或“Down”。如果第一輪2人都選擇“Up”,則會告知兩人他們剛才都選了“Up”,請2人再選一次。收益矩陣如下:

類型
X
O
選項
Up
$0
$0
Down
$1
-$5
因此,對於理性參與人,如果可以確認自己拿到X牌的話,一定會選擇“Down”,如果不確定自己是否拿到X牌,冒險選擇“Down”將有20%的可能被罰$5,因此會選擇“Up”。
理論上可以預測,如果兩人一人抽到X牌,一人抽到O牌,則抽到X牌的人選“Down”,另一人選“Up”。如果兩個人都抽到X牌,那么他們會在第一輪都選“Up”,第二輪都選“Down”。分析過程如下:2個人都知道至少有一人抽到了X牌。如果看到對方是O牌,那么就可以確定自己抽到了X牌,從而會選擇“Down”。如果看到對方是X牌,則不確定自己是否是X牌,保險起見會選擇“Up”。所以如果兩人抽到的牌是XO類型的,則他們在第一輪就會出現(Down,Up)的結果。如果兩人抽到的牌是XX型,則第一輪都會選“Up”,那么他們會被告知兩人都選了“Up”(公共知識),進入到下一輪。在第二輪,參與人可以結合第一輪的選擇結果做進一步推理:上一輪我的對手選了“Up”,則表明他沒有看到我的牌是O牌,那么我抽到的就是X牌,因此我在第二輪應該選“Down”。於是兩人在第二輪都會選擇“Down”。
實驗結果發現,當兩人抽到的是XO類型,大部分組(87%)的選擇結果都是(Down,Up),符合理論預期。但當兩人都抽到X牌,大部分組在第一輪還是會想理論預測的那樣都選“Up”,但在第二輪兩人都選“Down”的組卻變得很少(53%)。儘管參與實驗的是理工科的大學生,但對於進行兩步的推理並不是所有人都能做到的。

相關詞條

熱門詞條

聯絡我們