囚徒困境悖論

英語辭彙:,涵義:,形式,例子,政治學例子:軍備競賽,經濟學例子:關稅戰,商業例子:廣告戰,腳踏車賽例子,

英語辭彙:

Prisoner's dilemma

涵義:

1950年,由就職於蘭德公司的梅里爾·弗勒德(Merrill Flood)和梅爾文·德雷希爾(Melvin Dresher)擬定出相關困境的理論,後來由顧問艾伯特·塔克(Albert Tucker)以囚徒方式闡述,並命禁騙汽妹名為“囚徒困境”。經典的囚徒困境如下:
警方逮捕甲、乙兩名嫌疑犯,但沒有足夠證據指控二人有罪。於是警方分開囚禁嫌疑犯,分別和二人見面,並向雙方提供以下相同的選擇:
若一人認罪並作證檢控對方(相關術語稱“背叛”對方),而對方保持沉默,此人將即時獲釋,沉默者將判監10年。
若二人都保持沉默(相關術語稱互相“合作”),則二人同樣判監半年。
若二人都互相檢舉(互相“背叛”),則二人同樣判監2年。
用圖表概述如下:
甲沉默(合作)
甲認罪(背叛)
乙沉默(合作)
二人同服刑半年
甲即時獲釋;乙服刑10年
乙認罪(背叛)
甲服刑10年;乙即時獲釋
二人同服刑2年
囚徒困境假定每個參與者(即“囚徒”)都是利己的,即都尋求最大自身利益,而不關心另一參與者的利益。參與者某一策略所得利益,如果在任何情況下都比其他策略要低的話,此策略稱為“嚴格劣勢”,理性的參與者絕不會選擇。另外,沒有任何其他力量干預個人決策,參與者可完全按照自己意願選擇策略。
囚徒到底應該選擇哪一項策略,才能將自己個人的刑期縮至最短?兩名囚徒由於隔絕監禁,並不知道對方選擇;而即使他們能交談,還是未必能夠盡信對方不會反口。就個人的理性選擇而言,檢舉背叛對方所得刑期,總比沉默要來得低。試構想困境中兩名理性囚徒會如何作出選擇:
若對方沉默、背叛會讓我獲釋,所以會選擇背叛。
若對方背叛指控我,我也要指控對方才能得囑廈乃到較低的刑期,所以也是會選擇背叛。

形式

整理囚徒困境的基本博弈結構,可更清楚地分析囚徒困境。實驗經濟學常用這種博弈罪挨備的一般形式分析各種論題。以下是實現一般形式的其中一例:
有兩個參與者和一個莊家。參與者每人有一式兩張卡片,各印有“合作”和“背叛”。參與者各把一張卡片文字面朝下,放在莊家面前。文字面朝下排除了參與者知道對方選擇的可能性1。然後,莊家翻開兩個參與者卡片,根據以下規則支付利益:
一人背叛、一人合作:背叛者得5分(背叛誘惑),合作者0分(受騙支付)。
二人都合作:各得3分(合作報酬)。
二人都背叛:各得1分(背叛懲罰)。
用支付矩陣表格展示支付如下(以紅和藍分別表示二參與者):
一般形式囚徒困境的支付矩陣合作背叛合作3, 30, 5背叛5, 01, 1
以“T、R、P、S”符號表示合作背叛合作R, RS, T背叛T, SP, P
以“勝-負”術語表示合作背叛合作勝, 勝大負, 大勝背叛大勝, 大負負, 負
簡單博弈獲得的點數可以得出一些一般化的結論。
T、R、P、牛道危S符號表
符號分數英文中文(非術語)解釋
T
5
Temptation
背叛誘惑
單獨背叛成功所得。
R
3
Reward
合作報酬
共同合作所得
P
1
Punishment
背叛懲罰
共同背叛所得
S
0
Suckers
受騙支付
被單獨背叛所獲
若以T(Temptation)=背叛誘惑,R(Reward)=合作報酬,P(Punishment)=背叛懲罰,S(Suckers)=受騙支付,以個人選擇得分而言,可得出以下不等式。
T>R>P>S
(解:從5>3>1>0獲得以上不等式)
若以整體獲分而言,將得出以下不等式。
2R>T+S或2R>2P
(解:和擔棕記2×3>5+0或2×3>2x1;合作2人共得6分,比起互相背叛的共得2分及單獨背叛的共得5分,顯然合作獲分比背叛高。合作在團體而言是支配性策略。)
重複博弈或重複的囚徒困境將會使參與者從注重T>R>P>S轉變成注重2R>T+S。就是說盼您滲將使參與者脫離困境。 以上理論是道格拉斯·霍夫施塔特創建的。

例子

政治學例子:軍備競賽


在政治學中,兩國之間的軍備競賽可以用囚徒困境來描述。兩國都可以聲稱有兩種選擇:增加軍備(背叛)、或是達成削減武器協定(合作)。兩國都無法肯定對方會遵守協定,因此兩國最終會傾向增加軍備。似乎自相矛盾的是,雖然增加軍備會是兩國的“理性”行為,但結果卻顯得“非理性”(例如會對經濟造成都有損壞等)。這可視作遏制理蜜精論的推論,就是以強大的軍事力量來遏制對方的進攻,以達到和平。

經濟學例子:關稅戰

兩個國家,在關稅上可以有以兩個選擇:
提高關稅,以保護自己的商品。(背叛)
與對方達成關稅協定,降低關稅以利各自商品流通。(合作)
當一國因某些因素不遵守關稅協定,而獨自提高關稅(背叛)時,另一國也會作出同樣反應(亦背叛),這就引發了關稅戰,兩國的商品失去了對方的市場,對本身經濟也造成損害(共同背叛的結果)。然後二國又重新達成關稅協定。(重複博弈的結果是將發現共同合作利益最大。)

商業例子:廣告戰

商業活動中亦會出現各種囚徒困境例子。以廣告競爭為例。
兩個公司互相競爭,二公司的廣告互相影響,即一公司的廣告較被顧客接受則會奪取對方的部分收入。但若二者同時期發出質量類似的廣告,收入增加很少但成本增加。但若不提高廣告質量,生意又會被對方奪走。
此二公司可以有二選擇:
互相達成協定,減少廣告的開支。(合作)
增加廣告開支,設法提升廣告的質量,壓倒對方。(背叛)
若二公司不信任對方,無法合作,背叛成為支配性策略時,二公司將陷入廣告戰,而廣告成本的增加損害了二公司的收益,這就是陷入囚徒困境。在現實中,要二互相競爭的公司達成合作協定是較為困難的,多數都會陷入囚徒困境中。

腳踏車賽例子

腳踏車賽事的比賽策略也是一種博弈,而其結果可用囚徒困境的研究成果解釋。例如每年都舉辦的環法腳踏車賽中有以下情況:選手們在到終點前的路程常以大隊伍(英文:Peloton)方式前進,他們採取這策略是為了令自己不至於太落後,又出力適中。而最前方的選手在迎風時是最費力的,所以選擇在前方是最差的策略。通常會發生這樣的情況,大家起先都不願意向前(共同背叛),這使得全體速度很慢,而後通常會有二或多位選手騎到前面,然後一段時間內互相交換最前方位置,以分擔風的阻力(共同合作),使得全體的速度有所提升,而這時如果前方的其中一人試圖一直保持前方位置(背叛),其他選手以及大隊伍就會趕上(共同背叛)。而通常的情況是,在最前面次數最多的選手(合作)通常會到最後被落後的選手趕上(背叛),因為後面的選手騎在前面選手的沖流之中,比較不費力。
若以整體獲分而言,將得出以下不等式。
2R>T+S或2R>2P
(解:2×3>5+0或2×3>2x1;合作2人共得6分,比起互相背叛的共得2分及單獨背叛的共得5分,顯然合作獲分比背叛高。合作在團體而言是支配性策略。)
重複博弈或重複的囚徒困境將會使參與者從注重T>R>P>S轉變成注重2R>T+S。就是說將使參與者脫離困境。 以上理論是道格拉斯·霍夫施塔特創建的。

在政治學中,兩國之間的軍備競賽可以用囚徒困境來描述。兩國都可以聲稱有兩種選擇:增加軍備(背叛)、或是達成削減武器協定(合作)。兩國都無法肯定對方會遵守協定,因此兩國最終會傾向增加軍備。似乎自相矛盾的是,雖然增加軍備會是兩國的“理性”行為,但結果卻顯得“非理性”(例如會對經濟造成都有損壞等)。這可視作遏制理論的推論,就是以強大的軍事力量來遏制對方的進攻,以達到和平。
兩個國家,在關稅上可以有以兩個選擇:
提高關稅,以保護自己的商品。(背叛)
與對方達成關稅協定,降低關稅以利各自商品流通。(合作)
當一國因某些因素不遵守關稅協定,而獨自提高關稅(背叛)時,另一國也會作出同樣反應(亦背叛),這就引發了關稅戰,兩國的商品失去了對方的市場,對本身經濟也造成損害(共同背叛的結果)。然後二國又重新達成關稅協定。(重複博弈的結果是將發現共同合作利益最大。)
商業活動中亦會出現各種囚徒困境例子。以廣告競爭為例。
兩個公司互相競爭,二公司的廣告互相影響,即一公司的廣告較被顧客接受則會奪取對方的部分收入。但若二者同時期發出質量類似的廣告,收入增加很少但成本增加。但若不提高廣告質量,生意又會被對方奪走。
此二公司可以有二選擇:
互相達成協定,減少廣告的開支。(合作)
增加廣告開支,設法提升廣告的質量,壓倒對方。(背叛)
若二公司不信任對方,無法合作,背叛成為支配性策略時,二公司將陷入廣告戰,而廣告成本的增加損害了二公司的收益,這就是陷入囚徒困境。在現實中,要二互相競爭的公司達成合作協定是較為困難的,多數都會陷入囚徒困境中。
腳踏車賽事的比賽策略也是一種博弈,而其結果可用囚徒困境的研究成果解釋。例如每年都舉辦的環法腳踏車賽中有以下情況:選手們在到終點前的路程常以大隊伍(英文:Peloton)方式前進,他們採取這策略是為了令自己不至於太落後,又出力適中。而最前方的選手在迎風時是最費力的,所以選擇在前方是最差的策略。通常會發生這樣的情況,大家起先都不願意向前(共同背叛),這使得全體速度很慢,而後通常會有二或多位選手騎到前面,然後一段時間內互相交換最前方位置,以分擔風的阻力(共同合作),使得全體的速度有所提升,而這時如果前方的其中一人試圖一直保持前方位置(背叛),其他選手以及大隊伍就會趕上(共同背叛)。而通常的情況是,在最前面次數最多的選手(合作)通常會到最後被落後的選手趕上(背叛),因為後面的選手騎在前面選手的沖流之中,比較不費力。

相關詞條

熱門詞條

聯絡我們