囚徒困境悖論

英語辭彙：

Prisoner's dilemma

涵義：

1950年，由就職於蘭德公司的梅里爾·弗勒德（Merrill Flood）和梅爾文·德雷希爾（Melvin Dresher）擬定出相關困境的理論，後來由顧問艾伯特·塔克（Albert Tucker）以囚徒方式闡述，並命禁騙汽妹名為“囚徒困境”。經典的囚徒困境如下：

警方逮捕甲、乙兩名嫌疑犯，但沒有足夠證據指控二人有罪。於是警方分開囚禁嫌疑犯，分別和二人見面，並向雙方提供以下相同的選擇：

若一人認罪並作證檢控對方（相關術語稱“背叛”對方），而對方保持沉默，此人將即時獲釋，沉默者將判監10年。

若二人都保持沉默（相關術語稱互相“合作”），則二人同樣判監半年。

若二人都互相檢舉（互相“背叛”），則二人同樣判監2年。

用圖表概述如下：

	甲沉默（合作）	甲認罪（背叛）
乙沉默（合作）	二人同服刑半年	甲即時獲釋；乙服刑10年
乙認罪（背叛）	甲服刑10年；乙即時獲釋	二人同服刑2年

囚徒困境假定每個參與者（即“囚徒”）都是利己的，即都尋求最大自身利益，而不關心另一參與者的利益。參與者某一策略所得利益，如果在任何情況下都比其他策略要低的話，此策略稱為“嚴格劣勢”，理性的參與者絕不會選擇。另外，沒有任何其他力量干預個人決策，參與者可完全按照自己意願選擇策略。

囚徒到底應該選擇哪一項策略，才能將自己個人的刑期縮至最短？兩名囚徒由於隔絕監禁，並不知道對方選擇；而即使他們能交談，還是未必能夠盡信對方不會反口。就個人的理性選擇而言，檢舉背叛對方所得刑期，總比沉默要來得低。試構想困境中兩名理性囚徒會如何作出選擇：

若對方沉默、背叛會讓我獲釋，所以會選擇背叛。

若對方背叛指控我，我也要指控對方才能得囑廈乃到較低的刑期，所以也是會選擇背叛。

形式

整理囚徒困境的基本博弈結構，可更清楚地分析囚徒困境。實驗經濟學常用這種博弈罪挨備的一般形式分析各種論題。以下是實現一般形式的其中一例：

有兩個參與者和一個莊家。參與者每人有一式兩張卡片，各印有“合作”和“背叛”。參與者各把一張卡片文字面朝下，放在莊家面前。文字面朝下排除了參與者知道對方選擇的可能性1。然後，莊家翻開兩個參與者卡片，根據以下規則支付利益：

一人背叛、一人合作：背叛者得5分（背叛誘惑），合作者0分（受騙支付）。

二人都合作：各得3分（合作報酬）。

二人都背叛：各得1分（背叛懲罰）。

用支付矩陣表格展示支付如下（以紅和藍分別表示二參與者）：

一般形式囚徒困境的支付矩陣合作背叛合作3, 30, 5背叛5, 01, 1

以“T、R、P、S”符號表示合作背叛合作R, RS, T背叛T, SP, P

以“勝－負”術語表示合作背叛合作勝, 勝大負, 大勝背叛大勝, 大負負, 負

簡單博弈獲得的點數可以得出一些一般化的結論。

T、R、P、牛道危S符號表

符號	分數	英文	中文（非術語）	解釋
T	5	Temptation	背叛誘惑	單獨背叛成功所得。
R	3	Reward	合作報酬	共同合作所得
P	1	Punishment	背叛懲罰	共同背叛所得
S	0	Suckers	受騙支付	被單獨背叛所獲

若以T（Temptation）=背叛誘惑，R（Reward）=合作報酬，P（Punishment）=背叛懲罰，S（Suckers）=受騙支付，以個人選擇得分而言，可得出以下不等式。

T>R>P>S

（解：從5>3>1>0獲得以上不等式）

若以整體獲分而言，將得出以下不等式。

2R>T+S或2R>2P

（解：和擔棕記2×3>5+0或2×3>2x1；合作2人共得6分，比起互相背叛的共得2分及單獨背叛的共得5分，顯然合作獲分比背叛高。合作在團體而言是支配性策略。）

而重複博弈或重複的囚徒困境將會使參與者從注重T>R>P>S轉變成注重2R>T+S。就是說盼您滲將使參與者脫離困境。以上理論是道格拉斯·霍夫施塔特創建的。

例子

政治學例子：軍備競賽

在政治學中，兩國之間的軍備競賽可以用囚徒困境來描述。兩國都可以聲稱有兩種選擇：增加軍備（背叛）、或是達成削減武器協定（合作）。兩國都無法肯定對方會遵守協定，因此兩國最終會傾向增加軍備。似乎自相矛盾的是，雖然增加軍備會是兩國的“理性”行為，但結果卻顯得“非理性”（例如會對經濟造成都有損壞等）。這可視作遏制理蜜精論的推論，就是以強大的軍事力量來遏制對方的進攻，以達到和平。

經濟學例子：關稅戰

兩個國家，在關稅上可以有以兩個選擇:

提高關稅，以保護自己的商品。（背叛）

與對方達成關稅協定，降低關稅以利各自商品流通。（合作）

當一國因某些因素不遵守關稅協定，而獨自提高關稅（背叛）時，另一國也會作出同樣反應（亦背叛），這就引發了關稅戰，兩國的商品失去了對方的市場，對本身經濟也造成損害（共同背叛的結果）。然後二國又重新達成關稅協定。（重複博弈的結果是將發現共同合作利益最大。）

商業例子：廣告戰

商業活動中亦會出現各種囚徒困境例子。以廣告競爭為例。

兩個公司互相競爭，二公司的廣告互相影響，即一公司的廣告較被顧客接受則會奪取對方的部分收入。但若二者同時期發出質量類似的廣告，收入增加很少但成本增加。但若不提高廣告質量，生意又會被對方奪走。

此二公司可以有二選擇：

互相達成協定，減少廣告的開支。（合作）

增加廣告開支，設法提升廣告的質量，壓倒對方。（背叛）

若二公司不信任對方，無法合作，背叛成為支配性策略時，二公司將陷入廣告戰，而廣告成本的增加損害了二公司的收益，這就是陷入囚徒困境。在現實中，要二互相競爭的公司達成合作協定是較為困難的，多數都會陷入囚徒困境中。

腳踏車賽例子

腳踏車賽事的比賽策略也是一種博弈，而其結果可用囚徒困境的研究成果解釋。例如每年都舉辦的環法腳踏車賽中有以下情況：選手們在到終點前的路程常以大隊伍（英文:Peloton）方式前進，他們採取這策略是為了令自己不至於太落後，又出力適中。而最前方的選手在迎風時是最費力的，所以選擇在前方是最差的策略。通常會發生這樣的情況，大家起先都不願意向前（共同背叛），這使得全體速度很慢，而後通常會有二或多位選手騎到前面，然後一段時間內互相交換最前方位置，以分擔風的阻力（共同合作），使得全體的速度有所提升，而這時如果前方的其中一人試圖一直保持前方位置（背叛），其他選手以及大隊伍就會趕上（共同背叛）。而通常的情況是，在最前面次數最多的選手（合作）通常會到最後被落後的選手趕上（背叛），因為後面的選手騎在前面選手的沖流之中，比較不費力。

囚徒困境悖論

英語辭彙：

涵義：

形式

例子

政治學例子：軍備競賽

經濟學例子：關稅戰

商業例子：廣告戰

腳踏車賽例子

相關詞條

熱門詞條

囚徒困境悖論

英語辭彙：

涵義：

形式

例子

政治學例子：軍備競賽

經濟學例子：關稅戰﻿

商業例子：廣告戰﻿

腳踏車賽例子﻿

相關詞條

熱門詞條

經濟學例子：關稅戰

商業例子：廣告戰

腳踏車賽例子