信號博弈

簡介

關於信號博弈，最早的研究之一來自斯賓塞（Spence）在1973年提出的教育模型：一位工人知道自己的才能是高或低，而他的僱主不知道。工人向僱主傳送一個關於自己教育水平高低的信號，僱主收到此信號後決定給出的工資。最終工人的收益為工資減去教育成本，而教育成本由工人的才能與教育水平共同決定；僱主的收益為工人產出減去工資，而工人產出由工人的才能決定。在此模型中，信號傳送者是工人，其類型是才能高或才能低；信號接收者是僱主，其行動則是選擇給出不同的工資；信號則是教育水平高或教育水平低。

信號博弈有兩個依次進行的階段，故是動態博弈；信號博弈中信號傳送者的類型僅由傳送者自己知道，而信號接收者不知道，故是不完全信息的博弈。對於不完全信息的博弈，通常的處理方法是海薩尼轉換——引入“自然”這一第三方首先行動，以某種機率分布將不同的類型賦予信號傳送者，且這一機率分布是公共知識。這就使得博弈雙方都完全清楚博弈的所有規則，從而將博弈變為信息完全但不完美的博弈。

博弈模型

下面我們用形式化的語言描述一個最簡單的信號博弈，作為以下均衡分析的基礎。博弈包含兩名玩家，信號傳送者（記為S）與信號接收者（記為R）。S只有兩種類型：

和

，可以傳送兩種信號：

和

，R收到信號後只有兩種行動：

和

。博弈順序如下：

“自然”首先行動，以p的機率選擇S的類型為，以1-p的機率選擇S類型為；
S知曉自身類型後，選擇傳送信號或；
R接收到信號後，選擇行動或；
最終S和R的收益分別為：和其中i=1，2。

均衡分析

策略類型

由上述信號博弈的簡單模型可知，信號傳送者可能有兩種類型，可以傳送兩種信號，故其有4種純策略：

策略，即無論自身類型如何，都傳送信號；
策略，即無論自身類型如何，都傳送信號；
策略，即自身類型為時傳送信號，自身類型為時傳送信號；
策略，即自身類型為時傳送信號，自身類型為時傳送信號。

依據完全類似的推理，信號接收者有4種純策略：

策略，即無論收到信號如何，都選擇行動；
策略，即無論收到信號如何，都選擇行動；
策略，即收到信號時選擇行動，收到信號時選擇行動；
策略，即收到信號時選擇行動，收到信號時選擇行動。

對於信號傳送者的1，2策略，所傳送的信號類型與自身類型無關，這類策略被稱為混同（pooling）策略；對於信號傳送者的3，4策略，不同類型的傳送者會發出不同的信號，這類策略被稱為分離（separating）策略；若傳送者的類型多於兩種，還有可能出現某一些類型的傳送者都傳送相同的信號，另一些類型的傳送者傳送不同的信號的情況，這被稱為部分混同（partial-pooling）或準分離（semi-separating）的策略。同時，某種類型的傳送者還可以隨機化自己的策略，如類型為

的傳送者以p的機率傳送信號

，1-p的機率傳送信號

，這被稱為混合（hybrid）策略。

信號博弈

基本介紹

簡介

博弈模型

均衡分析

策略類型

精煉貝葉斯均衡

例子

變體

空談博弈

相關詞條

熱門詞條