支付矩陣,也稱“贏得矩陣”、報酬矩陣、收益矩陣、得益矩陣,是指從支付表中抽象出來由損益值形成的矩陣,用來描述兩個人或多個參與人的策略和支付的矩陣。不同參與人的利潤或效用就是支付。在實驗心理學的信號檢測論中,指在一定的信號和噪音出現的先定機率條件下,對被試判斷結果的獎懲辦法。
基本介紹
- 中文名:支付矩陣
- 外文名:Payoff matrix
- 領域:運籌學
- 屬性:由損益值組成的矩陣
- 別稱:贏得矩陣、得益矩陣等
- 相關名詞:收益矩陣
關係介紹,經濟意義,
關係介紹
支付矩陣 (pay-off matrix)是包含備擇行動方案、自然狀態和損益值(或效用值)的矩陣。備擇行動方案是滿足決策目標的n個可行的備擇方案。它們彼此獨立。所有方案的集合A:{a}稱為行動空間或決策空間。自然狀態是各種行動方案可能遇到的狀態。它們往往是隨機的,可以用機率表示。所有狀態的集合E:{e}稱為狀態空間。各自然狀態出現的機率P建立在主觀觀測與經驗估算的基礎上,為主觀機率。所有機率及其狀態構成機率空間。對應於的損益值(或支付值),是行動方案在自然狀態e條件下所產生的收益值(正值)或損失值(負值),其集合為效用值域為、其中。
經濟意義
在價格戰中,企業和競爭者之間是一種非合作博弈關係。在博弈過程中,企業和競爭者都有兩種策略選擇:降價和不降價。假定在某一產業中形成了寡頭市場結構,有兩個企業A和B生產同一類產品。他們共同分享同一市場,在降價前各自獲得的收益相等均為R;當採取價格戰時,一個企業認為先通過降價可以獲得較高的市場份額,由此可使得收益增加為,相對於另一個企業不降價因此而損失的收益:如果另一個企業也同樣採取降價策略,那么面對既定的市場,兩個企業會因價格下降而帶來損失,損失都為(且)。這樣就形成了下表的博弈支付矩陣:
通過比較支付矩陣參數的收益支付水平可以看出:在給定A企業時,B企業選擇降價策略都比不降價策略好,也就是說降價策略是B的最優策略:同樣給定B企業的策略時,A的最優策略也是降價策略。於是(降價,降價)構成了一個博弈的納什均衡,也就是相應的均衡收益。
繼續採用上面的假設,現在來分析下面情況,既然雙方降價與誰都無利,那么當一個降價,另一個不降價而採用其他價格競爭策略(比如搞好售後服務等)時,會出現不同情況,由於採用某種策略適應了社會需求,受到消費者的普遍贊同,從而吸引了大量的顧客,會產生新的收益分配的格局,形成了下面的支付矩陣:
該支付矩陣儘管是將表一中右上角和左下角對調,但卻有著不同的經濟含義和博弈後果。同樣可以得到:不管B採取降價與不降價策略,A都會採取不降價策略:而對於B而言,也會是同樣的抉擇。因此,(不降價,不降價)變成了該支付矩陣的納什均衡。這樣,雙方達成了一種默契和共識——合作。
通過上面的分析不難看出,採取合作的態度比起雙方採用降價競爭的策略有利多了,顯然是一種較為良性的狀態。但它並非是理想的均衡狀態,如果僅僅是維持現狀,滿足現存的收益水平,那么整個行業乃至社會將不思進取,也將不會有經濟社會的繁榮。