行為博弈論

經典的博弈論假設參與人(player)是理性且完全關注自身利益的。但心理學和行為科學的研究發現人們也有很多與此假設相背的行為,比如人們會有公平心理和平等傾向。

基本介紹

  • 中文名:行為博弈論
  • 外文名:BGT,behaviroal game theory
  • 參與人:理性且完全關注自身利益
  • 結果:會有公平心理和平等傾向
介紹,定義,區別,結論,實驗過程,公認的解釋,

介紹

不僅關注自身利益,也關注與他人利益的比較,而且可能存在著某些利他行為,等等。為此,博弈論科學家試圖結合心理學和行為科學對於人類行為的研究成果,重新將個人的社會偏好等行為因素引入博弈論,改造經典博弈論的理論傳統。由此興起了行為博弈理論(BGT,behaviroal game theory)。當代的行為經濟學、實驗經濟學,乃至神經元經濟學,與行為博弈論都密切相關。

定義

筆者在這裡談了這么多關於行為經濟學的知識,看起來似乎和博弈論與信息經濟學不太相關。實際上,長期以來,傳統博弈論與信息經濟學一直以“理性人”為理論基礎,通過一個個精美的數學模型搭建起公理化的完美自洽的理論體系。 然而,心理學和行為經濟學的研究結果表明,人類在作出經濟決策時總是存在著系統的推理誤差。這些誤差產生的原因大多來自於思考成本、激動和經驗等心理因素的影響。所謂思考成本是指,人類認知能力有著心理的臨界極限,認知作為一種資源是稀缺的,使用它必須支付一定的成本,人們在實際決策時很少把這種成本考慮進去。

區別

和傳統博弈論不同,行為經濟學從人自身的心理特質、行為特徵出發,去揭示影響選擇行為的非理性的情感因素。行為經濟學家為了彌補傳統博弈論理性人假定的不足,他們提出了“行為博弈論”。與傳統博弈論相對,行為博弈論考慮人類非理性因素,研究參與人實際上做出什麼行動。
構想有兩位博弈者,分別稱之為投資人A和借款人B。他們互不相識,博弈者A得到一筆錢並被告知可以完全保留也可以將其中的任意比例借給B,他給出的任何金額都會以大於1 的某一倍數付給B,然後由B決定是否回報和回報多少給A。按照傳統博弈論的觀點,理性的B應該最大化他自身的利益,那么他的最優策略就是保有獲得的所有收益,不會返還給參與者A。而理性的A當然會估計到B的策略,因此不會借錢給B,這就是納什均衡點

結論

下面我們來看行為經濟學家利用實驗的方法將得出怎樣的結論?
實驗設計如下:將招募來的博弈者安置在計算機實驗室中,每人有10元的出場費,兩人一組通過各自面前的計算機聯繫,相互不認識而且實驗結束也不會知道對方是誰。每組中的一位(投資人A)可以完全保留手中的10元也可以將其中的任何部分借給對手(借款人B),不管A付出多少,B都會收到3倍的金額,如A借給對方4元,B總共會得到4×3 10=22元的支付,然後由B決定是否還錢給A和還多少,只要B 願意借錢給A也同樣會收到3倍的金額。按照傳統博弈論,在這樣的一次性博弈中,當處於納什均衡時,A 和B各自都只能獲得10元。
然而事實上,經過成百上千次的實驗,發現50%的博弈者A會向對方進行借錢,而75%會收到對方的還款,博弈者B亦然。而且,B從A處借錢越多,隨後向A還錢就越多。
行為博弈學家認為,之所以產生這種現象的原因在於:現行的社會、制度、經濟和生活環境都會影響人與人之間的信任。傳統博弈論認為理性自利的人不會信任別人,即使得到別人的信任也不會變的值得信任,但它忽略了一點,人類不僅是自利的,同時也是高度社會化的動物,整個不斷社會化的過程使得大腦已經形成了一種自動的社會化的反應機制,我們在意別人的看法,考慮別人的反應,即使是對陌生人,雖然這種情感發生作用時我們甚至沒有意識到,但它還是在決策制定中發揮著重要的作用。
我們的大腦作為一個內在的指南針引導我們做出“對”的選擇。同樣的,對於“囚徒困境”博弈,這兩個被抓的嫌疑犯可能在一起合作很久,雙方有密切的社會聯繫,各自對對方都非常信任,甚至願意為對方犧牲自己,那么在這種情況下,“囚徒困境”的結局反而是兩個嫌疑犯都不承認自己的罪行更不會揭發別人,他們的非理性行為使他們獲得帕累托改善,也就是說兩人的境況同時得到改善。因此,傳統博弈論的結論是:在這樣的博弈中理性人的個人理性行為導致集體的非理性。反過來,行為博弈論的結論則是:在這樣的博弈中博弈者的個人非理性反而導致集體的理性。
我們再來看前文討論過的一個例子。在這個例子中,博弈者A與博弈者B分配一個固定量的利益,比如一定數額的金錢或一個固定大小的蛋糕。其中一位博弈者A出價,也就是在雙方之間分配這一定利益,要求博弈者B要么接受要么拒絕,如果B接受,那么雙方就按照A提出的分配比例瓜分利益,如果B拒絕,那么雙方之間不會有交易行為,雙方都不會獲得任何收益。按照傳統博弈論的推導,博弈者都是理性自利的,有收益總是比沒收益好,因此只要A對B的分配額大於0,理性的B都會接受,所以,這個博弈具有無窮多個納什均衡

實驗過程

該博弈的實驗過程大致是這樣的:兩個博弈者(出價者A和回應者B)就10元錢進行議價,10元代表雙方交易的利潤或者說贏餘,A向對方分配x元,則自己剩下10-x元,B要么接受他的出價則獲得x元,而A得到10-x,要么B拒絕則大家均一無所獲。
傳統博弈論的分析結果顯然是,A獲得絕大部分利益,B只能分得蠅頭小利。
然而根據行為博弈論的實驗表明,出價者的平均出價大致是4~5元左右。50%的B都拒絕了2元以下的出價,B認為過分低於1/2的出價太不公平,因此以拒絕的方式懲罰對方的過分行為,結果雙方的收益都為0元。
如果A出價過低,B的拒絕實質上是一種“報復性回報”。這就是說,回應者寧願犧牲自身的利益去懲罰那些未公平對待他們的出價者。這種報復性回報在現實生活中很多,如人體炸彈、拒絕庭外調解、情殺案件等,都是回應人為了傷害對方不惜犧牲自己的非理性行為。

公認的解釋

對這種行為博弈現象公認的解釋是:一些博弈者將獲得收益的一半視作公平交易點並且有要求被公平對待的偏好。這點很好理解,在我們的實際生活中,很多時候人們耗費大量的沒有增加整體社會福利的成本所希望達到的境況不過是為了求得人與人之間的公平、公正與合理。

相關詞條

熱門詞條

聯絡我們