產生髮展 產生 進化博弈理論源於對生態現象的解釋,1960年代生態學家Lewontin就開始運用進化博弈理論的思想來研究生態問題。生態學家從動植物進化的研究中發現,動植物進化結果在多數情況下都可以用博弈論的
納什均衡 概念來解釋。然而,博弈論是研究
完全理性 的人類互動行為時提出來的,為什麼能夠解釋根本無理性可言的動植物的進化現象呢?我們知道動植物的進化遵循達爾文“優勝劣汰”生物進化理論,生態演化的結果卻能夠利用博弈理論來給予合理的解釋,這種巧合意味著我們可以去掉經典博弈理論中
理性人 假定的要求。另外,1960年代生態學理論研究取得突破性的進展,非合作博弈理論研究成果也不斷湧現並日趨成熟,進化博弈理論具備了產生的現實及理論基礎。
發展 進化博弈理論套用於研究經濟學問題在學術界曾經引起極大的爭議,爭論的焦點在於理性假定。當時由於理性概念在經濟學界已經根深蒂固。多數人認為利用研究生態演化的進化博弈理論來研究參與人的行為是不合適的。因為動植物行為是完全由其基因所決定的,而經濟問題則涉及到具有邏輯思維及學習、模仿能力的理性參與人的行為,因此,藉助於進化博弈理論來研究遠比動植物複雜的
人類行為 顯然是行不通的。但隨著心理學研究的發展及
有限理性 概念的提出,越來越多的經濟學家套用進化博弈理論來解釋經濟現象並獲得了巨大的成功,利用進化博弈理論來研究並解釋經濟現象的文獻大量出現於各種經濟學期刊了。儘管如此,利用進化博弈理論來解釋經濟現象還是需要對該理論的
基本分析 框架作出相應的調整。如果去掉參與人
偏好 、信念及理性假定等條件,那么參與人是如何作出決策的呢?進化博弈理論在處理
有限理性 參與人決策問題時,常常假定參與人遵循某種比貝葉斯法則更簡單的行為規則,這種行為規則應該告訴如何採取行動及如何根據經驗來改變行為選擇,這樣參與人只要知道什麼會發生,而不必知道為什麼會發生。
1970年代,生態學家Maynard Smith and Price(1973)結合生物進化論與經典博弈理論在研究生態演化現象的基礎上而提出了進化博弈理論的基本均衡概念----
進化穩定策略 (Evolutionarily stable stragegy ESS),如今學術界普遍認為進化穩定策略概念的提出標誌著進化博弈理論的誕生。此後,生態學家Taylor and Jonker(1978)在考察生態演化現象時首次提出了進化博弈理論的基本動態概念----模仿者動態(Replicator Dynamics)。至此,進化博弈理論有了明確的研究目標。
確立 1980年代以後,隨著
新古典經濟學 及博弈論固有的缺陷逐漸被人們所認識,
有限理性 概念得到了學術界的普遍認可,加之進化博弈理論在解釋生態現象時獲得的巨大成功,特別是經濟學界於1992年在康奈爾大學召開的進化博弈理論學術會議,正式確立了該理論的學術地位。一大批如Larry Sameulson、Ken Binmore、Peyton Young等經濟學家從不同的角度對傳統的進化博弈理論分析框架進行拓展,並使之逐漸轉化為描述經濟行為的理論。如今,進化博弈理論的基本理論體系雖然已經形成但還是相當粗糙。因此,它仍然處於不斷發展和完善的階段,但該理論提供了比傳統理論更具現實性且能夠更準確地解釋並預測參與人行為的研究方法,從而得到了越來越多的經濟學家、社會學家、生態學家的重視,我們有理由相信該理論成為
主流經濟學 的一部分已經為時不遠。
基本內容 進化博弈理論結合經典博弈理論及生態理論研究成果,並以
有限理性 的參與人群體為研究對象,利用動態分析方法把影響參與人行為的各種因素納入其模型之中,並以系統論的觀點來考察群體行為的演化趨勢。
進化生態學與博弈論的結合至少已有三十幾年的歷史,初看起來使人覺得奇怪,因為博弈論常常假定參與人是完全理性的,而基因和其他的演化載體常常被假定是以一種完全機械的方式運動。然而一旦用參與人群體來代替博弈論中的參與者個人,用群體中選擇不同純策略的個體占群體中個體總數的百分比來代替博弈論中的混合策略,那么這兩種理論就達到了形式上的統一。儘管這兩種理論在形式上達到了統一,但進化博弈理論與經典博弈理論還是存在本質區別。在進化博弈理論中每個參與人都是隨機地從群體中抽取並進行重複、匿名博弈,他們沒有特定的博弈對手。在這種情況下,參與人既可以通過自己的經驗直接獲得決策信息,也可以通過觀察在相似環境中其他參與人的決策並模仿而間接地獲得決策信息,還可以通過觀察博弈的歷史而從群體分布中獲得決策信息。對參與人來說,觀察群體行為的歷史即估算群體分布是非常重要的,首先,群體分布包含了對手如何選擇策略的信息。其次,通過觀察群體分布也有助於參與人知道什麼是好的策略什麼是不好的策略。參與人常常會模仿好的策略而不好的策略則會在進化過程中淘汰,模仿是學習過程中的一個重要組成部分,成功的行為不僅以說教的形式傳遞下來,而且也容易被模仿。參與人由於受到理性的約束而其行為是幼稚的(Naive),其決策不是通過迅速的最最佳化計算得到,而是需要經歷一個適應性的調整過程,在此過程中參與人會受到其所處環境中各種確定性或隨機性因素影響。因此,系統均衡是達到均衡過程的函式,要更準確地描述參與人行為就必須考察經濟系統的動態調整過程,動態均衡概念及動態模型在進化博弈理論中占有相當重要的地位。
套用 能在多大程度上解決經濟和其他社會科學中的實際問題是度量進化博弈理論價值的唯一依據。到目前為止,儘管進化博弈理論還沒有形成學術界一致認可的理論體系,其基本框架仍然處於數理研究階段,但它提供了一種全新的分析問題的方法,國外許多經濟學者紛紛套用該理論來分析諸如社會制度形成、行業發展趨勢、社會習俗演化等現象,獲得了極大的成功。下面略舉幾例簡單地介紹該理論在經濟學領域的套用。
Conlisk (1980)
利用帶滯後項及隨機項的離散時間動態來分析參與人是否總是行為的最優者。他假定有“最最佳化”及“模仿”兩個純策略,其中非最最佳化者有一個二次損失函式,在此基礎上,他尋求一個滿足非最最佳化者損失函式等於最最佳化者正的常數成本的均衡群體比率。他的主要結論是:當群體中幾乎都是最最佳化者時,模仿比最最佳化策略更合算,因此,群體中非最優者在群體中最最佳化者所占比例並不漸近地收斂於1。這個結論與傳統理論的理性人結論顯然不一致,即進化選擇的結果並不會使所有人都會進行理性選擇。
Crawford(1989)
考察了一個對某一公益事業進行捐助的實驗,在該實驗中要求每個對象選擇捐最小數量還是適度數量款。他套用適應性隨機動態進化博弈理論模型得出的結論能夠很好解釋實驗中所觀察的數據,這篇文章同時表明實驗可以作為發現特定進化動態模型的一個有力武器。
Peyton Young(1998a)
把進化博弈理論套用於分析社會習俗、傳統、規範等的演化及傳統契約的形成原因。他認為現實中每個參與人都是在前人給定的經驗知識基礎上選擇策略,個人選擇策略是一個適應性的學習過程。在作出選擇時,儘管參與人存在一定的慣性及犯錯誤的可能性,經過行為的長期演化,這個適應性學習過程也會收斂於一個有效率的傳統或契約。Peyton Young利用進化博弈理論分析了社會規範的形成與社會福利的關係。他通過一個簡單的左行右行的例子,說明習俗的形成是為了減少不確定性及由此帶來的交易成本。
Jones(1976)和Cowen and Kroszner(1987)
利用進化博弈理論研究了在自由競爭易貨貿易經濟中,存在交易成本時交易媒介是如何進行選擇。他們把個人願意接受不想最終持有某物品的行為看作一個純策略,認為單個交易媒介存在的實質就是尋求系統的角點均衡而不是內點均衡;
Weitzman(1984)
在行業組織方面的套用,如Weitzman(1984) 利用進化博弈理論分析股份制經濟。他認為,如果企業職工都不願意稀釋所有者權益,那么企業實行職工持股的管理方式是動態穩定的;在經濟體制分析方面的套用,
青木昌彥(1996)
等利用進化博弈理論來分析社會經濟體制的變遷,他們認為任何一種經濟體制的產生都具有一定的慣性並隨經濟所處的外部環境與所積累的內部環境的變化一起逐漸地進化,即經濟體制的進化是路徑依賴的結果。