網路演化博弈實驗中的策略學習動力學與相變問題研究

《網路演化博弈實驗中的策略學習動力學與相變問題研究》是依託蘭州大學,由關劍月擔任項目負責人的面上項目。

基本介紹

  • 中文名:網路演化博弈實驗中的策略學習動力學與相變問題研究
  • 依託單位:蘭州大學
  • 項目負責人:關劍月
  • 項目類別:面上項目
項目摘要,結題摘要,

項目摘要

近幾年來的一些真人博弈實驗結果表明:以往博弈理論模型中所提出的個體策略更新動力學都不能準確地描述群體層面的策略演化以及系統合作行為的湧現現象。在本項目中,我們將開展大規模真人網路博弈實驗,通過詳細跟蹤個體所採取策略與所獲得收益的時間序列,分析其與網路鄰居的策略與收益時間序列的關聯行為,探尋影響個體決策動力學的關鍵性因素。同時根據行為心理學的研究成果,研究不同的強化學習規則對群體合作行為演化的影響,通過調節學習速率參數,找到理論預測結果與真人實驗結果最符合的規則,為更好地理解實際社會系統中合作演化提供科學指導。最後我們還將借用統計物理學和非線性動力學中的思想和方法來詳細研究網路博弈演化過程中呈現出來的相變行為,探究影響其臨界指數或普適類的結構因素和動力學機制,為深入理解複雜適應系統局部微觀作用導致巨觀湧現行為提供深刻的理論解釋。

結題摘要

理論和實驗研究表明複雜系統的功能實現離不開組成系統的單元間的集體合作行為。理解合作行為在大量個體間的湧現與維持機制是揭開從生命起源到人類社會組織產生機理的最根本途徑。博弈理論為研究相互競爭的自私個體之間的合作演化提供了有力的理論框架。本項目根據實際複雜系統的特性和行為心理學的研究成果,採用網路演化博弈模擬實驗和理論分析相結合的方法,並借用統計物理學和非線性動力學中的思想和方法,詳細研究了社團結構、網路局域性與異質性、小世界網路、無標度網路以及多標籤多個體網路等結構特徵,和個體活動異質性、個體的非均勻教授和學習能力、敲詐者、非一致性合作者、對稱懲罰策略、一步記憶策略、合作-勒索聯盟、個體的理性程度等因素對合作演化的影響。得到如下研究結果:(1)敲詐者、適度的懲罰以及給予大度個體更多的幫助會促進合作行為。(2)個體非均勻教授能力促進合作;個體學習能力的異質性在同步策略更新時會促進合作,而在異步策略更新時其會抑制合作。(3)個體活動的異質性在強選擇下在較惡劣的環境有利於合作湧現,而在弱選擇下不利於合作的形成;在強選擇下社團豐度可顯著促進合作。(4)Win-stay-lose-shift策略在一步記憶策略空間中是一個穩定的優勢策略。(5)空間雪堆博弈可以演化到一種自組織臨界狀態。(6)網路的局域性與異質性對合作的影響依賴於具體的博弈類型和更新規則。(7)網路結構的小世界特性和耦合動力學的相對時間尺度在演化Kuramoto困境中均有著重要作用。(8)無標度網路上的合作-勒索聯盟的湧現,及勒索者均促進系統合作。(9)適當的連邊和理性程度可以緩解Kuramoto困境。(10)在多標籤多個體網路系統中非一致性合作者可以促進利他行為的湧現。這些結果對於理解複雜社會、經濟系統中集體合作行為的湧現與維持具有重要的理論意義,同時對於制定有效誘導政策激勵個體採取合作行為具有重要的指導意義。此外還富有成效的擴展研究了疾病和觀點傳播動力學,以及近似主方程方法在神經網路中的套用。

相關詞條

熱門詞條

聯絡我們