演化博弈論是把博弈理論分析和動態演化過程分析結合起來的一種理論。根據演化博弈理論,博弈雙方的策略最終收斂到演化穩定策略(evolutionarily stablestragegy,ESS)上。
基本介紹
- 中文名:網路演化博弈
- 相關詞:博弈論
相關簡介
博弈論
博弈論被認為是研究自然和人類社會中普遍存在的合作行為最為有力的手段。博弈模型反映了自私的個體之間的合作競爭關係,能夠很好地刻畫生物系統中生物體之間的相互作用關係及演化動力學。
通常博弈由以下4個部分所組成:
(3)收益矩陣:當博弈個體選定好自己的策略後,其所獲取的收益由收益矩陣中的相應元素來確定.
(4)策略演化: 在多輪博弈過程中,博弈個體遵循自身收益最大化的最終目標,即以此目標為指導原則來進行策略調整。
經典博弈模型
演化網路博弈基本定義
(1)數量N→∞的局中人位於一個複雜網路上。
(2)每個時間演化步,按一定法則選取的一部分局中人以一定頻率匹配進行博弈。
(3)局中人採取的對策可以按一定法則更新,所有局中人的策略更新法則相同。這種法則稱為“策略的策略”。然而,法則更新比博弈頻率慢得多,使得局中人可以根據上一次更新對策成功與否選擇、調整下一次的更新。(4)局中人可以感知環境、吸取信息,然後根據自己的經驗和信念,在策略更新法則下更新策略。
(5)策略更新法則可能受到局中人所在網路拓撲結構的影響。
演化網路博弈研究內容
促進合作行為湧現的機制
公共利益博弈
演化博弈論與經典博弈論的區別
(2)均衡意義的不同:納什均衡到演化穩定策略(ESS);
網路上的演化博弈研究方向
(2) 一定的網路結構下,探討各種演化規則對演化結果的影響;
(3)網路拓撲和博弈動力學的共演化,主要是自 適應網路上博弈動力學 ,即網路拓撲調整受博弈動力學影響.
網路演化博弈的策略更新規則
(2)模仿優勝者:即個體在策略更新時,同時參考那些收益比自身高的鄰居的策略,以正比於他們所得收益的機率進行策略轉變。
以上兩種規則可以統稱為模仿策略. 模仿策略的基本思想是個體的更新策略,根據鄰居中收益最高的個體策略進行模仿,以期獲得更高的收益。
另一類演化規則
其中,kmax為P1與P2中較大度節點的度,P,T,S,R為2×2收益矩陣元素。
Moran過程是將Darwin的進化思想直接引入到演化博弈中。一個實際背景是種群中的變異入侵,以下圖為例,種群中所有個體“C”,當某個個體發生變異後,變為”D”,以後每一步考慮隨機移去一個個體,並以正比於原種群中“C”個體適應度的機率生成一個新的“C”個體,否則生成一個新的“D”個體。在適應度函式滿足一定條件時,“D”個體可能完全侵占整個種群(Invade),
Martin A.Nowak等人研究了這類種群侵占問題,將某種策略從種群中僅存在一個變異個體時,最終能侵占整個種群的機率定義為策略的紮根機率。