進化對策

進化對策論理論中,一個關鍵概念是進化穩定策略(ESS),這一概念的提出歸功於約翰·梅納德·史密斯(John Maynard Smith)和普萊斯在1973年的"動物衝突的邏輯"一文。此種策略在特定的意義上對進化壓力而言是穩健的:群體執行該種策略對執行任何其他策略而言是非入侵的。注意到,進化穩定性準則沒有解釋種群是如何達到這種策略的。然而,一旦達到這種策略,則這樣的策略對進化壓力來說是穩健的。第二個是複製動力學,複製動力學的數學公式是由 Taylor和Jonker於1978年在"進化穩定策略和對策動力學"一文中提出的,複製動力學是選擇過程的顯性模型,它說明種群是如何分配博弈中有聯繫的不同純策略隨時間而演化的。

中文名稱進化對策
英文名稱evolutionary strategy
定  義昆蟲通過自然選擇逐漸適應環境的進化方法。
套用學科昆蟲學(一級學科),昆蟲生態學(二級學科)

基本介紹

  • 中文名:進化對策
  • 外文名:evolutionary strategy
進化穩定策略,複製動力學,

進化穩定策略

進化對策論理論中,一個關鍵概念是進化穩定策略(ESS),這一概念的提出歸功於約翰·梅納德·史密斯(John Maynard Smith)和普萊斯在1973年的"動物衝突的邏輯"一文。此種策略在特定的意義上對進化壓力而言是穩健的:群體執行該種策略對執行任何其他策略而言是非入侵的。假定一對個體是重複隨機地來自於大的群體,去參與一個對稱並有限的兩人博弈,還假定所有的個體在博弈中起初都執行某一個純的或混合的策略x是進化穩定的,那么對於每一個變異策略y,都存在一個正的"入侵障礙",使得執行變異策略y的個體群體所獲得的支付低於此障礙,從而x贏得的預期支付比執行的y所得要高。
注意到,進化穩定性準則沒有解釋種群是如何達到這種策略的。然而,一旦達到這種策略,則這樣的策略對進化壓力來說是穩健的。同時,人們發現,進化穩定性沒有處理種群中具有兩個或更多"變異"同時出現的情況。因而,它隱含地把變異當成稀少事件,以致於種群有時間在另一個變異出現之前回響這種狀況。
雖然,進化穩定性準則是一個生物學上的概念,但是它為各種各樣的人類行為提供一種有關的穩健性準則。這樣,進化穩定性要求人類群體中企圖採用可選擇的策略的任何一個小團體不比已經採用"固有"策略的那些個體所構成的團體收益好。相反,採用固有策略的那些個體所構成的團體缺乏激勵來改變他們的策略。但是,那些採用可選策略的小團體卻受激勵而具有轉變固有策略的行為。在這種社會背景下,進化穩定策略被人們看成是傳統習慣或者已經確立起來的行為規則。比如,社會風氣、企業管理模式等都可以看為是某種人類群體的規則,而極個別的人群社會行為、習氣的變化就會被認為是"變異"。當然,在這種背景下,如果那些極少數的人群或企業的收益比不變異的人群或企業高時,那么這些變異分子會生存得更好!反之,則被淘汰掉。
可惜的是,許多博弈沒有進化穩定策略。於是,研究人員探討各種比進化穩定性稍弱一些的形式,以及集值形式的進化穩定性概念等。此外,ESS概念不能推廣到n人對策的情況上。在本質上,ESS要求強的納什均衡來實施,也就是每一個策略對於策略組而言應是唯一的最佳反應。

複製動力學

複製動力學是選擇過程的顯性模型,它說明種群是如何分配博弈中有聯繫的不同純策略隨時間而演化的。複製動力學的數學公式是由 Taylor和Jonker於1978年在"進化穩定策略和對策動力學"一文中提出的。他們認為由隨機配對的個體所構成的一個大種群執行有限對策的兩人博弈,猶如進化穩定性的設定一樣。然而,此處的個體僅僅採用純策略。種群狀態是指在純策略上的一個分布x。這種狀態在數學上與博弈中的混合策略是等價的。
如果博弈中的收益表示成生物學上的適合性,也就是後代的數目,同時每一個後代繼續其父母的策略,因此,採用純策略i的個體數目(在大的種群中)將以某一比率指數增長,而此等於對純策略i的預期收益u(ei,x),當執行著表示種群中當前策略分布的混合策略x時,採用任何純策略i的種群分布的增長率等於此策略的收益與種群中平均收益的差。後者,等同於混合策略x當與其自身博弈時的預期收益u(x,x)。這是一個單種群的對稱兩人博弈的複製動力學。
Xi=[u(ei,x)-u(x,x)]xi………………(2)
注意到,對當前種群狀態x的最佳反應具有最高的增長率。第二最佳反應具有第二高的增長率,如此等等。然而,雖然更成功的純策略比欠成功的純策略增長得快,但是種群中的平均收益不必隨時間而增長。產生這一原因的可能性是,如果一個個體由採用最佳策略的個體所代替,那么遇見這個新個體的成員會得到比較低的收益。例如,這正是囚徒困境博弈的情況。如果最初幾乎所有個體採用"合作",那么個體中將逐漸地轉向"抵賴",從而平均收益將下降。然而,如果博弈在兩個人總是獲得相等的收益意義上是一個雙對稱的,那么自然選擇的基本規律將成立:種群中收益隨時間而增長,即使沒有必要成為全局最大的。例如,這就是合作博弈的情況,其中所有個體逐漸地轉向到執行同一個純策略上。複製動力學能夠推廣到n人博弈的情況上,這可以看成是來自於 n種群、中的個體隨機地以n類型配對,其中每一個參與者的地位狀況正如納什所給出的群體行為解釋的那樣。目前,存在兩種形式的n種群複製動力學,其中一個是由Taylor在 1979年提出的,另一個是由Maynard Smith在1982年給出的。

相關詞條

熱門詞條

聯絡我們