进化稳定对策Word格式.docx

上传人:b****5 文档编号:20317997 上传时间:2023-01-21 格式:DOCX 页数:19 大小:171.06KB
下载 相关 举报
进化稳定对策Word格式.docx_第1页
第1页 / 共19页
进化稳定对策Word格式.docx_第2页
第2页 / 共19页
进化稳定对策Word格式.docx_第3页
第3页 / 共19页
进化稳定对策Word格式.docx_第4页
第4页 / 共19页
进化稳定对策Word格式.docx_第5页
第5页 / 共19页
点击查看更多>>
下载资源
资源描述

进化稳定对策Word格式.docx

《进化稳定对策Word格式.docx》由会员分享,可在线阅读,更多相关《进化稳定对策Word格式.docx(19页珍藏版)》请在冰豆网上搜索。

进化稳定对策Word格式.docx

为了分析上的方便,对策集经常被高度简化,经常是只考虑对应于两个等位基因的两个对策。

而ESS理论家对于遗传学系统本身的问题考虑很少,经常假定对策可以无性繁殖或者有机体是单倍体。

这种遗传学上的高度简化使得人们可以考察更为复杂、更为广泛的对策集,以及对策之间更加微妙的适合度相互作用。

用MaynardSmith的话说,ESS概念的精华就是‘假定简单化的遗传学而考察复杂的生态学’〔Hines1987〕。

另外一点不同是,ESS只注重考虑种群到达平衡时的性质,而根本上忽略了动态。

容易看到,种群遗传学和ESS理论各自都在不同方面上作了一些不现实的假定,因此二者之间更具有互补性,而不是相互对立。

Price〔1973〕最初的目的是希望理解动物个体之间的争斗为什么总是一场“有限的战争〞,很少造成严重的伤害。

例如,许多蛇类的雄性个体相互之间扭缠打斗时从不使用它们的毒牙。

在MaynardSmith&

Price研究这个问题之前,人们通常给出的解释是,否那么许多个体将受到严重伤害,最终对物种生存不利。

但是MaynardSmith&

Price不满意这种群体选择的观点,并从个体选择的角度运用对策论提出了他们自己的生物学解释。

他们的分析是以动物争斗为例进展的。

首先让我们只考虑“鹰〞“鸽〞两种战斗对策。

鹰对策者战斗起来总是全力以赴,除非身受重伤否那么决不退让;

如果争斗双方都是鹰对策者,那么其中一方将最终受到伤害并退让。

而鸽对策者那么只限于威胁恫吓,对方一旦表现出争斗升级迹象立刻退让;

如果对方也是鸽对策者,那么相互对峙一定时间后便会有一方自动退却〔鸽子通常视为和平的象征,这里也取其这层含义。

但我们都知道,事实上鸽子是非常好斗的〕。

这里我们假定鹰对策和鸽对策之间没有连续过渡的中间类型;

对策集是离散的。

表3.1鹰鸽对策的赢得矩阵

(V-C)/2

V

V/2

令V表示被争夺资源的价值;

胜利的一方获得该资源并使适合度增加V;

争斗失败的鹰对策者其适合度损失C。

鹰鸽对策的赢得矩阵〔payoffmatrix〕可以表示为表3.1。

在完全由鸽对策者组成的种群里,鹰对策者一旦进入它的适合度将可增加V,而鸽对策者的适合度只能增加V/2〔未考虑对峙带来的能量或时间消耗〕;

因此,我们得出结论:

鸽对策属于在进化上不稳定的类型,它将很容易地被鹰对策侵入。

那么完全的鹰对策种群是否就是进化稳定的呢?

根据表3.1我们容易看到,鹰对策是否为进化稳定的对策取决于V和C值的相对大小。

在一个鹰对策种群里,鹰对策者的平均赢得为(V-C)/2,而侵入的鸽对策者的赢得为0。

如果V>

C,那么鹰对策者的适合度大于鸽对策者的适合度;

反之,如果V<

C,那么鸽对策者的适合度大于鹰对策者的适合度,它将能够侵入鹰对策种群。

这时我们看到,无论是纯鹰对策种群还是纯鸽对策种群都不是进化稳定的。

所以,种群必然是一个鹰、鸽对策的混合体。

那么鹰、鸽对策者在种群各自所占比例应该是多少呢?

令p为种群鹰对策者所占比例。

鹰、鸽对策者的适合度可以分别表示为

〔3.1〕

其中,W0表示与对策无关的根本适合度。

鹰对策者和鸽对策者的适合度都不是恒定值,依赖于种群鹰、鸽对策的相比照例,因而我们称其为频率依赖的选择〔frequency-dependentselection〕。

假定个体无性生殖,鹰对策者生育的后代都是鹰对策者,鸽对策者生育的后代也都是鸽对策者,并且每个个体生育的后代数量与其适合度成正比。

一代之后,鹰对策者的频率将为

〔3.2〕

其中

方程〔3.2〕准确地描述了系统的动态。

知道了V和C的值以及初始的鹰对策者频率就可以很容易地计算种群鹰对策者频率的变化过程。

然而,对于这类频率依赖的选择,人们往往更关心的是系统将向什么状态趋近,或者说稳定的系统状态是什么。

在一个稳定种群,鹰、鸽对策者的适合度应该相等,即Wh=Wd;

据此我们可以求出鹰对策者的比例为

如果C值相对于V值来说很大,那么种群鹰对策者的比例将会很低,鹰-鹰争斗的情形也将极为罕见。

我们当然不能期望这个高度简化的模型能够完全解释为什么动物个体间争斗不产生严重伤害的后果。

但是这个模型至少可以帮助我们理解为什么在自然界导致严重伤害的剧烈争斗非常罕见。

上面我们假定个体要么是纯粹的鹰对策者、要么是纯粹的鸽对策者。

或者说种群在遗传构成上是多态的。

ESS也可以用另一种方式来到达:

种群每个个体都以一定概率采取两种对策,而且在每次博弈中所采取的对策必须是随机确定的。

这时种群在遗传构成上是单态的,但表现型上是两种对策共存。

以表3.1赢得矩阵为例,ESS对策是以V/C的概率采取鹰对策,以〔1–V/C〕的概率采取鸽对策。

在对策论中,人们通常考虑遗传上单态的ESS,而往往忽略了遗传多态所带来的复杂性。

隐含在上面这个模型中的一个重要假设是无性生殖。

为了使问题简化,人们经常明确或暗含地假设无性〔孤雌〕生殖,或者真实遗传〔breedtrue〕,即通俗地说就是“龙生龙,凤生凤〞;

后代与亲代之间由于有性生殖过程而必然存在的遗传差异被忽略了。

因为我们面对的有机体绝大多数都是有性生殖的二倍体生物,所以这个假设只能理解为对非常复杂问题的一个初步探索。

MaynardSmith〔1982〕认为,忽略有性生殖多数情形下不会产生太大的影响。

值得注意的是,在ESS种群每个个体的期望赢得为

,而在纯鸽对策种群每个个体的期望赢得为V/2。

虽然纯鸽对策种群个体平均适合度大于ESS种群个体的平均适合度,但它是一个不稳定的种群,随时都有可能受到其它对策〔鹰对策〕的侵蚀。

人们普遍相信,自然选择所选择的最终结果应该是稳定的、不会受到任何其它对策侵蚀的ESS种群。

ESS,与最优化理论一样,都是只能从可供选择的对策集〔strategyset〕中选取“最正确〞的对策。

所以进化稳定对策也将受到可供选择的对策围所制约。

为了说明这一点,让我们在上面的鹰鸽对策的博弈中再增加一种对策,中庸对策。

中庸对策者表现的行为是:

当自己是资源〔例如一块领域〕占有者时表现为鹰,当自己是入侵者时表现为鸽;

并且假定中庸对策者表现为鹰〔资源占有者〕或鸽〔入侵者〕的概率相等。

赢得矩阵为表3.2。

当两个中庸相遇时,一个肯定是资源占有者并采取鹰对策,而另一个那么是入侵者并采取鸽对策。

表3.2鹰、鸽和中庸三种对策博弈时的赢得矩阵

中庸

V/2+(V-C)/4

V/4

(V-C)/4

3V/4

我们容易证明,当V<

C时,中庸对策是进化稳定的对策,并且是唯一的ESS。

所以ESS具体形式是什么依赖于有多少可供选择的对策。

同时,这个博弈与前面的鹰鸽博弈还有一个不同之处:

鹰鸽博弈是对称的,而表3.2的博弈是非对称的。

所谓对称是指争斗双方处于完全等同的地位:

它们可选择的对策集一样,它们的期望赢得也一样。

而在鹰-鸽-中庸博弈中,中庸对策者根据其对资源的拥有状况选取相应的对策,因而争斗双方在对策的选择上不是完全对等的。

后面我们还将回到这个博弈问题上来。

3.2对称的二人博弈

现在我们来考察对称的、二人进化博弈的一些一般性质。

假设有m个可能的对策,表示为1,2,…,m。

博弈〔争斗〕可以发生在任何一对随机选取的动物个体之间。

赢得矩阵{dij}为m×

m,其中dij表示采取对策i的动物与j对策者博弈时的赢得值〔适合度增加值〕。

系统动态可以用两种稍有不同的方式进展分析。

首先,我们假定一个个体总是采取一样的纯对策,并且这种特性被它所有后代所继承。

令ni为i对策者在某一时刻的个体数量,pi为它们的相对频率。

一个i对策者的适合度为

〔3.3〕

而种群的平均适合度为

〔3.4〕

各个对策的个体数量增加符合以下方程

〔3.5〕

因此,我们可以得到

〔3.6〕

当系统到达平衡时,即

,必然有

或者

因此在系统到达平衡态时,所有频率不为零的对策它们的适合度必然相等。

在频率依赖的选择下,各个类型的频率将受到调整以使它们的适合度正好相等。

我们还需要确定一个系统平衡态是否是局域稳定的;

数学上这可以通过解雅可比矩阵的特征根来判断。

模型〔3.6〕的一个稳定平衡态,

,称为进化稳定的状态〔evolutionarilystablestate〕;

代表平衡种群采用i对策的个体所占的比例。

这个模型的结果是导致产生各种纯对策的多态,也被称为“纯对策模型〞〔purestrategymodel;

Bulmer1994〕。

而另外一种在博弈论中更常见的途径是认为,个体可以采取混合对策,即是以一定概率采取各个纯对策。

例如,在前面介绍的鹰鸽博弈中,动物可能以50%的概率采取鹰对策,以50%的概率采取鸽对策。

然后,我们来寻找这样的混合对策〔或者纯对策〕,当它在种群被所有成员采纳时,任何其它对策都不能成功地侵入。

这样的一个对策就称为进化稳定对策,或者简称为ESS。

这种途径的一个优点是我们不必明确考虑系统平衡态的动态稳定性问题。

考虑混合对策p和q,它们分别以概率pi和qi采用纯对策i。

一个p对策者与q对策者博弈时其平均赢得值〔用

表示〕为

〔3.7〕

或者我们用矩阵形式表示,即

〔3.8〕

如果对策p是个ESS,那么当它的适合度必须大于突变对策q的适合度。

用x表示q在种群的频率,对策p和q的适合度分别为

〔3.9〕

p为ESS的条件是当x无限小时,对于所有的q≠p都有WP>

Wq;

因此,如果满足条件

〔3.10〕

那么p即为ESS;

如果

那么需要满足

〔3.11〕

p才是一个ESS。

〔3.10〕式是说,对策p是对自己的最好应答。

如果你知道你的对手将采取对策p,那么你别无选择只能也采取对策p,因为采取任何其它对策都不如采取对策p好。

换言之,这要求p是一个严格的Nash平衡〔Nash1951〕。

〔3.11〕式那么是说,如果q是另外一个同样好的对于p的应答,那么p对q的应答就必须比q对自己的应答更好。

这个条件保证了任何稀有突变,q-对策者,都不能侵入p-对策者组成的种群。

这时的p我们说是一个弱Nash平衡。

所有具有非零概率的纯对策组分就称为混合对策p的支集〔support〕。

支集中各个组分概率相加应该等于1。

对于ESS混合对策p来说,支集中任一纯对策k都有

〔3.12〕

我们使用反证法证明这个结果。

假设

定义一个新的q对策,它的支集除了纯对策k外所有其它组分均与p一样;

相应的概率为qi=pi/(1-pk),ik。

重新整理E(p,p)如下:

因此有E(p,p)<

E(q,p),与p为ESS的假设相矛盾。

这个结果是由Bishop&

Cannings(1978)最先给出的,在进化博弈论中被称为Bishop-Cannings定理。

如果对策不是离散的而是连续的,Bishop-Cannings定理可以很容易地推广到连续对策的情形,此处不再赘述。

下面我们分析几个具体的生物学应用实例。

3.3相互利他行为与囚犯的困境

 

表3.3一个简单的合作进化博弈

的赢得矩阵

欺骗

合作

b

-c

b-c

Trivers〔1971〕提出,遗传上没有亲缘关系的个体之间也可以进化产生利他行为。

这种相互利他行为的出现是因为利他付出代价很小而收益方得到的收获却很大;

这样如果个体之间能够相互回报,它们都可以从利他行为中获得较大适合度收益。

问题是,无论是进化上还是在人类社会里,怎样有效地防止欺骗对策侵入?

由于在一个个体的利他行为和受益者的回报行为之间存在着一定的时间间隔,所以有可能一个个体会采取这样对策:

今天它承受对方的帮助,但明天却拒绝给对方提供同样的帮助。

这种欺骗行为能够为自然选择所淘汰吗?

或者说,相互合作的利他行为能否抵抗住欺骗行为的侵蚀?

因为一个个体所采取对策是好还是坏依赖于对方所采取的对策是什么,所以这是频率依赖的选择,需要采用博弈论来分析。

下面我们考虑一个简单的博弈。

在一场博弈中,博弈双方〔A和B〕都面临着两个可能的抉择:

或者合作或者欺骗。

表3.3是这种博弈的赢得矩阵,它给出了博弈双方各种对策组合的赢得值。

这些赢得值代表的是适合度得分,即所得到的后代数。

采取合作行为的个体需要付出一定代价,可用c表示;

但合作的行为可以给受益者带来较大的收益,用b来表示;

这里我们假定收益大于代价。

如果双方都欺骗,那么即无代价也无收获;

如果双方合作,那么赢得值为收益减去代价,即b-c。

容易看出,在这个博弈中只有欺骗是ESS。

在ESS种群每个个体的赢得值都是0;

但是,如果个体都采取合作对策,那么对它们都是有利的。

这种类型的博弈使个体行为在进化上陷入了一种困境,说明自然选择可以在群体水平上产生消极影响。

在进化生物学中,这类‘合作对大家都有利但最终却都陷入欺骗泥潭’的问题通常被称为囚犯的困境〔prisoner’sdilemma〕。

这个名称的由来是因为最初的博弈模型是以两个合谋犯罪的囚犯为原型而构造的;

每个囚犯都可以揭露对方开脱自己〔欺骗〕,或者是守口如瓶〔合作〕使法官对谁都无法定罪。

如果一方检举而另一方守口如瓶,那么检举者将被无罪释放而由沉默一方承当所有的罪责。

尽管合作可以使两个囚犯都得以释放,但互相揭露并均受到惩罚才是必然的结果。

表3.3所示的博弈如果在两个个体之间只进展一次,那么欺骗行为是不可防止的;

但如果博弈可以反复进展屡次,那么个体可以根据过去相互作用的历史而采取更为复杂的对策,并使得个体合作有了可能。

Axelrod(1984)曾经组织了一次比赛;

他把来自世界各地博弈理论家所提出的62种不同行为对策在计算机进展了演算。

在比赛中,每个参赛对策都要与所有其它参赛对策相遇,并博弈200次,然后计算平均赢得值。

获胜者是一个非常简单的“一还一报〞〔titfortat〕对策:

第一轮相遇总是采取合作对策,以后再相遇时就采取对手上次相遇所使用的对策。

Axelrod总结了一还一报对策成功的原因;

善良,因为从不先欺骗;

宽容,对于对手的一次偶尔的欺骗行为只给予一次还击;

报复,不管什么时候只要对方表现出欺骗行为它就不再合作。

Axelrod与Hamilton〔1981〕一道共同探讨了一还一报对策在进化上的意义。

我们已经看到,如果博弈只进展一次,只有欺骗才是稳定的对策。

这个结论对于任何固定次数的博弈也同样成立,理由如下。

在最后一轮的博弈中,只有欺骗才是稳定的;

同样在次最后一轮也是如此,因为下一轮的对策是确定的。

如此反复直到第一轮;

每一轮博弈个体将都是采取欺骗对策。

然而,更加现实的假设不是让博弈次数恒定,而是两个博弈者以某一概率再次相遇。

这个博弈被叫做屡次重复的囚犯困境〔iteratedprisoner’sdilemma〕;

它已被广泛地用作为分析合作进化的模型〔Axelrod&

Dion1988〕。

因为可能的对策非常多,所以理论分析常常太复杂。

这里我们只限于三种对策情形:

永远欺骗〔AD〕,一还一报〔TFT〕,和永远合作〔AC〕。

表3.4屡次重复囚犯困境博弈的两个

对策的赢得矩阵

AD

TFT

(b-c)/(1-p)

首先考虑只有AD和TFT两个对策的情况。

TFT和自己博弈时的赢得值为

其它赢得值都很容易计算;

赢得矩阵如表3.4。

在这个博弈里,AD在任何时候都是ESS;

而且如果(b-c)/(1-p)>

b,或者pb>

c,TFT也是个ESS。

虽然一还一报对策一旦固定下来就会保持稳定,但是它最初如何能够打入一个完全由不合作的骗子所组成的种群呢?

要知道,骗子种群也是一个稳定的、可以抵抗其它对策侵蚀的种群。

Axelrod&

Hamilton〔1981〕认为有两种可能的解决方法:

〔1〕合作行为最初可能出现在有亲缘关系的个体之间〔亲缘选择〕,然后散布开也包括了无亲缘关系的个体;

自然选择将保存能够指示亲缘关系的一些特征。

这些特征之一就是合作行为的相互回报。

〔2〕具有合作倾向的TFT个体可能聚集在一起形成一个小圈子,然后再从这个小圈子向外散步;

但从不合作向相互利他转变显然是困难的。

表3.5屡次重复囚徒困境博弈在有三种对策时的赢得矩阵

AC

b/(1-p)

-c/(1-p)

现在我们引入第三个对策,永远合作〔AC〕。

赢得矩阵为表3.5。

注意,在TFT和AC博弈时二者将表现完全一样;

TFT对策的优越性只表现在它和AD博弈时。

如果pb>

c,TFT将是一个弱Nash平衡,但不是ESS。

在一个纯粹TFT对策的种群里,AC个体与TFT个体有一样的适合度,因而可通过漂变侵入TFT种群。

一旦AC在种群拥有一定比例,AD对策就可以侵入,因为AD可以靠剥削AC而走向繁荣。

TFT对策还有一个缺陷是它对一次偶然失误很敏感;

两个TFT博弈者之中任何一个如果因为失误欺骗了一次,他们今后将卷入到一个欺骗/合作交替系列当中,而不再是完全合作。

TFT对策的这些缺点促使人们努力寻找更强健的替代对策。

Nowak&

Sigmund〔1993〕说明巴甫洛夫对策比一还一报〔TFT〕对策更优越,因为巴甫洛夫对策能够改正偶尔的错误,同时还能剥削永远合作〔AC〕的对策者。

巴甫洛夫对策者采取的规那么是:

如果上次博弈是成功的〔赢得大于0〕就重复上次的对策;

如果上次博弈是不成功的〔赢得等于或小于0〕那么就采取和上次相反的对策。

因此,对于巴甫洛夫对策者,无论上次双方合作还是双方不合作,这次都采取合作;

只有上次一方合作而另一方欺骗时,被欺骗的一方才会采取欺骗行为。

相互回报式利他行为的一个很好的实例就是吸血蝠的反吐喂食现象〔Wilkinson1984〕。

许多吸血蝠夜晚觅食时吸不到血;

它们白天向其它个体乞食一些血液,这些昨晚吸饱了的个体常常反吐一些食物给饥饿的同伴。

很少一点食物可以大大提高受惠者存活的时机,而施与者受到很小的影响。

所以,相互回报利他的条件是满足的。

然而,反吐喂食行为只发生在近亲个体,以及经常同栖一地的个体之间。

很可能这个行为的出现是由亲属选择导致的;

“同栖一地〞被当做为“亲属〞的指示器。

既然这种反吐喂食行为已经散步开,它已成为相互回报式利他的一个稳定的例子,并且没有选择压力使个体使用比“同栖一地〞更可靠的指示器。

对于不是经常同栖一地的个体,反吐喂食行为的发生有两个障碍。

首先,它们再次相遇的概率很小,因此反吐喂食将不是稳定的ESS;

其次,非同栖一地的个体之间关系应处于一个不合作的ESS状态;

个体将很难从这个不合作的ESS中解放出来。

以上我们只考虑了离散对策问题。

但在自然界中,许多博弈对策问题不是一个“非此即彼〞的有限形式,而是在两个或多个极端中间有无限多的连续过渡。

下面让我们分析一个具体的连续对策的消耗战〔warofattrition〕模型〔MaynardSmith&

Price1973;

MaynardSmith1974〕。

3.4消耗战

消耗战模型考虑的情形与鹰鸽对策模型根本类似,但它不考虑使战斗升级并造成伤害的可能性。

两个个体可以说都是“鸽对策者〞,谁能取得胜利是由坚持的时间长短决定的。

如果谁比对手坚持时间长,那么谁就是胜利者。

坚持时间的长短〔对策〕是在争斗开场之前预决定好了的。

令V为胜利后得到的适合度收益;

c为消耗代价的速率参数:

对峙时间为t时,累计适合度代价为ct。

对于一个采取纯对策T的种群,平均赢得为

〔3.13〕

如果cT<

V/2,那么任何突变对策t>

T都将可以侵入种群,因为

〔3.14〕

这里需要注意的是,由于T对策者首先放弃了等待,所以t对策者的实际等待时间是T,代价为cT。

同样道理,如果cT≥V/2,那么t=0对策总可以侵入种群。

因此不存在纯对策的ESS。

假设有一个混合对策,I,它以概率p(t)采取坚持时间长度为t的对策。

如果I是一个ESS对策,那么任何一个纯对策t,即总是只坚持t时间,与I博弈都必须具有一样的赢得〔连续对策情形下的Bishop-Cannings定理〕。

因此,

=常数A〔3.15〕

上式中的第一个积分项为t胜利时的适合度赢得,第二个积分项为t失败时的适合度损

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 外语学习 > 法语学习

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1