第一范文网 - 专业文章范例文档资料分享平台

进化稳定对策

来源:用户分享 时间:2025/8/13 7:24:53 本文由loading 分享 下载这篇文档手机版
说明:文章内容仅供预览,部分内容可能不全,需要完整文档或者需要复制内容,请下载word后使用。下载word有问题请添加微信号:xxxxxxx或QQ:xxxxxx 处理(尽可能给您提供完整文档),感谢您的支持与谅解。

第3章 进化稳定对策

3.4 消耗战

消耗战模型考虑的情形与鹰鸽对策模型基本类似,但它不考虑使战斗升级并造成伤害的可能性。两个个体可以说都是“鸽对策者”,谁能取得胜利是由坚持的时间长短决定的。如果谁比对手坚持时间长,那么谁就是胜利者。坚持时间的长短(对策)是在争斗开始之前预决定好了的。令V为胜利后得到的适合度收益;c为消耗代价的速率参数:对峙时间为t时,累计适合度代价为ct。对于一个采取纯对策T的种群,平均赢得为

E(T,T)?V?cT 2 (3.13)

如果cTT都将可以侵入种群,因为

E(t,T)?V?cT?E(T,T)

(3.14)

这里需要注意的是,由于T对策者首先放弃了等待,所以t对策者的实际等待时间是T,代价为cT。同样道理,如果cT≥V/2,那么t=0对策总可以侵入种群。因此不存在纯对策的ESS。 假设有一个混合对策,I,它以概率p(t)采取坚持时间长度为t的对策。如果I是一个ESS对策,那么任何一个纯对策t?,即总是只坚持t?时间,与I博弈都必须具有相同的赢得(连续对策情形下的Bishop-Cannings定理)。因此,

E(t',I)??(V?ct)p(t)dt??ct'p(t)dt?E(I,I)=常数A

0t't'?(3.15)

上式中的第一个积分项为t?胜利时的适合度赢得,第二个积分项为t?失败时的适合度损失。对它求导数我们有

dE(t',T)dA??0

dt'dt'根据定义我们知道p(t)dt?1,所以最终我们可以解出

0??p(t)?c?ct?exp??? V?V? (3.16)

现在我们知道,ESS必须根据这个负指数概率分布来确定坚持时间。为了确定负指数分布

真正是一个ESS,我们还须证明对于所有的J,当E(J,I)=E(I,I)时有E(I,J)>E(J,J),即满足条件(3.11)的要求。对于J是纯对策的情形可以很容易地证明;Bishop & Cannings (1978)对于J为混合对策的情形也给出了一个严格的证明。 Parker (1970a,b;1984) 对于牛粪堆上雄蝇为等待雌蝇到来交配所花费的时间问题开展了深入研究工作。Parker表明,随着时间推移雄蝇陆续离开,等待时间确实服从负指数分布,与上面消耗战理论预测的结果是一致的。但目前还不清楚,这种负指数分布是由于不同个体所等待的时间不同(遗传多态)还是由于每个个体都是混合对策者(即每个个体等待时间都是可变的)。而且有一点需要特别注意:消耗战理论是根据二人博弈建立的,而Parker研究的例子却是一个多人博弈问题,即一个雄蝇不是只与另一个雄蝇进行成对的对

63

张大勇

抗(pairwise contest),而是同时与许多其它雄蝇进行多人集体博弈(playing the field;Maynard Smith 1982)。目前理论上还未严格证明等待时间为负指数分布在多人博弈时仍然成立。Parker还记录了每一只雄蝇所获得的交配机会,发现采取不同等待时间的雄蝇大体上都获得了相同的交配机会。这也与消耗战理论的预测相一致。

3.5 非对称博弈

以上我们主要分析了对称博弈问题,即两个博弈者是完全相同的:它们的回报相同;获胜几率至少就它们所知是相同的;而且也没有任何其它线索可以用来帮助决定采取何种对策。因此,任何一个可行解都必然是对称Nash平衡,其中两个博弈者都使用相同的对策,即是说平衡的对策必须是对自己为最佳的应答。然而真实世界中大多数成对的动物争斗都是非对称的,即是说争斗者之间在角色上有所不同:它们可能是一个雄性个体、一个雌性个体;一个较大、另一个较小的雄体;一个领域占有者、一个入侵者,等等。两个博弈者角色的不同可能会影响争斗的结果或者各自的赢得。既使不影响赢得,在博弈开始时博弈者就知道的角色差异常常被用来作为决定采取何种对策的基础,导致出现非对称的Nash平衡。例如,在鹰-鸽-中庸对策中(表3.2),中庸对策者在作为资源占有者时总是鹰对策者,在作为入侵者时则总是鸽对策者。 为了利用上面介绍的对称博弈方法来分析非对称博弈问题,我们可以通过引入条件对策的思想而把非对称博弈对称化。考虑两个角色不同的个体,A和B(如占有者/入侵者;雄体/雌体;大个体/小个体等)。我们假定两个博弈者都知道它们各自的以及对方的角色。再假定A有m个可供挑选的对策;B有n个可供挑选的对策;这些对策可能相同也可能不同。我们用EA(i,j)表示角色为A的个体在A采取对策i而对方采取对策j时的赢得值;“在角色A和角色EB(i,j)则为B的赢得值。现在我们引入总数为mn个的条件对策,i/j:

B个体的争斗中,如果我是A采取对策i;如果我是B采取对策j。”在对策i/j的个体与对策k/l的个体博弈中,i/j个体有相同的可能性来扮演角色A或角色B;因此,它的赢得值为

1 (3.17) E(i/j,k/l)?12EA(i,l)?2EB(k,j) 这个式子定义了一个mn维的赢得矩阵。对于这个博弈,我们可以采取和上面相同的对称

二人博弈方法来加以分析。 上述的非对称博弈是一个完全信息博弈;博弈双方都知道自己在博弈中的利益和代价所在。完全信息非对称博弈模型的一个普遍性质为,ESS肯定是纯对策(Selten 1980)。利用这个结果,我们能够很容易地鉴别哪些纯对策是ESS。我们只需比较对称化的赢得矩阵内对角线上的项是否比其它同列项大即可。下面我们分析一个具体实例。 考虑一个资源占有者和一个入侵者之间的争斗。一个个体可以根据它是占有者还是入侵者来选择是鹰还是鸽。因此这是一个非对称博弈问题,并且共有四种条件对策:鹰/鹰(H/H);鹰/鸽(H/D);鸽/鹰(D/H);鸽/鸽(D/D)。H/H表示当个体无论是占有者还是入侵者时都是鹰;H/D则表示,当个体是占有者时表现为鹰,是入侵者时表现为鸽;余者类推。表3.2所分析的博弈没有包括D/H,即反中庸的可能性。赢得矩阵可以表示为表3.6。当V>C时,H/H是唯一的ESS;而当V

64

第3章 进化稳定对策

中庸对策(H/D)的特点是靠尊重所有权决定战斗的胜负;一个可能的例子是Davies

(1978)对黄斑眼蝶

(Pararge aegeria)争夺领

表3.6 具有占有/入侵不对称性的鹰鸽博弈的对称化赢得矩阵

域的研究。黄斑眼蝶的雄体

H/H H/D D/H D/D 试图保卫林内地面上的光

斑,这将使它获得交配机H/H (V-C)/2 (3V-C)/4 (3V-C)/4 V 会。当两个雄蝶在一块光斑

H/D (V-C)/4 V/2 (2V-C)/4 3V/4 上相遇时,它们盘旋飞上林冠层进行争斗,但光斑占有D/H (V-C)/4 (2V-C)/4 V/2 3V/4 者总能获胜并回到光斑内。

D/D 0 V/4 V/4 V/2 反中庸对策(D/H)在V

时同样也是ESS,Burgess(1976)所研究的墨西哥群居蜘蛛(Oecobius civitas)可能提供了一个实例。

3.6 具有连续对策的多人博弈

到目前为止我们只考虑了二人博弈问题。但在许多情形下,个体之间的斗争不是成对进行的,而是多人集体的争斗。事实上,多人集体博弈可能更普遍。所以,我们有必要对多人博弈问题进行详细分析。因为多人博弈问题往往表现为连续对策的形式,所以下面的数学分析也将只考虑连续对策的多人博弈。令W(A,B)表示在B-对策者组成的种群内一个A-对策者的适合度。我们说I是一个ESS,如果对于所有的J?I都满足下列条件(参见Maynard Smith 1982):

W(J,I)?W(I,I)或者当W(J,I)?W(I,I)时,

对于很小的qW(J,Pq,J,I)?W(I,Pq,J,I)或者 (3.18)

其中W(J,Pq,J,I)表示在J占比例为q,I占比例为(1-q)的种群里J对策者的适合度。条件(3.18)是说,对于弱Nash平衡,即W(J,I)=W(I,I),一旦J在种群内占有不可忽视的比例时其适合度必须小于I的适合度。条件(3.18)保证了I-对策者种群不会被任何突变对策所侵蚀。 考虑一个非常简单的对捕食者保持警戒的模型(Parker & Hammerstein 1985)。鸟类一起群居觅食;群的大小为n。每个鸟都花一定时间用于警戒,提防捕食者;其它剩余时间则用于觅食。假设捕食者每天只攻击一次,而且如果当时没有一只鸟正在警戒,每次攻击都捕杀一个个体;如果至少有一只鸟正处于警戒状态,那么全群所有鸟都会逃脱攻击。警戒的代价是觅食时间减少。我们假定一个把所有时间中v部分用于警戒的个体,如果它逃过了捕食者攻击,其适合度为1-v2。如果i个体花在警戒上的时间比例为vi,那么每个体受到捕食者攻击的几率为

65

张大勇

(1?v1)(1?v2)?(1?vn)/n

(3.19)

前面的括号项乘在一起就是所有个体都没有警戒,捕食者能成功的概率;除以n表示平均一个个体受到猎食的概率,因为每次捕食者攻击都只猎杀一个个体。鸟群内第i个体的赢得值可以写为

W?[1?(1?v1)(1?v2)?(1?vn)/n](1?vi2)

(3.20)

即存活概率乘以觅食带来的适合度。 现在我们可以求出进化稳定的警戒时间。如果v*是进化稳定的,那么当种群所有成员都采取v*-对策时,任何突变的对策者,u,都不能侵入该种群。我们知道,突变对策者肯定是和其它n-1个v*-对策者组成一个群。所以根据(3.20)式,这时突变对策者的适合度为

W(u,v*)?[1?(1?u)(1?v*)n?1/n](1?u2)

(3.21)

根据ESS定义,对任何u?v*都必须有W(u,v*)?W(v*,v*);这也就意味着W(u,v*),作为u的函数,应在u=v*处达到极大值;或者

?W(u,v*)?0

?uu?v* (3.22)

?2W(u,v*)?0 2?uu?v* (3.23)

(3.23)式是保证(3.22)式求得的极值是极大值而不是极小值。上面两式合在一起保证

了v*是Nash平衡。如果(3.23)式的不等式严格成立,即

?2W(u,v*)?0

?u2u?v* (3.24)

那么v*是一个严格的Nash平衡。 对于给定的n值,我们可以容易解出v*,并且它满足条件(3.24),因而必然是ESS。可以证明,v*随着群的大小增加而减小,即?v*?n?0。有两个因素对出现这种结果有贡献;一是群内每个个体受到捕食者攻击的可能性被“稀释”,即Hamilton(1971)自私的兽群效应(selfish-herd effect);另一个是每个个体都可以从其它个体的警戒行为中得到益处。 尽管对于大多数的连续多人博弈的ESS,条件(3.24)都会满足,但也有二阶导数等于零的情形(参见4.3.1)。这时我们需要判断,当突变对策在种群内占有一定、不能忽视的比例时,这种突变对策能否被自然选择所淘汰。除了直接地验证外,还有一个稍微较弱的判别方法。 对于连续对策模型,我们可以采用一个新的稳定性概念。假设种群对策v稍微地偏离了最佳值v*;如果v*种群是稳定的,那么在v种群内出现的突变者(u),当它是朝着v*方向变化时将受到正选择;当它是背离v*的方向时将受到负选择(淘汰)。这种类型的稳定性被称为连续稳定性(continuous stability; Eshel 1983)。可以证明,v*是连续稳定的如果

66

搜索更多关于: 进化稳定对策 的文档
进化稳定对策.doc 将本文的Word文档下载到电脑,方便复制、编辑、收藏和打印
本文链接:https://www.diyifanwen.net/c6rc0d7d7t35dq8n1sb84_3.html(转载请注明文章来源)
热门推荐
Copyright © 2012-2023 第一范文网 版权所有 免责声明 | 联系我们
声明 :本网站尊重并保护知识产权,根据《信息网络传播权保护条例》,如果我们转载的作品侵犯了您的权利,请在一个月内通知我们,我们会及时删除。
客服QQ:xxxxxx 邮箱:xxxxxx@qq.com
渝ICP备2023013149号
Top