演化博弈论和学习行为的小结
RD模型
EGT ESS概念
其他引申出的均衡、定理等 路径学习
学习模型
模仿 信念学习
1.RD模型
??s(x)[u(x)?u(x)]?F(s) s该模型的来源由Van Damme(1991)的基因复制动态过程的非代际交叠模型和Binmore(1992), Samue(1997)的基因复制动态过程的代际交叠模型分别得出。
2.ESS的概念
定义:①u(x,(1??)x??y)?u(y,(1??)x??y)
②(1??)u(x,x)??u(x,y)?(1??)u(y,x)??u(y,y) ③
u(x,x)?u(x,y)或者如果
u(x,x?)u(x,那y)么有
u(x,y)?u(y,y)
PS:NSS就是在ESS的定义中将大于号变为大于等于号。
3.其他引申出的一些均衡、均衡之间的关系以及一些定理
3.1
①EE:
是演化动态过程的任一渐进稳定不动点。其判定方法可以如下:
F(s)?0;dF(s)/ds?0。
②ES:
(对称二人博弈中)如果x是X的子集,且满足条件: a、
?x?中每个元素都是一个NSS
b、x?X?,u(x,x)?u(y,x)且u(x,y)?u(y,y),则有
y?X?。
③REE
对称策略(x,x)是REE充分必要条件是存在某个1),使如果
??(0,
,有
x??xx??B(R???x(?1?④EES
??(0,?) )x且
它是最小的非空子集使x??X是EES的充分必要条件是,
得:
a、 X是nash均衡的子集 b、
??(0,1),如果??(0?,,)x?x?,
x??x且x??BR(?x??(1??)x),那么
?
?x?(1??)x?x3.2上述解的均衡的关系如下:
ESS?REE?NE
ESS?EE?NE?FP其中,FP是F(s)?0的点 3.3均衡之间的定理:
①x?是对称nash均衡,那么,x?是RD的一个稳定状态 ②x?是RD的一个渐进稳定状态,那么,x?是NE,x?是SPE(子博弈完美均衡)
③x?是一个ESS,那么,x?是相应的双边对称博弈的一个PTHE(完美颤抖手均衡), x?是PE(适应性均衡)。 ④x?是ESS,那么,x?是RD的一个渐进稳定状态
4.学习模型
4.1 路径学习(routine learning)
指的是参与人根据他们最近关于成功或失败的经验来调整他们选择概率的过程。路径学习并不要求经验丰富的行为,参与人只是关注自身的选择与支付,不考虑其他人的选择与支付, 4.2 模仿(imitation)
与路径学习的区别是,模仿学习是其他人的成功影响着参与人
的选择的概率。
参与人i在t+1阶段更新他的概率的计算如下:
pti?1(x)?pti(x)??ut?(xt)pti(x),如果x?xt pti?1(x)?pti(x)??ut?(xt)pti(x),如果x?xt 4.3信念学习(belief learning)
信念学习中最常见的例子是古诺调整模型和虚拟博弈。这部分掌握还不是很好。
上述符号的简写意义如下: EGT:演化博弈论 RD:复制动态方程 ESS:演化稳定策略 EE:演化均衡 NSS:中性稳定策略 ES:演化稳态
REE:面临均衡进入者的稳健性 EES:均衡演化稳定集 SPE:子博弈完美均衡 PTHE:完美颤抖手均衡 PE:适当均衡 FP:动态过程的不动点
相关推荐: