第一范文网 - 专业文章范例文档资料分享平台

策略博弈习题部分解答

来源:用户分享 时间:2025/6/1 12:37:24 本文由loading 分享 下载这篇文档手机版
说明:文章内容仅供预览,部分内容可能不全,需要完整文档或者需要复制内容,请下载word后使用。下载word有问题请添加微信号:xxxxxxx或QQ:xxxxxx 处理(尽可能给您提供完整文档),感谢您的支持与谅解。

但是这个博弈的平衡点式国会选择“预算赤字”而联邦储备银行选择“高利率”;并不是对国会的最好结果,这是因为当国会选择“预算赤字”这个最优策略的时候,联邦储备银行可以预见到它的这一选择,从而选择“高利率”。

2. (a) 行 上 下 列 左 右 1 4 2 3 Max=2 Max=3 Min=1 Min=2 (2,2) 根据占优策略原则,对于“列“,“左”是占优策略,而当“列”选择“左”的时候,行会选择“下”,纳什平衡点是(Max,Min)=(2,2)。根据最大最小值也可以验证,如上面的表格。 (b) 行 上 下 列 左 1 4 Max=4 右 2 Min=1 3 Min=3 Max=3 (3,3) 根据占优策略原则,对于“行”,占优策略是“下”,而当“行”选择“下”的时候,列会选择“右”,所以纳什平衡点是(Max,Min)=(3,3)。根据最大最小值也可以验证,如上面的表格。 (c) 行 上 直 下 列 左 5 6 1 Max=6 右 1 Min=1 1 Min=1 0 Min=0 Max=1 (1,1) 中 3 2 0 Max=3 根据最大最小值方法,这个博弈有两个纳什平衡点。如上图所示。 3,

(a) 行 上 下 列 左 右 2,4 1,0 6,5 4,2 “行”的占优策略是选择“下”,当“行”选择“下”的时候,“列”会选择“左”来得到更多的支付,纳什平衡点是(6,5) (b) 行 上 下 列 左 1,1 1,0 右 0,1 1,1 “行”的占优策略是选择“下”,当“行”选择“下”的时候,“列”会选择“右”来得到更多的支付,纳什平衡点是右下方的(1,1);同样“列”的占优策略是选择“右”,当“列”选择“右”的时候,“行”会选择“下”来得到更多的支付,纳什平衡点是右下方的(1,1) (c) 行 上 直 下 列 左 0,1 5,9 7,5 中 9,0 7,3 10,10 右 2,3 1,7 3,5 对于“行”,最优策略是“下”,当“行”选择“下”的时候,“列”会选择“中”来获得最大的支付。(10,10)为纳什平衡点,表格中红色的部分表示被划掉过。 或者用逐格检查的方法也可以实现。 (d) 行 北 上 下 列 西 2,3 3,0 5,4 中 8,2 4,5 6,1 东 10,6 6,4 2,5

南 4,5 2,3 5,2 此题采用逐格检查法,(10,6)为纳什平衡点。 5 行 上 水平 下 列 左 1,2 0,5 -1,1 中 2,1 1,2 3,0 右 1,0 7,4 3,2 此题采用逐格检查法,(1,2)为纳什均衡点。

寻找过程,对于“列”在每一行中划掉对“列”来说支付最小的 两个策略组合,对于“行”在每一列中划掉对“行”来说支付最小的两个策略。最后看哪个策略组合没有被划掉过,就是纳什平衡点。

因为支付最大的组合并不一定是纳什均衡点所在的地方,这个博弈中(1,2)是平衡点,但是这个平衡点对应的不是支付最大的点,所以要使用参与人的策略而不知识均衡时的支付来描述均衡。

.表格如图所示:红色的字和数字对应所获利益,此处默认快乐和时间的单位相同且有等价值。

帮助 不帮 帮助 2,2 2,3 不帮 3,2 0,0 此时没有nash均衡点,A帮助时B会选择不帮,而A不帮时B会帮助。但是由于同时决策,所以没有均衡点。

A 不买时:其中按A,B,C排列 B C 0元票 15元票 30元票 0元票 0,0,0 0,0,15 0,0,0 15元票 0,15,0 0,0,0 0,-15,0 30元票 0,0,0, 0,0,-15 0,-15,-15

A买 15元票时: B C 0元票 15元票 30元票 0元票 15,0,0 0,0,0 -15,0,0

15元票 0,0,0 -5,-5,-5 -15,-15,0 30元票 -15,0,0 -15,0,-15 -15,-15,-15 A买30元票时: B C 0元票 15元票 30元票 0元票 0,0,0 0,0,-15 -15,0,-15 15元票 0,-15,0 0,-15,-15 -15,-15,-15 30元票 -15,-15,0 -15,-15,-15 -20,-20,-20 其中经过简单的连续删除分析(由于其实两人对称),可知其中的考虑B,C两人时的均衡点为红字所示!而对于A来说没有重合的,所以没有nash均衡点。

第五章第2题

Qx=44?2Px+Py;

Qy=44?2Py+Px.

泽维尔每周的利润:Bx=(Px?8)Qx=(Px?8)(44?2Px+Py) 为使Bx最大,可让Bx对Px求导数,使得导数值为0; 即:

dBx=(44?2Px+Py)?2(Px?8)=Py?4Px+60=0 dPxPy?4Px+60=0为泽维尔的最优反应规则。

伊冯娜每周的利润:By?(Py?6)Qy?(Py?6)(44?2Py?Px) 为使By最大,可让By对Py求导数,使得导数值为0; 即:

dBy?(44?2Py?Px)?2(Py?6)?0; dPy56?4Py?Px?0;

这就是伊冯娜的最优反应规则。

搜索更多关于: 策略博弈习题部分解答 的文档
策略博弈习题部分解答.doc 将本文的Word文档下载到电脑,方便复制、编辑、收藏和打印
本文链接:https://www.diyifanwen.net/c6wzx76456y8wrp7230mk0mq5e7eb5x017va_3.html(转载请注明文章来源)
热门推荐
Copyright © 2012-2023 第一范文网 版权所有 免责声明 | 联系我们
声明 :本网站尊重并保护知识产权,根据《信息网络传播权保护条例》,如果我们转载的作品侵犯了您的权利,请在一个月内通知我们,我们会及时删除。
客服QQ:xxxxxx 邮箱:xxxxxx@qq.com
渝ICP备2023013149号
Top