策略博弈习题部分解答

来源：用户分享时间：2025/6/1 12:37:24 本文由

说明：文章内容仅供预览，部分内容可能不全，需要完整文档或者需要复制内容，请下载word后使用。下载word有问题请添加微信号:xxxxxxx或QQ：xxxxxx 处理（尽可能给您提供完整文档），感谢您的支持与谅解。

但是这个博弈的平衡点式国会选择“预算赤字”而联邦储备银行选择“高利率”；并不是对国会的最好结果，这是因为当国会选择“预算赤字”这个最优策略的时候，联邦储备银行可以预见到它的这一选择，从而选择“高利率”。

2. (a) 行上下列左右 1 4 2 3 Max=2 Max=3 Min=1 Min=2 （2,2）根据占优策略原则，对于“列“，“左”是占优策略，而当“列”选择“左”的时候，行会选择“下”，纳什平衡点是（Max，Min）=（2,2）。根据最大最小值也可以验证，如上面的表格。（b）行上下列左 1 4 Max=4 右 2 Min=1 3 Min=3 Max=3 （3,3）根据占优策略原则，对于“行”，占优策略是“下”，而当“行”选择“下”的时候，列会选择“右”，所以纳什平衡点是（Max，Min）=（3,3）。根据最大最小值也可以验证，如上面的表格。（c）行上直下列左 5 6 1 Max=6 右 1 Min=1 1 Min=1 0 Min=0 Max=1 （1,1）中 3 2 0 Max=3 根据最大最小值方法，这个博弈有两个纳什平衡点。如上图所示。 3,

（a）行上下列左右 2,4 1,0 6,5 4,2 “行”的占优策略是选择“下”，当“行”选择“下”的时候，“列”会选择“左”来得到更多的支付，纳什平衡点是（6,5）（b）行上下列左 1,1 1,0 右 0,1 1,1 “行”的占优策略是选择“下”，当“行”选择“下”的时候，“列”会选择“右”来得到更多的支付，纳什平衡点是右下方的（1,1）；同样“列”的占优策略是选择“右”，当“列”选择“右”的时候，“行”会选择“下”来得到更多的支付，纳什平衡点是右下方的（1,1）（c）行上直下列左 0,1 5,9 7,5 中 9,0 7,3 10,10 右 2,3 1,7 3,5 对于“行”，最优策略是“下”，当“行”选择“下”的时候，“列”会选择“中”来获得最大的支付。(10,10)为纳什平衡点，表格中红色的部分表示被划掉过。或者用逐格检查的方法也可以实现。（d）行北上下列西 2,3 3,0 5,4 中 8,2 4,5 6,1 东 10,6 6,4 2,5

南 4,5 2,3 5,2 此题采用逐格检查法，（10,6）为纳什平衡点。 5 行上水平下列左 1,2 0,5 -1,1 中 2,1 1,2 3，0 右 1,0 7,4 3,2 此题采用逐格检查法，（1,2）为纳什均衡点。

寻找过程，对于“列”在每一行中划掉对“列”来说支付最小的两个策略组合，对于“行”在每一列中划掉对“行”来说支付最小的两个策略。最后看哪个策略组合没有被划掉过，就是纳什平衡点。

因为支付最大的组合并不一定是纳什均衡点所在的地方，这个博弈中(1,2)是平衡点，但是这个平衡点对应的不是支付最大的点，所以要使用参与人的策略而不知识均衡时的支付来描述均衡。

．表格如图所示：红色的字和数字对应所获利益，此处默认快乐和时间的单位相同且有等价值。

帮助不帮帮助 2,2 2,3 不帮 3,2 0,0 此时没有nash均衡点，A帮助时B会选择不帮，而A不帮时B会帮助。但是由于同时决策，所以没有均衡点。

A 不买时：其中按A,B,C排列 B C 0元票 15元票 30元票 0元票 0,0,0 0,0,15 0,0,0 15元票 0,15,0 0,0,0 0,-15,0 30元票 0,0,0， 0,0,-15 0,-15,-15

A买 15元票时： B C 0元票 15元票 30元票 0元票 15,0,0 0,0,0 -15,0,0

15元票 0,0,0 -5，-5，-5 -15，-15，0 30元票 -15,0,0 -15,0，-15 -15，-15，-15 A买30元票时： B C 0元票 15元票 30元票 0元票 0,0,0 0,0,-15 -15,0,-15 15元票 0,-15,0 0，-15，-15 -15，-15，-15 30元票 -15,-15,0 -15,-15，-15 -20，-20，-20 其中经过简单的连续删除分析（由于其实两人对称），可知其中的考虑B，C两人时的均衡点为红字所示！而对于A来说没有重合的，所以没有nash均衡点。

第五章第2题

Qx=44?2Px+Py;

Qy=44?2Py+Px.

泽维尔每周的利润：Bx=(Px?8)Qx=(Px?8)(44?2Px+Py) 为使Bx最大，可让Bx对Px求导数，使得导数值为0；即：

dBx=(44?2Px+Py)?2(Px?8)=Py?4Px+60=0 dPxPy?4Px+60=0为泽维尔的最优反应规则。

伊冯娜每周的利润：By?(Py?6)Qy?(Py?6)(44?2Py?Px) 为使By最大，可让By对Py求导数，使得导数值为0；即：

dBy?(44?2Py?Px)?2(Py?6)?0； dPy56?4Py?Px?0；

这就是伊冯娜的最优反应规则。

搜索更多关于：策略博弈习题部分解答的文档

策略博弈习题部分解答.doc 将本文的Word文档下载到电脑，方便复制、编辑、收藏和打印

下载这篇word文档

本文链接：https://www.diyifanwen.net/c6wzx76456y8wrp7230mk0mq5e7eb5x017va_3.html（转载请注明文章来源）