上海商学院---博弈论习题参考答案Part.Ⅰ

佚名 · 0743

答案，参考

文件大小134.52 KB

文件格式docx

分享时间2025-05-01

更多此类文档

立即下载

还剩7页未读，继续阅读

文本内容:

《博弈论》习题参考答案Part.I

一、选择题l.B

2.C

3.A

4.A

5.B

6.ABCD

7.C

8.B

9.C

二、判断正误并说明理由

1.F上策均衡是比纳什均衡更严格的均衡概论

2.T上策均衡是比纳什均衡更严格的均衡概论

3.T博弈类型按局中人数多少分为单人博弈、双人博弈和多人博弈

4.F博弈双方偏好存在差异的条件下，一个博弈模型中可能存在2个纳什均衡,如性别战

5.T零和博弈指参与博弈各方在严格竞争下，一方收益等于另一方损失，博弈各方收益与损失之和恒为零，所以双方不存在合作可能性

6.T上策均衡是通过严格下策消去法重复剔除下策所得到的占优策略，只能有一个纳什均衡

7.F纳什均衡是上策的集合，指在给定的别人策略情况下，博弈方总是选择利益相对较大的策略，并不保证结果是最好的

8.F局中人总是以自己的利益最大化选择自己的策略，并不以对方收益的变化为目标

9.T纳什均衡是上策的集合，指在给定的别人策略情况下，没有人会改变自己的策略而减低自己的收益

10.F局中人总是以自己的利益最大化选择自己的策略，并不以对方收益的变化为目标H.F局中人总是以自己的利益最大化选择自己的策略，并不以对方收益的变化为目标

12.T虽然斯塔格伯格模型各方利润总和小于古诺模型，但是领导者的利润比古诺模型时高

三、计算与分析题

1、

（1）画出A、B两企业的损益矩阵B企业做广告不做广告做广告20,825,2A企业不做广告10,1230,6

（2）求纯策略纳什均衡（做广告，做广告）

2、画出两企业的损益矩阵求纳什均衡

（1）画出A、B两企业的损益矩阵百事可乐原价涨价原价10,W100,-30可口可乐-20,30140,35涨价

（2）求纳什均衡两个（原价，原价），（涨价，涨价）

3、假定某博弈的报酬矩阵如下甲上下a,b c,d

（1）如果（上，左）是上策均衡，g,h那么，a,b,g,f0,f答ae,bd,fh,gc

（2）如果（上，左）是纳什均衡，上述哪几个不等式必须满足答ae,bd

4、答

（1）将这一市场用囚徒困境的博弈加以表示北方航空公司合作竞争合作500000,5000000,900000新华航空公司900000,060000,60000竞争

（2）解释为什么均衡结果可能是两家公司都选择竞争性策略答若新华选择“竞争”，则北方也会选择“竞争”（60000〉）；若新华选择“合作”，北方仍会选择“竞争”

（900000500000）若北方选择“竞争”，新华也将选择“竞争”

（600000）；若北方选择“合作”,新华仍会选择“竞争”（900000〉）由于“竞争”为双方的占优策略，故均衡结果为两家公司都选择竞争性策略

5、博弈的收益矩阵如下表然满足哪些关系？答从占优策略均衡的定义出发对甲而言，策略“上”（a,c）优于策略“下（e,g）；对乙而言，策略“左”（b,f）优于策略“右”（d,h）所以结论是ae,bd,fh,cg

（2）如果（上，左）是纳什均衡，则

（1）中的关系式哪些必须满足？答纳什均衡只需满足ae,bd,

（3）如果（上，左）是上策均衡，那么它是否必定是纳什均衡？为什么？答占优策略均衡一定是纳什均衡，因为占优策略均衡的条件包含了纳什均衡的条件

（4）在什么情况下，纯策略纳什均衡不存在？答当对每一方来说，任意一种策略组合都不满足纳什均衡时，纯战略纳什均衡就不存在

7、求纳什均衡小猪按等按5,14,4大猪等9,-10,0纳什均衡为大猪“按”，小猪“等”，即（按，等）

6、

（1）有哪些结果是纳什均衡？答（低价，低价），（高价，高价）

（2）两厂商合作的结果是什么？答（高价，高价）

8、用反应函数法结合划线法，求出下列博弈的所有纯策略纳什均衡参与人2甲乙丙丁2,33,23,40,34,45,20,11,23,14,11,410,23,14,1-1,210,1参与人1的反应函数:R1

（2）=B,若2选择甲=B，若2选择乙=A，若2选择丙=或口,若2选择丁参与人2的反应函数R2

（1）=丙，若2选择A=甲，若2选择B=丙，若2选择C=丙，若2选择D求共集，得纯策略纳什均衡为（B,甲）与（A,丙）

9、求出下面博弈的纳什均衡（含纯策略和混合策略）甲UD LR5,00,8解1纯策略Nash均衡由划线法可知，该矩阵博弈没有纯策略Nash均衡2,64,52混合策略Nash均衡设甲选择“U”的概率为P1,则选择“D”的概率为1-P1乙选择“L”的概率为P2,则选择“R”的概率为1-P2对甲而言，最佳策略是按一定的概率选“U”和“D”，使乙选择“L”和“R”的期望值相等即P1*0+1-P1*6=P1*8+1-P1*5解得P1=1/9即1/9,8/9按1/9概率选“U”、8/9概率选“D”为甲的混合策略Nash均衡对乙而言，最佳策略是按一定的概率选“L”和“R”，使乙选择“U”和“D”的期望值相等即P2*5+1-P2*0=P2*2+1-P2*4解得P2=4/7即4/7,3/7按4/7概率选“L”、3/7概率选“R”为乙的混合策略Nash均衡

10、根据两人博弈的损益矩阵回答问题乙左右甲上下2,30,01写出两人各自的全部策略0,04,2答全部策略上，左，上，右，下，左，下，右2找出该博弈的全部纯策略纳什均衡答由划线法可知，该矩阵博弈全部纯策略Nash均衡为上，左和下，右两个3求出该博弈的混合策略纳什均衡解设甲选择“上”的概率为P1,则选择“下”的概率为1-P1乙选择“左”的概率为P2,则选择“右”的概率为1-P2对甲而言，最佳策略是按一定的概率选“上”和“下”，使乙选择“左”和“右”的期望值相等即P1*3+1-P1*0=P1*0+1-P1*2解得P1=2/5即2/5,3/5按2/5概率选“上”、3/5概率选“下”为甲的混合策略Nash均衡对乙而言，最佳策略是按一定的概率选“左”和“右”，使乙选择“上”和“下”的期望值相等即P2*2+1-P2*0=P2*0+1-P2*4解得P2=2/3即2/3,1/3按2/3概率选“左”、1/3概率选“右”为乙的混合策略Nash均衡

11、某寡头垄断市场上有两个厂商，总成本均为自身产量的20倍，市场需求函数为Q=200-P求1若两个厂商同时决定产量，产量分别是多少？2若两个厂商达成协议垄断市场,共同安排产量，则各自的利润情况如何？3用该案例解释囚徒困境答⑴由已知条件Q=200-P,P=200-QTCl=20ql,TC2=20q2ql+q2=Q可得

1.2厂商的利润函数分别为Kl=Pql-TCl=200-ql+q2ql-20ql=180ql-ql2-qlq2K2=Pq2-TC2=200-ql+q2q2-20q2=180q2-q22-q1q2令dK/dql=0得厂商1的反应函数为180-2Ql-Q2=0,令dK/dq2=0得厂商2的反应函数为180-Ql-2Q2=0,联解可得ql=q2=60Kl=K2=36002由已知条件Q=200-P,P=200-QTC=TCl+TC2=20ql+20q2=20Q可得1,2厂商的总利润函数为K=PQ-TC=200-QQ-20Q=180Q-Q2令dK/dQ=O得Q=90,ql=q2=45K=PQ-TC=200-QQ-20Q=180Q-Q2=8100Kl=K2=40503将ql=45,q2=60和ql=60,q2=45分别代入1,2厂商的利润函数可得1,2厂商的利润为KI ql=45,q2=60=Pql-TCl=200-ql+q2ql-20ql=180ql-ql2-qlq2=3375KI ql=60,q2=45=Pql-TCl=200-ql+q2ql-20ql=180ql-ql2-qlq2=4500K2ql=45,q2=60=Pq2-TC2=200-ql+q2q2-20q2=180q2-q22-qlq2=4500KI ql=60,q2=45=Pql-TCl=200-ql+q2ql-20ql=180ql-ql2-qlq2=3375厂商2合作（q2=45）不合作（q2=60）合作ql=454050,40503375,4500厂商1不合作（ql=60）4500,33753600,3600根据划线法，可得厂商L2的上策是（不合作，不合作）即（3600,3600）双方利润均低于（合作，合作）（4050,4050）显然它属于“囚徒困境”

13、（市场威慑）考虑下面一个动态博弈首先，在一个市场上潜在的进入者选择是否进入，然后市场上的已有企业（在位者）选择是否与新企业展开竞争在位者可能有两种类型，温柔型（左图）和残酷型（右图），回答下面问题

（1）找出给定在位者的两种类型所分别对应的纳什均衡，以及子博弈精炼纳什均衡1温柔型在位者的纳什均衡为进入，默认残酷型在位者的纳什均衡为不进入，进入，斗争2已有企业为温柔型的概率至少多少时，新企业才愿意进入20p-10l-p=0得至收=1/3

四、论述题

1、解释“囚犯困境”，并举商业案例说明1假设条件举例两囚徒被指控是一宗罪案的同案犯他们被分别关在不同的牢房无法互通信息各囚徒都被要求坦白罪行如果两囚徒都坦白，各将被判入狱5年；如果两人都不坦白，两囚徒可以期望被从轻发落入狱2年；如果一个囚徒坦白而另一个囚徒不坦白，坦白的这个囚徒就只需入狱1年，而不坦白的囚徒将被判入狱1年2囚徒困境的策略矩阵表每个囚徒都有两种策略坦白或不坦白表中的数字分别代表囚徒甲和乙的得益坦白不坦白囚徒甲坦白-5,-5-1,-10不坦白-10,-1-2,-2囚徒乙3分析通过划线法可知在囚徒困境这个模型中，纳什均衡就是双方都“坦白:给定甲坦白的情况下，乙的最优策略是坦白；给定乙坦白的情况下，甲的最优策略也是坦白而且这里双方都坦白不仅是纳什均衡，而且是一个上策均衡,即不论对方如何选择，个人的最优选择是坦白其结果是双方都坦白4商业案例寡头垄断厂商经常发现它们自己处于一种囚徒的困境当寡头厂商选择产量时，如果寡头厂商们联合起来形成卡特尔，选择垄断利润最大化产量，每个厂商都可以得到更多的利润但卡特尔协定不是一个纳什均衡，因为给定双方遵守协议的情况下，每个厂商都想增加生产，结果是每个厂商都只得到纳什均衡产量的利润，它远小于卡特尔产量下的利润

2、解释并讨论古诺的双寡头模型的纳什均衡为什么其均衡是一种囚徒困境？见上课笔记或计算题第11题

3、用“小偷与守卫的博弈”说明“激励（监管）悖论:

（1）假设条件举例偷窃和防止偷窃是小偷和门卫之间进行博弈的一场游戏门卫可以不睡觉，或者睡觉小偷可以采取偷、不偷两种策略如果小偷知道门卫睡觉，他的最佳选择就是偷；如果门卫不睡觉，他最好还是不偷对于门卫,如果他知道小偷想偷，他的最佳选择是不睡觉，如果小偷采取不偷，自己最好去睡觉

（2）小偷与门卫的支付矩阵表（假定小偷在门卫睡觉时一定偷成功，在门卫不睡觉时偷一定会被抓住）:门卫睡觉不睡觉小偷偷1,-120不偷0,20,0

（3）分析通过划线法可知这个博弈是没有纳什均衡的门卫不睡觉，小偷不偷，双方都没有收益也没有损失；门卫不睡觉，小偷偷，门卫因为是本职工作得不到奖励，小偷被判刑丧失效用2单位；门卫睡觉，小偷不偷，门卫睡觉的很愉快得到效用2单位，小偷没有收益也没有损失；门卫睡觉，小偷偷，门卫因失职被处分而丧失效用1单位，小偷偷窃成功获得效用1单位

（4）“激励（监管）悖论”说明现实中，我们看到，当门卫不睡觉时，偷窃分子便收敛一阵；严打的时期一过，偷窃分子又开始兴风作浪，在不能容忍小偷过分猖狂的时候，门卫不得不再次开始认真即偷的小偷越多，那么不睡觉的门卫将会越多，偷的小偷越少，不睡觉的门卫将越少；反过来，不睡觉的门卫越多，偷的小偷就越少，不睡觉的门卫越少，偷的小偷就越多如果偷窃集团倾巢出动,那么门卫的选择也是全部不睡觉，但门卫一旦全部不睡觉，小偷最好选择全部不偷，小偷一旦选择全部不偷，门卫最好全部选择睡觉

（5）结论加重对小偷的处罚在长期中并不能抑制偷窃（而只能使门卫偷懒）；加重处罚失职门卫恰恰是会降低偷窃发生的概率这种门卫和小偷的博弈所揭示的，政策目标和政策结果之间的这种意外关系，常被称为“激励的悖论二。

更多此类文档

关于文档

个人认证

优秀文档

获得点赞 0

文件大小134.52 KB

文件格式docx

分享时间2025-05-01

更多此类文档

立即下载