耶鲁公开课--博弈论笔记

佚名 · 0905

资料

文件大小146.62 KB

文件格式docx

分享时间2024-10-29

更多此类文档

立即下载

还剩7页未读，继续阅读

文本内容:

耶鲁公开课一博弈论笔记第一节、名词解释优势策略CDominant strategy）:不管其他局中人采取什么策略，优势策略对一个局中人而言都是最好的策略即某些时候它胜于其他策略，且任何时候都不会比其他策略差注

1.“优势策略〃的优势是指你的这个策略对你的其他策略占有优势，而不是无论对手采用什么策略，都占有优势的策略2,采用优势策略得到的最坏的结果不一定比采用另外一个策略得到的最正确的结果略胜一筹严格劣势策略（strictly dominatedstrategy）被全面的严格优势策略压住的那个策略，也就是说不是严格优势策略以外的策略弱劣势策略原来不是严格劣势策略，但是经过剔除严格劣势策略后，这个策略就成了严格劣势策略例囚徒困境甲沉默（合作）甲认罪（背叛）乙沉默7合作Tg人同服刑半年甲即时获释；乙服刑io年乙认罪（背板）甲服刑io年；乙即时获释二人同服刑2年囚徒到底应该选择哪一项策略，才能将自己个人的刑期缩至最短？两名囚徒由于隔绝监禁，并不知道对方选择；而即使他们能交谈，还是未必能够尽信对方不会反口就个人的理性选择而言，检举背叛对方所得刑期，总比沉默要来得低试设想困境中两名理性囚徒会如何作出选择假设对方沉默、背叛会让我获释，所以会选择背叛假设对方背叛指控我，我也要指控对方才能得到较低的刑期，所以也是会选择背叛二人面对的情况一样，所以二人的理性思考都会得出一样的结论一一选择背叛背叛是两种策略之中的支配性策略因此，这场博弈中唯一可能到达的纳什均衡，就是双方参与者都背叛对方，结果二人同样服刑2年例协和谬误20世纪60年代，英法两国政府联合投资开发大型超音速客机，即协和飞机该种飞机机身大、装饰豪华并且速度快，其开发可以说是一场豪赌，单是设计一个新引擎的本钱就可能高达数亿元难怪政府也会被牵涉进去，竭力要为本国企业提供更大的支持工程开展不久，英法两国政府发现继续投资开发这样的机型，花费会急剧增加，但这样的设计定位能否适应市场还不知道;但是停顿研制也是可怕的，因为以前的投资将付诸东流随着研制工作的深入，他们更是无法做出停顿研制工作的决定协和飞机最终研制成功，但因飞机的缺陷〔如耗油大、噪音大、污染严重等）以及运营本钱太高，不适合市场竞争，英法政府为此蒙受很大的损失在研制过程中，如果英法政府能及早放弃，本来可以使损失减少，但他们没能做到最后，英国和法国航空公司宣布协和飞机退出民航市场，才算是从这个无底洞中脱身这也是“壮士断腕〃的无奈之举人们往往会陷入类似的误区一项工作的本钱越大，对它的后续投入就越多其实不仅是在制造协和飞机这样的重大工程上，就是在日常的生活中，人们在决定是否继续做一件事情的时候，不仅是看它对自己有没有好处，而且也过于注意自己是不是已经在这件事情上面有过投入我们把那些已经发生、不可收回的支出，如时间、金钱、精力称为“漂浮本钱〃漂浮的意思是说，你在正式完成交易之前投入的本钱，如果一旦交易不成，就会白白损失掉但如果对漂浮本钱过分眷恋，就会继续原来的错误，造成更大的亏损在第一节课中得出的五个结论

1、不要选择劣势策略

2.理性选择导致次优结果

3.站在他人立场分析他们会怎么做

4、先弄清你想要的，才能得到你想要的

5.人人都是自私的第二节、囚徒困境的解决之道

1.屡次博弈；

2.设立规章制度，惩罚违规者；3,思想教育〔效果待定）博弈的要素参与者i；策略S；收益U符号的定义Si表示参与者i的策略s-i表示除参与者i以外其他人的策略Ui表示i的收益名词解释:共同知识我知道这件事；你也知道这事；我知道你知道这事；你知道我知道你知道这事这事；此后循环案例教师在课堂上让每位学生从1-100中选择一个数字选择到最接近全班平均数的2/3的学生为胜利者学生共有50个左右胜利者平分奖金5美元解决方案stepl.假设每个人都选择100,平均数100*2/3=

66.66所以不能选择67T00之间的数（严格劣势策略）现实中有两名学生选择了step2,剔除了stepl中的严格劣势策略后，重复迭代，66*2/3=44所以不能选择44-67之间的数〔弱劣势策略）现实中有四名学生选择了step344*2/3=29,所以不能选择29-44之间的数现实中有13个左右选择了30-34区间，选择这个数区间的学生想法是1-100平均数是50,50*2/3=33,所以选择33附近的数可能比拟接近这些学生低估了其同班同学的智商step429*2/3=19,所以不能选择19-29之间的数现实中有12个选择了选择这个区间的学生就像螳螂捕蝉中的螳螂，却没有想到还有更多的黄雀在后这么一直迭代下去，理论上如果所有学生都是理性人平均数应当是1现实中有12个学生选择了lo应该说选择了1的学生都看出了这个博弈的窍门但是他们的选择不是最接近平均数的因为在现实中不可能所有人都是理性人最终12是最接近平均数2/3的数有9人选择了这个数结论迭代剔除劣势策略是个好的方法，但在现实中不能过度迭代因为不是所有人都是理性人，而且不是所有人都有共同知识〔概念见前述）应用案例中间选民定理两个政治候选人，为了选举须确定自己的政治立场共有10个立场L

7、

8、

9、10o第个立场都有10%选票两个候选人要在一系列的政治主张中选择一个规那么选民会投票给观点最相近的候选人距离相等，该立场平分选票候选者希望选票最大化stepl:试证明S2优于S1比拟1号候选人选择S1,S2其利益U1的大小当2号候选人选择1号策略S1时UI

1.1［表示2号候选人选择SI,1号候选人选择S1］为50%U

12.1［表示2号候选人选择SI,1号候选人选择S1］为90%当2号候选人选择2号策略S2时Ull,2=10%012,2=50%当2号候选人选择3号策略S3时Ull,3=15%Ul2,3=20%当2号候选人选择4号策略S4时Ull,4=20%U12,4=25%下面选择S2得票率都比S1大5%,所以S2严格优于S1同理S9优于S10step2:试证明S3优于S2剔除劣势策略SI,S10当2号候选人选择2号策略S2时Ul2,2=50%Ul3,2=80%当2号候选人选择3号策略S3时U12,3=20%Ul3,3=50%当2号候选人选择4号策略S4时U12,4=25%Ul3,4=30%当2号候选人选择5号策略S5时U12,5=30%Ul3,5=35%下面选择S3得票率都比S2大5%,所以S3严格优于S2同理S8优于S9所以S2是弱劣势策略，以下同理可证S4优于S3,S5优于S4迭代剔除后将剩下S5,S6结论政治家为了赢得更多项选择票，尤其是大量关键的“中间选民〃，会表现的趋中，各个政治家之间的差异会变得很小如美国选举时议题是

4.其中三条直线有三个交点，分别位于P5=1/3；1/2；3/5三处结论从图中可以看出，Playl要得分最高，要根据Play2的P1不同分三段来选择策略当P r小于1/3时，应该选择u策略；当P5大于1/3小于3/5时；应该选择中间的线外外代表的策略d；当P r大于3/5时，应该选择m策略上面这个案例是一个纯理论阐述，下面介绍足球比赛中点球时，射手应该如何选择的问题这个案例的数据是基于实际比赛中的统计数据例点球34，•4*-19”0射手M“

6.6小R.9-・974©守门员，表格中前列数字表示射手射中球的概率，如4表示40%中球率L表示左，R表示右，M表示中用前例中的方法画图:射手从图中可得出为得到最高的点球成功率，当Pr50那寸，应该射手应该选择踢左边；当Pr50%时，应该射手应该选择踢右边;表示踢中路成功率的那条线始终没有最高概率，所以射手最好不要选择踢中路这个模型的缺陷没有考虑射手踢球的习惯；没有考虑守门员守中路的情况〔考虑三个要素很复杂，而且中路是可以排除的严格劣势策略；没有考虑球速比赛中的真实概率数据最正确对策定义UiSi\S-i=UiSi.S-i或者Si^=Max UiSi,S-i表示对手策略S-i的最正确对策Si表示Play i的其它对策第四节、例合伙人博弈2个股东都持有公司50%股份；两者平分利润；每个股东要选择为公司投入多少时间，用工作小时数代表双方策略Si二0,4[0~4是连续的数，而非只能选整数],双方可以在0至4个小时之间选择这家公司利润4*[Sl+S2+b*Sl*S2]0bl/4;｛S1+S2可以表示两个股东工作时间的简单相加对利润的奉献，b*Sl*S2可以表示由于两个股东相互协作对利润的奉献；考虑到了这两个局部，所以这个公式可以很好的反映现实的情况｝所以,U1以l,s2=l/2[4*Sl+S2+b*Sl*S2]-Sl的平方｛S1的平方表示股东1的努力本钱｝假设S2给定对U1设l,s2求导数Ulsl,s2=2l+bS2-2Sl当Ulsl,s2=0时Ulsl,s2值最大所以当S1=bS2+l时，Ulsl,s2最大也就是S1的最正确策略[BR同理S2=bSl+l是S2的最正确策略[BR意为best response]给定b=l/4画出BR的函数图在O〈S11和2S14这两个区间里playl没有最正确策略，所以playl不会选择这两个区间，从图上可以看出BR2S2只能选择红色一段同理BRI S1也只能选择红色一段将剩下的红色区间放大，并重复上一阶段剔除，如图:S2在KSK5/4和3/2Sl2这两个区间里playl没有最正确策略，所以playl不会选择这两个区间，从图上可以看出BR2S2只能选择红色一段同理BRlSl也只能选择红色一段不断重复以上过程，最终会得到两直线穿插的那一点Sl=S2=l/l-b结论

1、在合伙中，个人的努力获得的边际效益不断减少，所以每个人都倾向于少工作；

2、协同程度减少，会使人减少努力在这个案例中S1=S2这个点就是著名的纳什均衡点〔每个人都采用了各自最正确策略，或者说如果某情况下无一参与者可以单独行动而增加收益。

更多此类文档

关于文档

个人认证

优秀文档

获得点赞 0

文件大小146.62 KB

文件格式docx

分享时间2024-10-29

更多此类文档

立即下载