还剩38页未读,继续阅读
本资源只提供10页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
文本内容:
博弈论基础课程概述理论基础应用领域课程内容博弈论研究互动决策的数学理论,博弈论广泛应用于经济学、政治为理解复杂的策略互动提供分析框学、生物学等领域,为分析市场竞架该理论强调参与者之间的相互争、政治谈判、生物进化等现象提依赖性,每个决策者的最优选择都供强有力的工具其应用范围不断取决于其他人的行为扩展到新兴学科第一部分博弈论导论定义与起源博弈论的基本概念与历史背景历史发展从冯诺依曼到现代博弈论的演进·研究方法主要分析方法与应用领域什么是博弈论研究对象理论特征博弈论研究互动决策的理论,主博弈论强调理性参与者在相互作要研究理性行动者的策略选择用中的策略行为年诺贝2005其核心特点是决策相互影响,每尔经济学奖得主Robert个参与者都需要考虑对方的决将博弈论定义为研究冲Aumann策这种相互依赖性使得博弈论突与合作的数学理论,这一定义成为分析复杂社会现象的重要工准确概括了博弈论的本质特征具核心理念博弈论的核心理念是参与者的决策相互影响,每个人的最优选择都依赖于其他人的行为这种相互依赖性要求参与者不仅要考虑自己的利益,还要预测和考虑其他人的可能反应博弈论的历史发展1年1944冯诺依曼与摩根斯特恩发表《博弈论与经济行为》,标志着现代博弈·论的诞生这部开创性著作为博弈论奠定了坚实的数学基础2年1950约翰纳什提出纳什均衡概念,这一突破性贡献为博弈论提供了最重要·的解概念,极大推动了博弈论的发展和应用3年1994纳什、泽尔滕与哈萨尼因对博弈论的贡献获诺贝尔经济学奖,标志着博弈论在学术界地位的确立和对实际应用价值的认可4年2005奥曼与谢林因博弈论研究获诺贝尔经济学奖,进一步证明了博弈论在解释和分析复杂社会现象方面的重要作用博弈论应用领域经济学政治学生物学计算机科学市场竞争、定价策略、拍投票行为、国际关系、谈进化稳定策略、物种竞争算法博弈、网络安全策略卖理论是博弈论在经济学判策略等政治现象都可以模型展示了博弈论在生物是博弈论在计算机科学中中的经典应用博弈论为用博弈论来分析博弈论学中的重要应用生物体的新兴应用领域随着人理解企业竞争行为、市场帮助我们理解政治参与者之间的竞争与合作关系可工智能和网络技术的发结构演化和政策制定提供的策略选择和政治制度的以用博弈论模型来描述和展,博弈论在这些领域的了强有力的分析工具运行机制预测作用日益重要第二部分博弈的基本概念参与者信息结构博弈中的决策主体与策略空间信息完全性与博弈结构分析理性均衡支付函数稳定的策略组合状态策略组合对应的收益结构基本术语1参与者策略支付信息Player StrategyPayoff Information参与者是博弈中的决策主策略是参与者可选择的行动支付是参与者在特定策略组信息是参与者了解的博弈状体,可以是个人、企业、国方案,是参与者在博弈中可合下获得的收益或效用支态,包括对博弈规则、其他家或任何具有决策能力的实以采取的完整行动计划策付函数将每个可能的策略组参与者类型、历史行动等的体每个参与者都有自己的略必须明确规定在每种可能合映射到参与者的收益上,了解程度信息的完全性和目标和偏好,并根据这些目情况下应该采取什么行动,这些收益可以是金钱、效用对称性是博弈分析的重要考标做出理性决策参与者的包括对其他参与者可能行为或任何其他形式的价值虑因素数量可以是两个或多个的应对方案基本术语2理性人假设理性人假设是博弈论的基础,假设参与者追求支付最大化,具有完备的偏好序列和逻辑推理能力理性参与者能够评估不同策略的后果并选择最优策略策略空间策略空间是所有可行策略的集合,定义了参与者可以选择的所有可能行动策略空间的大小和复杂性直接影响博弈分析的难度和均衡的性质策略组合策略组合是各参与者选择策略的组合,表示博弈中所有参与者同时做出的策略选择每个策略组合对应一个确定的支付结果均衡状态均衡是稳定的策略组合状态,在此状态下没有参与者有动机单方面改变策略均衡概念是博弈论分析的核心,预测博弈的可能结果博弈的要素利益最大化参与者追求自身利益最大化相互影响参与者行动相互影响策略选择拥有策略选择的可能性独立参与者至少两个独立的参与者理性人假设目标最大化理性参与者努力实现自身目标最大化,这意味着他们会在给定约束条件下选择能够带来最大收益的策略这种最大化行为是博弈论分析的基础假设推理能力理性参与者具备推理能力和逻辑思维,能够分析复杂情况并预测其他参与者的行为这种认知能力使得参与者能够进行策略性思考理性与道德理性不等同于道德,理性决策基于自身利益考量而非道德标准理性参与者可能选择在道德上有争议但符合自身利益的策略预测能力理性参与者能够预测他人的理性行为,这种递归推理能力使得博弈分析成为可能参与者不仅考虑自己的最优反应,还要考虑其他人的最优反应博弈的类型按合作性分类按信息完全性分类按时间结构分类按重复性分类合作博弈中参与者可以达成完全信息博弈中参与者了解静态博弈中参与者同时行动一次性博弈只进行一轮,参约束性协议,研究重点是联所有博弈结构和历史行动或后行者不知先行者行动与者没有建立声誉的机会盟形成和收益分配非合作不完全信息博弈中参与者对动态博弈中行动有先后顺重复博弈多次进行,参与者博弈中参与者无法达成约束博弈某些方面信息缺失,需序,后行者知道先行者的选可以根据历史行为调整策性协议,每个人都必须独立要在不确定性下做决策择,可以据此调整策略略,合作更容易维持做决策静态博弈与动态博弈静态博弈特征参与者同时行动或后行者不知先行者行动,决策在时间上是同步的这类博弈强调参与者在信息有限情况下的策略选择,需要预测其他人的可能行为动态博弈特征行动有先后顺序,后行者知道先行者行动,可以根据观察到的信息调整策略这种序贯结构为后行者提供了信息优势,使得策略更加复杂表示方法对比静态博弈通常用策略式或矩阵式表示,直观显示策略组合和对应支付动态博弈用扩展式或博弈树表示,清楚展现行动顺序和信息结构完全信息与不完全信息信息类型完全信息不完全信息定义特征参与者了解所有博弈结构和历史行动参与者对博弈某些方面信息缺失分析复杂度相对简单,确定性较高复杂,需考虑不确定性均衡概念纳什均衡、子博弈完美均衡贝叶斯纳什均衡典型应用棋类游戏、公开竞标拍卖、信号传递合作博弈与非合作博弈合作博弈非合作博弈参与者可达成约束性协议,研究重点是参与者无法达成约束性协议,每个人都联盟形成、收益分配和稳定性分析合必须独立决策研究重点是策略选择与作博弈关注如何实现帕累托改进和公平均衡分析,预测在缺乏外部约束下的博分配弈结果应用差异相互关系合作博弈适用于可强制执行协议的情两种博弈类型相互补充,非合作博弈为况,如法律合同非合作博弈适用于缺合作博弈提供微观基础,合作博弈为非乏外部执行机制的情况,如市场竞争、合作博弈指明改进方向现实中多数情国际关系等况是两者的结合第三部分博弈表示方法特征函数表示用于合作博弈分析扩展式表示博弈树形式,适用动态博弈策略式表示矩阵形式,适用静态博弈策略式表示法矩阵结构行列含义支付表示策略式表示适用于静行表示行动者策略,矩阵元素表示对应策态博弈,用矩阵表示列表示列动者策略,略组合下的支付值,参与者、策略和支矩阵的维度由参与者通常用有序对表示各付这种表示方法简数量和策略数量决参与者的收益支付洁明了,便于分析和定每个参与者的策值的设定反映了参与计算均衡解略选择构成矩阵的一者的偏好和利益关个维度系分析优势策略式表示便于寻找占优策略和纳什均衡,可以直观地比较不同策略组合的支付结果,是博弈论分析的基础工具策略式表示示例囚徒困境博弈经典的×博弈矩阵,展示了个体理性与集体理性的冲突合作策略组合虽然对双方最22优,但不是纳什均衡,背叛是每个参与者的占优策略性别争夺博弈反映协调问题的典型例子,存在两个纯策略纳什均衡参与者偏好不同的均衡,需要通过沟通或惯例来选择特定均衡协调博弈强调合作和协调的重要性,多个帕累托效率不同的均衡并存文化背景和社会规范在均衡选择中发挥重要作用胆小鬼博弈展现冲突和妥协的动态关系,强硬立场可能获得优势但也可能导致双输时机和承诺在这类博弈中至关重要扩展式表示法博弈树结构适用于动态博弈,用树状结构表示节点与分支节点表示决策点,分支表示可选策略终端节点表示博弈结束与最终支付结果信息集合表示参与者的信息状态和约束扩展式表示示例1最后通牒博弈第一阶段提议者分配资源,第二阶段接受者决定接受或拒绝,拒绝则双方都得不到任何收益2讨价还价博弈多轮谈判过程,参与者轮流提出分配方案,时间成本和耐心程度影响最终结果3投资博弈多阶段决策过程,早期投资决定影响后期选择空间,需要考虑长期战略规划4信任博弈信任者决定是否信任,受托者决定是否回报信任,展现信任与合作的微妙关系第四部分占优策略与占优策略均衡严格占优策略无论对手选择什么策略,某策略总是最优选择这是最强的策略概念,为理性参与者提供明确的行动指导弱占优策略至少与其他策略一样好,且在某些情况下更好的策略虽然不如严格占优策略明确,但仍是理性选择的重要依据策略识别通过比较不同策略在各种情况下的支付来识别占优策略这需要系统性地分析每个策略对所有可能对手策略的表现均衡分析占优策略均衡具有强预测性,是博弈分析的理想结果然而,现实中许多博弈并不存在占优策略,需要其他均衡概念严格占优策略理性必选理性参与者总会选择严格占优策略支付比较无论对手选择什么,该策略支付总是最高识别方法比较同一参与者不同策略的支付值弱占优策略定义特征识别方法应用示例弱占优策略是指某策略至少与其他策略通过支付值比较与部分优势分析来识别在市场进入博弈中,企业可能面临弱占一样好,且至少在一种情况下更好的策弱占优策略需要检查该策略在所有可优策略选择进入市场的策略在某些市略这种策略虽然不如严格占优策略明能情况下的表现,确保它从不比其他策场条件下优于不进入,在其他条件下至确,但仍然为理性参与者提供了合理的略差,且在某些情况下表现更好少不差于不进入,因此是弱占优策略选择依据占优策略均衡稳定性特征占优策略均衡是每个参与者都选择占优策略形成的均衡状态这种均衡具有极强的稳定性,因为没有参与者有动机偏离自己的占优策略选择预测性强由于占优策略为理性参与者提供了明确的行动指导,占优策略均衡具有很强的预测性分析者可以确信理性参与者会选择这种均衡存在局限占优策略均衡的主要局限性在于很多现实博弈不存在占优策略这时需要运用其他均衡概念,如纳什均衡来分析博弈结果经典案例囚徒困境是占优策略均衡的经典例子每个囚徒的坦白策略都是严格占优策略,因此双方坦白构成唯一的占优策略均衡迭代剔除严格占优策略识别阶段首先识别所有参与者的严格占优策略,这需要系统性地比较每个参与者的不同策略在各种情况下的支付表现剔除过程将被严格占优的策略从博弈中剔除,因为理性参与者永远不会选择这些策略剔除后博弈规模缩小,分析变得更简单重复迭代在简化后的博弈中重复上述过程,直到无法继续剔除为止每轮迭代都可能揭示新的占优关系,进一步简化博弈结构最终结果迭代过程结束后得到的策略组合具有强合理性,是理性参与者可能选择的结果这种方法在寡头竞争分析中应用广泛第五部分纳什均衡寻找方法纯策略均衡最优反应函数法和图示分析法参与者选择确定性策略的均衡基本概念混合策略均衡没有参与者通过单方面改变策略获益的稳定状态参与者随机选择策略的均衡纳什均衡概念核心定义纳什均衡是指没有参与者通过单方面改变策略而获益的策略组合这一概念由约翰纳什在年提出,成为博弈论最核心的均衡概念·1950提出者贡献约翰纳什的突破性贡献在于证明了每个有限博弈至少存在一个纳什均衡(可·能是混合策略均衡)这一存在性定理为博弈论奠定了坚实基础自我强化特性纳什均衡具有自我强化的特性,一旦达到均衡状态,所有参与者都没有动机偏离这种稳定性使得纳什均衡成为预测博弈结果的重要工具理论意义纳什均衡的意义在于为非合作博弈提供了统一的解概念,适用于各种不同类型的博弈分析它连接了个体理性与集体结果,揭示了策略互动的本质纳什均衡的性质稳定性自我实现多重性纳什均衡的最重要性质理性参与者的预期会导一个博弈可能存在多个是稳定性,即没有参与向均衡状态,形成自我纳什均衡,这带来了均者有动机单方面改变策实现的预言如果所有衡选择问题不同均衡略这种稳定性来源于人都相信某个策略组合可能对参与者有不同的每个参与者的策略都是是均衡,那么每个人的吸引力,需要额外的理对其他人策略的最优反最优选择确实会导致这论来预测哪个均衡会被应个结果选择非最优性纳什均衡不一定是帕累托最优的,可能存在让所有参与者都更好的其他结果囚徒困境就是典型例子,均衡结果对所有人都不是最好的纯策略纳什均衡定义特征寻找方法经典应用纯策略纳什均衡是指参与者选择确定性最常用的方法是最优反应函数法,通过古诺模型是纯策略纳什均衡的经典应策略的纳什均衡在这种均衡中,每个构建每个参与者的最优反应函数,寻找用,企业在产量选择上达到均衡协调参与者以概率选择某个特定策略,不存这些函数的交点图示法可以直观显示博弈也常存在多个纯策略纳什均衡,需1在随机化行为策略空间中的最优反应曲线交点要通过焦点效应等机制选择特定均衡混合策略纳什均衡随机化策略参与者按一定概率随机选择策略无差异条件2使对手对各纯策略无差异概率计算通过支付相等条件求解混合概率第六部分典型博弈模型公共品博弈集体行动与搭便车问题胆小鬼博弈冲突与妥协的战略选择协调博弈合作与协调机制分析囚徒困境个体理性与集体理性的冲突囚徒困境模型描述支付结构分析两名囚犯被分别关押,面临选择双方合作(都沉默)的总收益最坦白或保持沉默的决策警方提高,但存在单方背叛的强烈诱供激励机制如果一人坦白另一因每个囚犯都面临着无论对人沉默,坦白者获释而沉默者重方选择什么,坦白总比沉默好的判;如果都坦白则都判中等刑情况,这使得坦白成为占优策期;如果都沉默则都判轻刑略均衡与悖论唯一纳什均衡是双方都坦白,但这个结果对双方都不如合作结果好这揭示了个体理性决策可能导致集体非理性结果的深刻悖论,是博弈论最著名的例子之一囚徒困境的应用经济学应用环境治理国际关系合作机制价格战是囚徒困境在商业中碳排放控制和公共资源管理贸易谈判和军控协议经常面重复博弈为解决囚徒困境提的典型体现,企业为了争夺是囚徒困境的现实应用各临囚徒困境结构各国在贸供了可能,长期关系中的声市场份额而降价,最终可能国都希望其他国家减排而自易中都希望对方开放市场而誉机制、惩罚威胁和互惠策导致行业整体利润下降军己继续排放以获得经济优自己保持保护,在军控中都略可以维持合作制度设备竞赛也反映了类似逻辑,势,但如果所有国家都这样希望对方削减武器而自己保计、监督机制和激励结构的各国为了安全而增加军费,想,环境就会持续恶化,最持优势,这使得国际合作变改变也有助于促进合作行但过度军备可能使所有国家终损害所有人的利益得困难为都不如节制军费时安全协调博弈模型特征多重均衡焦点均衡协调机制参与者需要协调行动以获得存在多个帕累托效率不同的文化、习俗、规范影响均衡沟通、承诺、制度促进协调最佳结果纳什均衡选择协调博弈的应用技术标准选择与录像带格式之争是技术标准协调博弈的经典案例虽然技VHS BetamaxBetamax术更先进,但通过更好的市场策略获得了更多用户支持,最终成为主导标准网VHS络外部性使得标准选择具有路径依赖特征货币选择法定货币的使用体现了大规模协调博弈的成功案例货币之所以有价值,是因为大家都相信它有价值并愿意接受这种协调依赖于政府信誉、法律制度和社会共识的支撑交通规则靠左行驶与靠右行驶都是可行的交通规则,关键是所有人必须协调选择同一种规则历史因素、殖民影响和国际交流塑造了不同国家的选择,一旦形成就很难改变社会规范礼仪习惯、商业惯例和社会行为规范的形成都体现了协调博弈的逻辑这些规范一旦建立就具有自我强化特性,因为偏离规范会导致社会成本,而遵守规范则能获得社会认同胆小鬼博弈经典场景两车相向行驶,谁先转向谁是胆小鬼这个模型源于年代美国青少年的危险1950游戏,后来被用来分析各种冲突和谈判情况博弈的核心在于展示勇气和决心的价值支付结构双方都不让步导致最糟糕的结果(撞车),让步是次优选择,而让对方让步则是最佳结果这种支付结构创造了强烈的激励去表现得比对手更强硬和不理性均衡分析存在两个纯策略纳什均衡(一方让步,另一方不让步)和一个混合策略均衡关键问题是如何确定谁应该让步,这往往取决于承诺能力、声誉和可信度现实应用谈判策略、国际冲突、企业竞争中都能看到胆小鬼博弈的影子古巴导弹危机、贸易战、价格竞争等都体现了这种边缘政策的逻辑和风险公共品博弈模型设定搭便车问题个体决定是否为公共品做贡献,公共品理性个体倾向于享受他人提供的公共品1的收益由所有人共享,但成本由贡献者而不愿自己贡献,因为贡献的成本完全承担这种收益与成本的不对称性创造由自己承担,而收益却要与所有人分了搭便车的动机享这种逻辑导致公共品供给不足解决方案均衡结果通过制度设计、激励机制、强制性贡在一次性博弈中,唯一纳什均衡通常是献、声誉系统和惩罚措施可以缓解公共无人贡献公共品,即使这个结果对所有品供给不足问题政府提供、私人俱乐人都是次优的这揭示了市场机制在提部、社区自治等都是可能的解决途径供公共品方面的失效第七部分重复博弈有限重复博弈固定次数重复进行的博弈,通常用逆向归纳法分析如果阶段博弈有唯一纳什均衡,重复博弈的均衡往往与单期博弈相同,难以实现合作无限重复博弈无限次重复进行的博弈,引入贴现因子表示对未来收益的重视程度高贴现因子(重视未来)使得维持长期合作关系成为可能,为合作提供了理论基础民间定理在适当条件下,任何个体理性的支付组合都可以通过适当的策略在无限重复博弈中实现这为理解现实中广泛存在的合作现象提供了理论解释合作演化通过计算机模拟和实验研究发现,简单的策略如以牙还牙在促进合作方面非常有效成功策略通常具有善良、报复、宽恕和简单等特征有限重复博弈基本特征有限重复博弈是指博弈进行固定已知次数的情况参与者知道博弈何时结束,这种确定性的终点对策略选择产生重要影响,特别是在博弈的后期阶段逆向归纳法分析有限重复博弈的标准方法是逆向归纳,从最后一期开始向前推理在最后一期,参与者没有建立声誉的动机,会按照单期博弈的逻辑行动,这种逻辑会向前传递连锁推理如果阶段博弈有唯一纳什均衡,逆向归纳会导致每一期都重复这个均衡这被称为连锁推理,即最后一期的非合作行为会传导到前面的所有时期囚徒困境示例在有限重复囚徒困境中,即使重复很多次,理论预测仍然是每期都背叛因为在最后一期必然背叛,所以倒数第二期也没有合作的激励,依此类推到第一期无限重复博弈基本框架贴现因子触发策略合作条件无限重复博弈假设博弈无限贴现因子∈表示未来触发策略是无限重复博弈中当贴现因子足够高时,合作δ0,1次进行,没有确定的终点收益的现值权重,反映了参的重要概念,典型的形式是的长期收益超过短期背叛的这种设定更接近现实中的长与者对未来的重视程度高以合作开始,一旦有人背叛收益,使得合作成为理性选期关系,如商业伙伴关系、贴现因子意味着重视未来,就永久惩罚这种策略通过择这为解释现实中的合作国际关系等无限时间范围低贴现因子意味着短视贴威胁未来的惩罚来维持当前现象提供了理论基础,说明为合作创造了可能性现因子是维持合作的关键参的合作行为了长期关系的价值数。
个人认证
优秀文档
获得点赞 0