博弈论ppt完整版.pptx

资源描述

博弈论ppt完整版.pptx

《博弈论ppt完整版.pptx》由会员分享，可在线阅读，更多相关《博弈论ppt完整版.pptx（210页珍藏版）》请在冰豆网上搜索。

博弈论ppt完整版.pptx

什么是博弈论？

在人世间，人与人之间的对抗和较量是一个不容回避的话题，只有直面这个话题，个人才更有可能获得成功的机会；人们试图获得成功，就有必要研究对抗局势中如何策略性地选择自己的行动；专门研究互动局势下人们的策略行为的学问叫“博弈论（gametheory）”,理性人在最大化自己的偏好时，需要相互合作，而合作中又有冲突,人类为达到合作和解决冲突所发明的重要制度之一,价格制度,市场参与者的数量足够多，从而市场是竞争性的参与者之间不存在信息不对称问题,传统的新古典经济学就是以价格为研究对象的，故又称为价格理论。

其基本假设：

传统经济学的假设及其局限性,一般均衡理论是整个经济学的理论基石和道义基础，市场机制是完美的，帕累托最优成立，平等与效率可以兼顾。

个人决策是在给定一个价格参数和收入的条件下最大化自己的效用，个人的效用与其他人无涉，所有其他人的行为都被总结在“价格”参数之中,基本假设：

完全竞争，完美信息,然而在以下情况,上述结论不成立：

非完全竞争：

垄断越来越普遍外部性：

市场不可能把所有的成本收益都计算在内公共产品：

市场无法解决“搭便车”问题逆向选择问题：

柠檬市场，二手车市场道德风险问题：

为什么市场的交易费用比较高？

传统经济学假设的局限性：

交易主体的数量其实很有限；信息是不对称的；,百年来，经济学的主要发展围绕以上五方面展开研究，建立起,垄断竞争理论产业组织理论企业理论信息经济学新制度经济学不确定下的决策（投资理论）,博弈论逐渐成为经济学的基石,博弈论对经济学的影响,博弈论改写经济学，从放宽新古典的完全竞争和完全信息两个条件展开国外经济学教科书改写，加入大量博弈论内容博弈论进入主流经济学，反映了：

经济学的研究对象越来越转向个体放弃了有些没有微观基础的假设经济学的研究对象越来越转向人与人之间行为的相互影响和作用经济学越来越重视对信息的研究传统微观经济学的工具是数学（微积分、线性代数、统计学），而博弈论是一种新的数学。

以前只有陆军，现在有了空军，其差异不可以公里计。

二、博弈论的发展概述,博弈是决策主体在互相对抗中，对抗双方（或多方）互相依存的一系列策略和行动的过程集合。

博弈论：

专门研究博弈如何出现均衡的规律的学问。

博弈论的基本内容,博弈论的分类及相应的均衡,博弈三要素：

参与人（player）行动（action）或策略（strategy）支付（payoff）,信息、战略、结果,博弈,博弈的分类,博弈论的产生与发展,1838年，奥古斯特.古诺提出古诺模型；在20世纪初，泽美劳（Zermelo）、鲍莱尔（Borel）和约翰.冯.诺伊曼等数学家就已经开始研究博弈的数理基础。

约翰.冯.诺伊曼和奥斯卡.摩根斯坦的题为博弈论与经济行为（1944年）的经典巨著奠定了在经济学中应用博弈论的基础。

一、完全信息静态博弈,定义：

博弈各方同时决策且彼此对各种策略组合情况下所有参与人相应的得益都完全了解。

表达：

在博弈论中，一个博弈可以用两种不同的方式来表达：

策略式表述：

适合于静态博弈（矩阵式）扩展式表述：

适合于讨论动态博弈（树状结构）,博弈论模型,一个博弈需要有五方面内容组成：

参与人策略支付信息均衡,囚徒困境,每个参与人的得益函数：

博弈的参与人集合：

=（A，B）；,每个参与人的战略空间：

SA=（坦白，抵赖）SB=（坦白，抵赖）,uA（坦白，坦白）=uB（坦白，坦白）=-8uA（抵赖，抵赖）=uB（抵赖，抵赖）=-1uA（坦白，抵赖）=uB（坦白，抵赖）=0uA（抵赖，坦白）=uB（抵赖，坦白）=-10,占优策略：

一些特殊的博弈中，一个参与人的最优策略可以不依赖于其他参与人的策略选择，就是说，不论其他参与人选择什么策略，他的最优策略是唯一的，这样的最优策略被称为“占优策略”。

劣策略：

如果一个博弈中，某个参与人有占优策略，那么该参与人的其他可选择策略就被称为“劣策略”。

二、占优策略均衡,在这个例子里，无论对方如何选择，每个人的最优选择：

坦白；可以预测，结果将是（坦白，坦白）,占优均衡：

由所有参与人的占优策略构成的战略组合。

占优战略均衡的出现只要求由所有参与人都是理性的，但不要求每个参与人知道其他参与人是否理性。

“囚徒困境”博弈有占优均衡，所以其结果很容易预测。

占优策略均衡,“囚徒困境”的一般表示,满足：

RTPS；SRTT,三、用法律解决“囚徒困境”,满足：

XRT,四、重复剔除的占优均衡,找出某个参与人的严格劣策略（假定其存在），把这个劣策略剔除掉；重新构造一个不包含已剔除策略的新的博弈；重复这个过程，一直到只剩下一个唯一的策略组合为止。

这个唯一剩下的策略组合就是这个博弈的均衡解，称为“重复剔除的占优均衡”。

注意，上述表述中强调了“唯一”这个词。

也就是说，如果重复剔除后剩下的策略组合不唯一，那么该博弈就不是可通过重复剔除劣策略求解的。

思路：

理性共识,0-阶理性共识：

每个人都是理性的，但不知道其他人是否是理性的；1-阶理性共识：

每个人都是理性的，并且知道其他人也是理性的，但不知道其他人是否知道自己是理性的；2-阶理性共识：

每个人都是理性的，并且知道其他人也是理性的，同时知道其他人也知道自己是理性的；但不知道其他人是否知道自己知道他们是理性的,重复剔除与理性共识,重复剔除不仅要求每个人是理性的，而且要求每个人知道其他人是理性的；每个人知道每个人知道每个人是理性的，如此等等理性是“共同知识”（共识）。

最优选择,这个博弈只要求1-阶理性共识就可以预测到均衡结果,如果R相信C是理性的，R就知道C不会选择C3，所以R的最优选择是R1；,如果C相信R是理性的，C就知道R不会选择R2和R3；,此时，C1又成为C的严格劣战略；,重复剔除的占优均衡：

（R1，C2）,选择越多，对理性共识的要求越高,0-阶理性：

C是理性的，C不会选择C4；,1-阶理性：

R相信C是理性的，R会将C4从C的战略空间中剔除,所以R不会选择R4；,2-阶理性：

C相信R相信C是理性的，C会将R4从R的战略空间中剔除,所以C不会选择C1；,3-阶理性：

R相信C相信R相信C是理性的，R会将C1从C的战略空间中剔除,R不会选择R1；,4-阶理性：

C相信R相信C相信R相信C是理性的，C会将R1从R的战略空间中剔除,C不会选择C3；,5-阶理性：

R相信C相信R相信C相信R相信C是理性的，R会将C3从C的战略空间中剔除,R不会选择R3；,不能用重复剔除求解的博弈,许多博弈没有占优均衡，也没有重复剔除的占优均衡。

实用性较强的博弈分析方法,必然是以策略之间的相对优劣关系,而不是绝对优劣关系为基础的，根据这样的思路，很容易导出博弈分析的“划线法”。

划线法,因此，以上五个策略都不可能被双方接受！

五、纳什均衡与一致性预期,纳什均衡：

所有参与人的最优战略的组合，即给定战略中别人的选择，没有人有积极性改变自己的选择。

构成纳什均衡的策略一定是重复剔除严格劣策略过程中不能被剔除的策略，当然，逆定理是不存在的。

许多不存在占优策略均衡或重复剔除的占优策略均衡的博弈，也存在纳什均衡。

纳什均衡的正式定义,有n个参与人的战略式表述博弈GS1，Sn；u1,，un战略组合s*（s1*，sn*）是G的一个纳什均衡，如果对于每一个i，si*是在给定其他参与人选择si*（s1*,，si-1*，si+1*，sn*）的情况下第i个参与人的最优战略，即：

ui（si*,s-i*）ui（si，s-i*）对任意siSi,和任意的都成立。

一致性预期,一致性预期：

基于预期的选择是合理的，支持选择的预期是正确的。

预期的自我实现：

如果所有人都认为这个结果会出现，这个结果就会出现，预期是自我实现的，预期不会错。

如果你预期我会选择X，我就真的会选择X。

如果参与人事前达成一个协议，在不存在外部强制的情况下，每个人都有积极性遵守这个协议，这个协议就是纳什均衡。

应用1古诺的双寡头垄断模型（1938）,假定：

只有两个厂商面对相同的线形需求曲线，P（Q）=aQ，Q=q1+q2两厂商同时做决策；假定成本函数为C（qi）ciqi问题：

两个厂商的均衡产量和均衡价格如何确定。

该博弈问题的标准式：

参与人厂商1和厂商2战略空间每个企业可以选择的产品产量：

Si=0，），i=1,2，qi0收益用利润额代表企业的收益,均衡,企业利润最大化的条件为：

纳什均衡产量为：

纳什均衡利润为：

反应函数,q1,q2,垄断产量和垄断利润,垄断企业的目标函数：

垄断利润为：

垄断产量：

在古诺均衡解中，这种情况就不会发生，两个企业的总产量要更高一些，相应地使价格有所降低。

卡特尔与囚犯困境,卡特尔是一种垄断组织，各个厂商互相通过某种协定达成某种默契以求获得共同的最大收益。

价格卡特尔：

制定一个共同的价格，销售同样的产品。

产量卡特尔：

统一控制产量，减少产量，抬高价格，使组织的共同收益最大，比如欧佩克就是典型的产量卡特尔。

卡特尔组织的各成员可能也会作出类似的个体最优的决策，最终损害卡特尔组织的集体利益，这样就需要强加一些惩罚性的制度安排，改变支付矩阵，迫使均衡在集体最优的地方达到。

CH4混合战略纳什均衡,混合战略及其均衡策略混合的好处混合策略的麻烦纳什均衡的存在性问题,监督博弈,有些博弈没有“纯”战略纳什均衡，如,给定工人偷懒，老板的最优选择是监督；,给定工人不偷懒，老板的最优选择是不监督；,给定老板不监督，工人的最优选择是偷懒；,如此循环,上述两个博弈的显著特征是,每个参与者都想猜透对方的战略选择，而每个参与者又都不能让对方猜透自己的战略。

这样的问题在诸如扑克牌比赛、橄榄球赛、战争等情况中都会出现。

在所有这类博弈中，都不存在纳什均衡。

尽管这两个博弈不存在纯战略意义上的纳什均衡，却存在混合战略纳什均衡。

混合战略指的是参与人以一定的概率选择某种战略。

混合战略及其均衡,设想工人推断老板以q的概率监督，以1-q的概率选择不监督；对工人来说,当q1/4时，34q2，所以工人的最优纯战略是“努力”；当q1/4时，34q2，所以工人的最优纯战略是“偷懒”；当q1/4时，工人选择什么无差异。

选择偷懒带来的效用为：

（1）（1q）334q选择努力带来的效用为：

q2（1q）22,混合战略,定义：

对标准式博弈G=S1，Sn；u1，un，假设Si=si1，siK。

那么，参与者i以概率分布pi=（pi1，piK）随机在其K个策略中选取的“策略”，称为一个“混合策略”,其中0pik1对k=1，K，都成立，且pi1+piK=1。

纯战略：

参与人在每一个给定信息的情况下只选择一个特定的行动；相反，如果一个战略规定参与人在给定信息情况下，以某种概率分布随机地选择不同的行动，则称该战略为混合战略；纯战略可视为混合战略的特例。

关于混合战略的支付函数,在纯战略情况下，参与者i的支付ui是纯战略组合s=s1，si，sn的一个函数，即ui=uis1，si，sn；对于任何给定的战略组合s=s1，si，sn，ui取一个确定的值；与混合战略相伴随的是支付的不确定性，此时，参与人关心的是期望效用。

用i（pi，p-i）表示参与人i的期望效用函数（其中p-i=（p1，pi-1，pi+1，pn）是除i之外所有其他参与人的混合战略组合）；i的期望支付可以具体定义为：

以2人博弈为例说明,假定S1=s11，s1k是参与者1的纯战略，S2=s21，s2J是参与者2的纯战略；如果参与人1相信参与人2的混合战略为q=（q1，qJ）那么参与人1选择纯战略s1k的期望效用为：

参与人1选混合战略p=（p1，pK）的,期望效用为：

混合战略纳什均衡,定义：

对标准式博弈G=S1，Sn；u1，un，混合战略组合p*=（p1*，pn*）是一个纳什均衡，如果对所有的i=1，n，及参与人i的任意一个混合战略pi而言，下式成立：

i（pi*，p-i*）i（pi，p-i*）,总结,上述的r*（q）称为工人对老板的反应对应函数；q*（r）则称为老板对工人的反应对应函数；一个参与人选择不同纯战略的概率分布不是由他自己的支付决定的，而是由他的对手的支付决定的；许多人认为混合战略纳什均衡是一个难以另人满意的概念；一个参与人使用

展开阅读全文