博弈论复习题1.docx

资源描述

博弈论复习题1.docx

《博弈论复习题1.docx》由会员分享，可在线阅读，更多相关《博弈论复习题1.docx（20页珍藏版）》请在冰豆网上搜索。

博弈论复习题1.docx

博弈论复习题1

1.设一四阶段两博弈方之间的动态博弈如图所示。

试找出全部子博弈，讨论该博弈中的可信性问题，求子博弈完美纳什均衡策略组合和博弈的结果。

2.假设一个工会是一个寡头垄断市场中所有企业唯一的劳动力供给者，就像汽车工人联合会对于通用、福特、克莱斯勒等大的汽车厂家。

令博弈各方行动的时间顺序如下：

（1）工会确定单一的工资要求w，适用于所有的企业

（2）每家企业i了解到w，然后同时分别选择各自的雇佣水平Li；（3）工会的收益为（w-wα）L，其中wα为工会成员到另外的行业谋职可取得的收入，L=L1+…Ln为工会在本行业企业的总就业水平；企业i的利润为π（w，Li），其中决定企业i利润水平的要素如下。

所有企业都有同样的生产函数：

产出等于劳动力qi=Li。

市场总产出为Q=q1+…+qn时的市场出清价格为p（Q）=a-Q。

为使问题简化，假设企业除了工资支出外没有另外的资本。

求出此博弈的子博弈精炼解。

在子博弈精炼解中，企业的数量是如何影响工会的效应的？

为什么？

（吉本斯2.2节2.7答案）

3.下图所示的同时行动博弈重复进行两次，并且第二阶段开始前双方可观测到第一阶段的结果，不考虑贴现因素。

变量x大于4，因而（4，4）在一次性博弈中并不是一个均衡收益。

对什么样的x，（双方参与者同时采取）下述战略是一个子博弈完美纳什均衡？

第一阶段选择Qi，如果第一阶段的结果为（Q1,Q2），在第二阶段选择Pi；如果第一阶段的结果为（y，Q2），其中y≠Q1，第二阶段选择Ri；如果第一阶段的结果为（Q1，z），其中z≠Q1，第二阶段选择Si；如果第一阶段结果为（y，z），其中y≠Q1，且z≠Q2，则在第二阶段选Pi

2，2

x，0

-1，0

0，0

0，x

4，4

-1，0

0，0

0，2

0，0

0，-1

-1，-1

2，0

（2.10吉本斯）

思路：

逐个分析上述的四种情形：

第一种情形，第一阶段选择Qi，第二阶段选择Pi，即双方均采取合作的策略，得益均为6；

第二种情形和第三种情形下，实际上有一方是采取了不合作，其得益为x，另一方即利益受损方得益为2；

第四种情形实际上是双方都不采取合作的策略，而根据题目要求，对于x，下述战略是一个子博弈精炼纳什均衡，所以x必须小于双方均合作时的收益6，否则第一种情形不会出现，因为既然x>6了，双方均会选择不合作而使情形一不会出现。

由题目先前给定的条件x<4，综合之得x的取值为（4,6）。

（可参见教材68页的分析）

4.两个人A,B分一个冰淇淋。

第一阶段A提出分割方案，B可以接受或者拒绝，接受则博弈结束，若拒绝B提出分配方案；同样，A可以接受或者拒绝，如果拒绝，就提出自己的分配比例。

博弈结束。

假定接受的利益和拒绝的利益相同的时候，大家都会选择接受。

冰淇淋在每个阶段会化掉1/3（整体的1/3）。

试分析这个博弈的子博弈完美纳什均衡是什么。

如果每阶段冰淇淋只化掉1/3，采用逆向归纳法。

最后一个阶段应该是A在分，如果B拒绝，两人都是0，A的分配不会使B得到的更差，所以为了最大化自己的利益，A便让自己得到1/3，B一丁点也得不到。

为了防止这一点，在第二阶段B分配的时候，就不会让A分到的比1/3少，否则A会拒绝，B就得不到好处了。

B会将剩下的2/3平分，两人各得1/3。

深知这一点后，第一阶段在冰淇淋没化的时候A如果让B得到的不少于1/3，B就不会拒绝。

这样A可以将2/3分给自己，1/3分给B，实现自己利益最大化。

此时便达到了纳什均衡

如果每阶段冰淇淋只化掉1/3，采用逆向归纳法。

最后一个阶段应该是A在分，如果B拒绝，两人都是0，A的分配不会使B得到的更差，所以为了最大化自己的利益，A便让自己得到1/3，B一丁点也得不到。

为了防止这一点，在第二阶段B分配的时候，就不会让A分到的比1/3少，否则A会拒绝，B就得不到好处了。

B会将剩下的2/3平分，两人各得1/3。

深知这一点后，第一阶段在冰淇淋没化的时候A如果让B得到的不少于1/3，B就不会拒绝。

这样A可以将2/3分给自己，1/3分给B，实现自己利益最大化。

此时便达到了纳什均衡

5.两个寡头企业进行价格竞争博弈，企业1的利润函数是

，企业2的利润函数是

，其中p是企业1的价格，q是企业2的价格。

求：

（1）两企业同时决策的纯策略纳什均衡；

（2）企业1先决策的子博弈完美纳什均衡；

（3）企业2先决策的子博弈完美纳什均衡；

（4）是否存在参数a，b，c的特定值或范围，使得两个企业都希望自己先决策（博弈论习题【1】P9习题三）

6.试分析为什么在很多商业街上麦当劳与肯德基都是选在商业街的中心段，且比邻而居。

（博弈论习题【1】P5最后一句）

假设在一条繁华的商业街有A、B、C、D、E五个商业点可以作为开店的位置，每个商业点消费者数量相同，麦当劳和肯德基可以选择A、B、C、D、E五个地点中任意一个作为店址。

（1）两家店不同时决策。

不妨设肯德基先决策，麦当劳再决策（这也符合中国实际情况，中国肯德基数量为麦当劳的3倍，整体发展优于麦当劳，所以一般会先有肯德基），而消费者会选择距离他们最近的店面去消费，若距离一样，则消费者以等概率选择两家店。

基于以上假设就可以对参与人麦当劳（记为M）、肯德基（记为K）决策进行分析。

K首先进行决策，作为一个理性决策者，K会考虑M的决策。

若K选择A，则M会选择B，此时，K只能得到A的顾客，其收益不妨记为1，而M的收益则为4，这显然不是最优策略。

若K选择B，则M会选择C，在这种情况下，K的收益为2，M的收益为3。

按照这样的思路分析下去，可以得知K选择C是最优策略。

此时，无论M选择哪里作为店址，K的收益都不会小于M。

之后轮到M进行决策，若选择A，则K的收益为3.5，M的收益为1.5，不是最佳应对。

以此对每个店址进行分析，可知M选择C是对K选择C的最佳应对。

在这种情况下，K和M的收益都为2.5，两家店平分所有的顾客，两家店的决策也互为最佳应对，达到了纳什均衡。

所以，肯德基和麦当劳的店址会选择在同一地点。

（2）两家店同时决策。

此时两家店的收益矩阵，如下：

在这种情况下，直接寻找纳什均衡不是那么容易，但是通过上面的收益矩阵可以看出，对于肯德基，策略A和策略E是严格非优策略，因为在肯德基选择A或E的任何场合，它也可以通过选择B来获得一个严格的较高收益。

与此类似，对于麦当劳，策略A和策略E也是严格非优策略，因为在任何场合，麦当劳可以选择通过选择B来获得一个严格的较高收益。

理性的参与人不会有任何兴趣去选择采取一个非优策略，因为那总是可以通过一个其他收益更高的策略来替代。

因此，肯德基不会选择A和E，并且因为麦当劳知道这个博弈的结构，包括肯德基的收益情况，所以麦当劳也知道肯德基不会采取选择A和E。

因此这两个策略在博弈中会被有效的去除。

同样的道理，对于麦当劳也是如此。

这是，我们可以得到一个化简后的博弈收益矩阵，这个矩阵只包括B、C、D三个策略，如下：

这时可以再次发现对于肯德基，策略B和D是严格非优策略，对于麦当劳，策略B和D也是严格非优策略，化简后对于每个参与人都只有一种策略C，即可得到策略组（C，C）。

当然一种更简单和更方便的方法是直接发现该博弈结构中存在纳什均衡（C，C）。

这表明肯德基和麦当劳同时决策时，最后的结果也会是两家店选址在一起。

综合上面的讨论，可见肯德基和麦当劳总是比邻而开，并不是偶然，而是理性博弈后的必然。

7.设有一批选民在一个单位区间从左（x=0）到右（x=1）均匀分布，为一个职位参加竞选的每个候选人同时选择其竞选基地（即在x=0与1之间的一个点）。

选民观察候选人的选择，然后每一投票人把票投给其基地离自己最近的候选人。

比如，如果有两个候选人，他们分别在x=0.3和x=0.6选择基地，则处于x=0.45左边的所有选民都会把票投给候选人1，右边的人都会把票投给候选人2，这样候选人2就可以得到55%的选票赢得这场选举。

假设候选人只关心他能否当选，他们根本一点都不关心其基地。

如果有两个候选人，博弈的纯策略纳什均衡是什么？

（吉本斯1。

8）

8.假定古诺的寡头垄断模型中有n个企业，令qi代表企业i的产量，且Q=q1+……+qn表示市场总产量，p表示市场出清价格，并假设反需求函数由p（Q）=a-Q给出（设Q＜a，其他情况下p=0）.并设企业i生产出的qi的总成本Ci（qi）=cqi，即没有固定成本，且边际成本为常数c，这里设c＜a，根据古诺的假定，企业同时就产量进行决策。

求出博弈的纳什均衡。

当n趋向于无穷时，将会发生什么情况？

（博弈论习题【1】P3第八题）

不完全信息博弈

1.考虑两企业采用伯川德竞争，即静态情况下的价格竞争。

两企业间存在着信息不对称，并且产品存在差异。

对企业i的需求

，两企业的成本都为0。

企业i的需求对企业j价格的敏感程度有可能高，也可能较低，也就是说，bi可能等于bH，也可能等于bL，这里bH﹥bL﹥0。

对每个企业，bi=bH的概率为θ，bi=bH的概率为1-θ，并且与bj的值无关。

每一企业知道自己的bi，但不知道对方的，所有这些都是共同知识。

此博弈中的行动空间、类型空间、推断以及效用函数各是什么？

双方的策略空间各是什么？

此博弈对称的纯策略贝叶斯纳什均衡应满足那些条件？

求出这样的均衡解。

2、试分析下面完全但不完美动态博弈的贝叶斯精炼均衡。

贝叶斯精炼均衡应该满足如下四个条件：

条件1：

在各个信息集处，轮到选择的博弈方必须有关于博弈达到该信息集中每个节点的可能性的“判断”。

对非单节点信息集，一个“判断”就是博弈达到该信息集中各个节点可能性的概率分布，对单节点信息集，则可理解为“判断达到该节点的概率为1”

条件2：

给定轮到选择博弈方的“判断”，他的后续策略必须是“序列理性”的。

即在给定此判断和“其他博弈方后续策略”的情况下，该博弈方其后的行为选择意在使自己的期望得益最大。

条件3：

在均衡路径上的信息集处，“判断”要符合贝叶斯法则和各博弈方的均衡策略。

条件4：

在非均衡路径上的信息集处，“判断”也要符合贝叶斯法则和各博弈方在此处可能有的均衡策略。

当一个策略组合及相应的判断满足这四个条件时称为“完美贝叶斯均衡”。

第一种解释分析：

上图是一个有三个博弈方的三阶段不完美信息动态博弈。

在该博弈中，博弈方3的信息集是一个两节点信息集。

如果博弈方1第一阶段选F，则博弈过程会经历多节点信息集假设博弈方3“判断”博弈方2选L和R的概率分别是p和1-p，最终共有四种可能的结果，各方得益如图所示。

先考察博弈方3的选择，他选U的期望得益为：

，选D的期望得益为，因此当，即p＜l/3时他该选U，当p＞l/3时，他该选D，P=1/3时选U、D或者混合策略都可以。

先假设博弈方3“判断”p＞1/3，此时他的合理选择是D；再来看博弈方2的选择，因为L是他相对于R的严格上策，因此他无需考虑博弈方3在第三阶段如何选择，而唯一地只选择L。

可知，博弈方3“判断”p＞1/3是符合博弈方2的均衡策略的。

又，既然博弈方2只会选L，故，完全符合博弈方2均衡策略的博弈方3的“判断”应该是p=1。

对于博弈方1而言，他知道从博弈方2选择开始的子博弈的均衡必然为（L，D），意味着自己选择F可以获得3单位得益，比选B得益2要好，因此F是他的均衡策略。

均衡策略组合（F，L，D）以及与之相应的博弈方3的“判断”p=1完全符合完美贝叶斯均衡的条件1–3，并且由于在上述策略组合下不存在不在均衡路径上需要判断的信息集，因此条件4自动满足，可以肯定这是一个完美贝叶斯均衡。

第二种解说分析：

由于在该博弈中，从博弈方2的单节点信息集开始的子博弈实际上是一个静态博弈（由于博弈方3对博弈方2的行为具有不完美性，因此相当于他们同时做出行为选择），如下图所示。

显然，该静态博弈有唯一的纳什均衡（L，D），故整个博弈有唯一子博弈完美纳什均衡（F，L，D）。

为了说明条件4的必要性，考察另一个策略组合（B，L，U）及博弈方3相应的“判断”p=0。

该策略组合是一个纳什均衡，原因是不论博弈方1选什么策略，博弈方2的最佳反应对策都是L；而当博弈方3判断p=0的情况下，U是他对博弈方2的最佳反应对策；对于博弈方1来说，当其他两方的策略是（L，U）时，当然是选B合算，从而（B，L，U）满足相互是对对方策略的最佳反应对策。

其次在博弈方3“判断”p=0时，（B，L，U）是序列理性的，且在均衡路径（B）上没有多节点信息集，条件3自动满足。

即策略组合（B，L，U）和博弈方3的“判断”p=O是满足完美贝叶斯均衡的条件1—3的。

然而，仅此就断定它是一个完美贝叶斯均衡是有问题的，因为这时各博弈方得益（2，0，O）是极不理想的。

此时条件4就可以起作用了。

在（B，L，U）策略组合下，博弈方3的信息集正是不在均衡路径上的信息集，但博弈方3在此处的“判断”p=0显然与博弈方2的策略L不相符合。

因此上述策略组合和“判断”不能构成完美贝叶斯均衡，这就把（B，L，U）排除出了完美贝叶斯均衡的范畴，从而使得完美贝叶斯均衡是更加可靠、稳定和合理的均衡概念。

4.分析下图中的博弈可能存在哪几类均衡？

试分析其精炼贝叶斯均衡。

（1）自然选择发送者类型，告诉发送者，接受者不知道发送者真是类型，但类型的概率分布（0.5，0.5）是共同知识。

（2）对于假设存在混同均衡（L，L），成立的条件是接收者对于发送者发送L的信号的反应是选择a1，对发送R的信号的反应是a2——接收者均衡策略为（a1，a2）。

接收者对信号R的反应是选择a2的条件是：

1*q+0（1-q）<0*q+2（1-q），得出q<2/3，所以精炼贝叶斯均衡为（L，L），（a1，a1接收者），p=0.5，q<2/3。

（3）对于混同均衡（R，R）由贝叶斯法则得（q，1-q）=（0.5，0.5），接收者对于信号R的反应是选择a2，类型为t1的发送者支付为0，类型为t2的发送者支付为1，接收者对L的最优反应是a1（无论p为多少），此时t1支付为1，t2支付为2，（R，R）不可能称为混同均衡。

（3）对于分离均衡（L，R），接收者的两个信息集都在均衡路径上，于是p、q都由贝叶斯法则与发送者的策略确定p=1，q=0；给定p=1，接收者对于信号L的反应是选择a1;给定q=0，接收者对于信号R的最优反应是选择a2，t1、t2支付均为1，给定接收者的最优战略（a1，a2），t2有积极性偏离R的策略，所以不存在分离均衡（L，R）

（4）对于分离均衡（R，L），由贝叶斯法则，得到p=0，q=1，给定p=0，接收者对于信号L的反应是选择a1;给定q=1，接收者对于信号R的最优反应是选择a1，t1、t2支付均为2，给定接收者的最优战略（a1，a1），t1、t2均无积极性偏离（R，L），所以[（R，L），（a1，a1），p=1，q=1]为精炼贝叶斯均衡。

5．假设市场上存在着两类工人，以他们的生产率来区分。

kH型工人具有生产率为k=2，而kL型工人的生产率为k=1。

要达到给定的教育水平，花在kL型工人身上的成本要大于花在kH型工人身上的成本。

特别地，对于k型工人，每e个单位的教育成本为c（e；k）=e/k。

对一个k型个人的效用函数为U（w，e；k）=w-c（e；k）。

（a）工人的教育水平影响他的生产率吗？

如果公司和工人具有关于k值得相同的信息，什么是最优的教育水平？

现在假设工人的生产率不能被厂商观察到，但他的教育水平能被厂商观察到。

进一步假设，厂商相信大于或等于某一特定水平ep的教育水平是高生产率的信号，而低于这一教育水平的则是低生产率的信号。

因此厂商提供工资的根据是：

如果e≥ep，则w（e）=2，而如果e﹤ep，则w（e）=1。

（b）给定这些工资，计算每一类代理人会选择的教育水平。

（c）找出有关ep的必要条件，使得教育是一个有效传递生产率的信号。

（d）证明，由（c）得出的ep值，与厂商在均衡处的信念是一致的。

（e）讨论得出的结果

6.两个合伙人必须就其合伙企业进行清算。

合伙人1现在拥有权益份额为s，合伙人2拥有1-s。

两合伙人同意进行如下博弈：

合伙人1提出一个价格p，然后合伙人2可以选择以ps的价格购买合伙人1的股份，或以p（1-s）的价格将自己的股份卖给合伙人1.假设两个合伙人对拥有全部企业价值的估价相互独立，且服从〔0,1〕区间的均匀分布，以上是共同知识，但每一个合伙人的估价是私人信息。

求出博弈的精炼贝叶斯均衡。

解：

设合伙人1、2对拥有全部企业价值的估价分别为v1、v2，收益函数分别为U1、U2,由题目条件可以得出，

U1=ps-v1s当合伙人2向合伙人1购买；

U1=v1s-p（1-s）当合伙人1向合伙人2购买。

U2=ps-v1s当合伙人2向合伙人1购买；

U2=v1s-p（1-s）当合伙人1向合伙人2购买。

由于两个合伙人对拥有全部企业价值的估价相互独立，且服从〔0,1〕区间的均匀分布，由逆向归纳法可以得出该博弈的精炼贝叶斯均衡：

当ps-v1s>v1s-p（1-s）,且v2s-ps>p（1-s）-v2s,即v1

反之，当v2

7.企业和工会进行下面的两阶段谈判博弈。

企业利润π服从o到1之间的均匀分布，工会的保留工资为wr，以上都是共同知识，只有企业才了解π的真实值。

假定0＜wr＜1/2,求出下面博弈的精炼贝叶斯均衡：

a在第一阶段的开始，工会向企业提出一个工资要价w1

b企业或接受或拒绝w1，如果企业接受w1，则两阶段都可以开工生产，于是工会的收益为2w1，企业的收益为2（π-w1）（不考虑贴现因素）。

如果企业拒绝w1，则第一期就没有产出，且企业和工会第一阶段的收益都等于0；

c在第二阶段的开始（假定企业拒绝了w1），企业向工会提出一个工资出价w2；

d工会或接受或拒绝这一出价，如果工会接受w2，则第二期会有产出，于是第二期（也是全部）的收益为工会w2，企业为π-w2（第一期收益为0）.如果工会拒绝w2，则没有产出，工会在第二期赚得其保留工资w，企业关闭，收益为0.

信息经济学习题

1．经理有三个可能的行动

，企业有两个可能的利润水平：

；对应不同选择的利润的概率分别为：

。

假定经理的效用函数为

，其中w是工资收入，

；经理的保留效用为U=0。

（1）如果经理的选择是可观测的，什么是最优工资合同？

（2）证明：

如果经理的选择是不可观测的，那么，没有合同可以使得经历选择a2。

当

满足什么值时，a2是可以实现的。

（3）什么是经理的选择不可观测时的最优激励合同？

（4）假定

，并且

。

如果经理的选择是可观测到的，当x趋向于1时，最优合同是什么？

如果经理的选择不可观测到，当x趋向于1时，最优合同又是什么？

2．考察委托人与代理人之间的关系，其中只存在两种可能结果，一种高xH，一种低xL，每种结果发生的频率取决于代理人的努力

和随机状态变量。

假设

，

。

代理人效用的形式为

，其中

。

委托人的效用函数为

，是递增的凹函数。

（1）写出委托人的有约束的最大化问题，求出决定最优合约的条件

（2）假设代理人的努力不能被观察到，写出在这一情况下定义最优合约的有约束的最大化问题。

描述信息对称情况下与信息不对称情况下最优合约的工资之间的差别。

3．考察委托人与代理人之间的关系，代理人的努力来决定结果。

假设出现的不确定性可以用三种状态来表示。

代理人可以在两种努力水平之间做出选择。

结果如下图

努力

自然状态

ε1

ε2

ε3

e=6

60000

30000

e=4

30000

60000

30000

委托人与代理人都相信每种状态的发生概率为三分之一。

委托人和代理人的效用函数分别为：

，

。

中间所有的结果都是以货币支付表示。

假设代理人只有在他获得的效用水平至少为114时，他才会接受。

（请给出问题解答的基本过程）

（1）从参与人的目标函数中可以得出什么结论？

（2）在对称信息中，努力和工资为多少？

如果委托人不是风险中性的会怎么样？

（3）在不对称信息中，委托人得到努力水平e=4所容许的支付方案如何？

获得努力水平e=6所容许的支付方案如何？

委托人偏好那种努力水平？

请讨论结果

❤解答

（1）委托人是风险中性的，而代理人是风险规避的。

（2）最优合约从以下两个条件中得出：

一、委托人承担所有的风险，以及二、参与约束成立。

如果e=6，那么w满足w½-62=114，其中w=22500。

在这一事例中。

UP=50000-22500=27500。

如果e=4，则w=16900，UP=23100.对称信息境况下的解为：

e*=6，w*=22500。

若委托人不是风险中性的，则两个参与者将共同分摊合约关系中涉及的风险。

（3）如果e=4，最优合约同上：

w=16900，因为给定固定工资，代理人总会选择最低的努力水平。

为了达到e-6，委托人必须提供一份状态依存于结果的合约。

如果结果是60000，他将支付w（60）；如果结果是30000，他将支付w（30）。

合约必须同时满足参与约束和激励约束：

对委托人“花费量尽可能最少”问题的解中，两个约束都成立。

对于两个未知量我们有两个方程，得解：

w（60）=28900，以及w（30）=12100。

委托人的期望效用是UP=26700。

在不对称信息的境况下，委托人还是选择e=6，因为26700>23100，但有效率损失，这由委托人期望利润的减少来衡量（代理人总能获得他的保留效用）。

4．假定一个商人想与一个工人签约，但工人的一些情况商人却不知道。

商人知道这个工人是风险中性的，但是就努力的负效用而论，工人可能是两种类型中的一种。

他的负效用或者是e2，或者是2e2。

即，第二类工人（差的）经受的努力的负效用大于第一类（好的）工人。

因此工人的效用函数取决于他的类型，要么是

，

。

工人是G型的概率为p。

两类工人的保留效用都为0。

商人也是风险中性的，他以

评价工人的努力，其中k是一个足够大的常数，以使监工有兴趣与代理人签约，此常数独立于代理人的类型。

因此，对提供的每一单位努力而言，商人获得k单位的利润。

（1）如果商人对工人的类型拥有完全的信息，请列出公式，并求解商人的问题，即需要的努力水平是多高？

支付的工资是多少？

（2）逆向选择问题出现时，列出此问题的表述模型。

求解问题并计算最优合约的特征。

（3）比较对称信息与不对称信息下的结果，并作分析。

展开阅读全文