博弈论谢识予第四五章参考答案.docx

资源描述

博弈论谢识予第四五章参考答案.docx

《博弈论谢识予第四五章参考答案.docx》由会员分享，可在线阅读，更多相关《博弈论谢识予第四五章参考答案.docx（18页珍藏版）》请在冰豆网上搜索。

博弈论谢识予第四五章参考答案.docx

博弈论谢识予第四五章参考答案

第四章参考答案

2、火车站和机场餐饮商业服务的顾客往往都是一次性的，回头客、常客比较少,这些经济交易具有一次性博弈的特征，它们的价格总是较高而质量乂会差一些，顾客也会尽量不在这些地方购买商品和消费。

在一般商业区和居民区的餐饮商业服务则回头客和常客较多，有明显的重复博弈特征，在居民区购买商品和消费的老顾客一般能得到比较公平、优惠的价格，还能得到较好的服务，其至有些还可以信用消费（赊账），因此消费者一般会比较放心地消费。

这就是现实生活中重复博弈和一次性博弈效率不同的典型例子之一。

3、从研究对象和问题特征看，有限次重复博弈研究的主要是有明确结束时间的（合作、竞争等）关系，无限次重复博弈研究的主要是没有明确结果时间，或者

较长期的关系。

从分析方法的角度，动态博弈和重复博弈分析中常用的逆推归纳法在无限次

重复博弈中无法直接运用，因为没有最后一次重复。

因此无限次重复博弈分析的主要方法是构造法，即根据特定效率意义等构造了博弈完美纳什均衡。

此外，也可以运用某些技巧解决问题，如教材中利用三阶段讨价还价博弈分析无限阶段讨价还价博弈的技巧。

从博弈的结果看，无限次重复博弈的效率往往高于有限次重复博弈，有些在有限次重复博弈中无法实现的效率较高的结果，在无限次重复博弈中有可能实现。

例如囚徒的困境型博弈的无限次重复博弈和有限次重复博弈就体现了这种差别。

两类重复博弈民间定理的差异也说明了这一点。

最后，在重复次数不多的有限次重复博弈中不一定要考虑得益贴现问题，在我限次重复博弈问题中这是必须考虑的。

上述区别在理论方面最主要的启发是重视有限次和无限次重复博弈的区别，区分研究这两类博弈问题是非常重要的，在实践方面的主要启发是促进和保持经济关系的长期稳定性，对于提高社会经济效率等常常有非常重要的意义。

6、用画线法容易找岀该博弈的两个纯策略纳什均衡（T,L）和（M,R）o这两个纳什均衡的得益都帕累托劣于（B,S）o一次性博弈中效率较高的（B,S）不可能实现。

但该博弈的结构表明存在双方合作的利益，在两次重复博弈中也有构造惩罚机制的条件，因此我会考虑运用试探合作的触发策略争取部分实现（B,S）,提高博弈的效率。

我作为博弈方1会采用这样的触发策略：

第一次重复采用B；第二次重复时，如果前一次的结果是（B,S）,则采用£如果前一次的结果是其他，则采用T。

如果另一个博弈方有同样的分析能力，或者比较有经验，那么他（或她）也会采用相似的触发策略：

在笫一次重复时采用S；第二次重复时，如果前一次的结果是（B,S）,则采用R,否则采用L。

双方采用上述触发策略构成一个子博弈完美纳什均衡，因此是稳定的。

这时候前一次重复实现了（氏S）,提高了博弈的效率。

当然，上述触发策略也是有风险的，因为当另一个博弈方不理解和没有采用上述策略时，我的得益会较低。

当然如果考虑到人们具有学习进步的能力，而且缺乏分析和学习能力，采用效率较低策略的博弈方长期中会逐步被淘汰掉，那么采用上述触发策略的合理性就得到了进一步的支持。

傅弈方2

博

4,10

弈

6,4

方

0,2

8、

首先很容易看出，博弈方1的D笑相对于T策和M策部是严格下策，因比可以消去，消去博弈方1的D策后四个策略组合中不存在纯策略纳什均衡。

根据混合策略纳什均衡的计算方法，不难算出混合策略纳什均衡为：

博弈方1概率分布（1/2,1/2）在T和M中随机选择，博弈方2则以概率分布（1/3,2/3）在L和R中随机选择。

山于上述静态博弈是没有纯策略纳什均衡的严格竞争博弈，因此在有限次重复博弈和无限次重复博弈中，两博弈方的均衡策略都是简单复重原博弈的混合策略纳什均衡。

补充习题：

1.判断下列表述是否正确，并简单讨论：

a）有限次重复博弈的子博弈完美纳什均衡的最后一次重复必定是原博弈的一个纳什均衡。

参考答案：

正确。

因为最后一次重复就是动态博弈的最后一个阶段，根据

子博弈完美纳什均衡的要求，博弈方在该阶段的选择必须构成纳什均衡。

因为最后一次重复就是原博弈本身，因此该纳什均衡就是原博弈的一个纳什均衡。

b）无限次重复博弈均衡解的得益一定优于原博弈的均衡解的得益。

参考答案：

嗚误。

对于严格竞争的零和博弈，或者不满足合作条件的其它许多博弈来说，无限制重复博弈并不意味着效率的提高，得益不一定高于原博弈的得益。

2.寡头的古诺产量博弈中，如果市场需求P二130-Q,边际成本c二30且没有固定成本，贴现因子5=0.9,如果该市场有长期的稳定性，问两个厂商能否维持垄断产量？

参考答案：

因为市场有长期稳定性，因此可以把两寡头之间的产量博弈看作无限次重复側弈，讨论能否构造双方在垄断产量上合作的子博弈完美纳什均衡。

首先分析上述产量博弈的一次性博弈的纳什均衡。

根据假设，两个厂商

叭=（130-倂一筑冷一30%

的利润函数为:

広，=（1孔一％

利用反应函数法不难求出纳什均衡产量（古诺产量）为

100

勺=q?

此时两个厂商的利润为

10000

兀、==

现在分析垄断产量。

市场总利润函数是:

兀=（130—Q）・0—30。

很容易求得市场总利润最大化的总产量是：

^m=5°

—（130—Qnt）・Q玳-30<>WI=2500

垄断利润为

山于市场是长期稳定的，因此我们把两个厂商的产量博弈看作无限次重复博弈。

假设两厂商都采用开始时生产垄断产量的一半，一旦一方偏离就永远生产古诺产量的触发策略。

这样如果两个厂商都坚持合作，那么两个厂商每阶段各得1250,

17SO

1250（1+/+沪+L）=八=12500

长期总利润的现在值是：

1一5

如果有一个厂商（设为厂商1）偏离，那么因为它的利润函数为：

码=（130-25-％）•町一30乞

因此它会产生产量：

其当前阶段利润为

兀=67.5・37.5—30・37.5=140625

而此后每阶段都只能产生古诺产量和得到利润10000/9o因此偏离的长期总利润现在值为：

=11406.25

因此12500>11406.23,因此坚持垄断产量显然是正确的选择。

这说明在模型假设下，双方都采用上述触发策略是本博弈的子购弈完美纳什均衡，长期维持垄断产量是可能的。

第六章补充习题

1.判断下列表述是否正确，并简单分析：

a）完全不完美信息动态博弈中各博弈方都不清楚博弈的得益。

b）在完全但不完美信息博弈中，若不存在混合策略，并且个博弈方都是主

动选择且行为理性的，则不完美信息从本质上说是假的。

c）子博弈可以从一个多节点信息集开始。

参考答案：

a）错误。

不完美信息博弈屮不一定所有博弈方都不淸楚博弈进程，只要部分或者一个傅弈方不完全清笼其行为之前的博弈进程，就是不完美信息动态傅弈。

b）正确。

因为对于只包含理性博弈方的主动选择行为，利益结构明确，而

且不同路径有严格优劣之分，从不需要用混合策略的动态博弈来说，所有博弈方选择的路径都可以通过分析加以确定和预测，根木无须观察。

从这个意义上说，这个博弈的不完美信息实际上都是“假的

C）错误。

在-个子博弈中出现的信息集必须是完整的，由于从多节点信息集开始的博弈必须分割一个信息集，因此不可能是一个子博弈。

2・如果-种商品的质呆很难在购买时正确判断，岀售在这种商品的卖方乂可以“售出商品，概不退换S问这种商品的市场最终会趋向于怎样的情况？

参考答案：

从短期市场均衡的角度，如果消费者对商品质量缺乏判断能力，而且厂商又不提供任何质量保证，那么消费者是否会购买取决于购买的期望利益。

如果商品对消费者来说并不是必需品，市场匕劣质品比例很高，而且买到劣质品损失很大，从而购买的期望利益、效用很小，还不如不买，那么短期均衡中消费者就不会选择购买。

这是市场短期中就会崩溃。

长期中只有厂商的经营策略和市场情况改善以后才可能重新恢复和发展。

如果反过来商品对消费者来是必须的，消费效用比较人，买到劣质商品的损失也不是很大，或者市场上劣质詁的比例不大，从而购买的期望利益、效用比较大，那么消费者在短期均衡终会选择购买，市场能够存在。

但能够短期存在不等于能够长期维持和发展。

事实上，除非该商品市场是消费需求严重缺乏弹性，市场结构又属于完全垄断的极端情况，否则是总部对消费者做岀质量承诺的厂商和市场肯定是不能氏期维持的，否则会走向消亡，被其它商品、其它厂商所替代。

3.假设在一价二F车模型中V二5000元，W二1000元，P二3000元，差车的概率是0.6。

再假设政府可以控制厂商的伪装成本C,但每一单位C政府自己有0.5单位成本，而政府的效用是交易中卖方的利益减去政府自己的成本。

问该博弈的完美贝叶斯均衡是什么？

参考答案：

为了简单期间我们仍然根据只有买方

卖方两个博弈方的一价模型的扩展形进行分析。

不卖

根据上述扩展形我们不难清楚，假设政府选择的CX3000,那么买卖双方博弈的市场均衡一定是市场失败类型或接近失败的，因此差车伪装出售有利可图，而在好车差车都卖的情况下买方选择买的期望利益为0・4X2000+0.6X（-2000）二-40（X0。

在市场完全失败时因为买方的利益为0,因此政府的效用肯定是非正的；在市场接近失败时买方的利益（期望得益）同样也是0,因此政府的效用肯定也是非正的。

现在假设政府选择的C正好满足03000,例如3001等。

这时候买卖双方的博弈均衡是市场完全成功类型的，也就是好车全卖，差车不会卖，买方则会买。

这时候交易买方的利益是2000,而政府提高C的成本只需要1500左右，因此政府有正的效用。

根据上述分析不难得出结论，在上述存在政府选择的二手车交易模型中，政府选择把C提高到3000以上，好车的卖方选择卖，差车的卖方选择不卖，买方选择买，构成该博弈的一个市场完全成功类型的完美贝叶斯均衡。

4、简述完全但不完美信息动态博弈的完美贝叶斯均衡必须满足的要求。

参考答案：

完美贝叶斯均衡必须满足下列四个要求：

要求1：

在各个信息集，轮到

选择的博弈方必须具有一个关于博弈达到该信息集中每个节点可能性的“判断S要求2：

给定各博弈方的“判断S他们的策略必须是“序列理性”的。

要求3：

在均衡路径上的信息集处，“判断”山贝叶斯法则和各博弈方的均衡策略所决定。

要求4：

在不处于均衡路径上的信息集处，“判断”由贝叶斯法则和各博弈方在此处可能有的均衡策略所决

定。

不完全信息部分

1.直接机制在拍卖规则没计中有什么意义？

（7-3）

2.古玩市场的交易中买卖双方的后悔都来自于自己对古玩价值判断的失误，若预先对价值的判断是正确的，那么交易者肯定不会后悔。

3.从不完全信息博弈的角度，从高到低叫价的荷兰式拍卖和暗标拍卖之间是否有相似性？

4.运用海萨尼转换以后，不完全信息动态博弈与完全但不完美信息动态博弈基本上是相同的吗？

5.在位者公司和可能进入者的盈利矩阵如下：

扩展成本低扩展成本高

在位

者、

进入者、

扩展

不扩長

在位者进入者

扩展

不扩展

逬入

-1,2

逬入

-1,-1

1,I

不进入

0,4

0,3

不进入

0,0

0,3

将其进行Harsanyi转换。

并求在高成本概率为1/3时，该博弈的Nash均衡。

6•两户居民同时决定是否维护某合用的设施。

如果只要有一户人家维护，两户人家就都能得到1单位好处；没有人维护则两户人家均没有好处。

设两户人家维护的成本不同，分别为C1和C2。

（1）如果假设C1和C2分别是0・1和0.5,

该博弈的纳什均衡是什么？

博弈结果会如何？

（2）如果C1和C2都是独立均匀分布在［0,1］上的随机变量，且真实水平只有每户人家自己知道，该博弈的贝叶斯纳什均衡是什么？

7.（7--7）若

（1）“自然”以均等的概率决定得益是下述得益矩阵1的情况还是得益矩阵2的情况，并让博弈方1知道而不让博弈方2知道；

（2）博弈方1在T和B中选择，同时博弈方2在L和R中进行选择。

找出该静态贝叶斯博弈的所有

纯策略贝叶斯纳什均衡。

得益矩阵1

得益矩阵2

7^^

1,1

0,0

2,2

8.双寡头古诺产量竞争模型中厂商i的利润函数为）（jiiiiqqtq—Ji,i=b2。

若11二t是两个厂商的共同知识，而2t则是厂商2的私人信息，厂商1只知道2t为3/4或4/5,且2t取这两个值的概率相等。

若两个厂商同时选择产量，请找出该博弈的纯策略贝叶斯均衡。

参考答案：

1•答：

直接机制在拍卖规则设汁个最大的意义在于可以简化拍卖规则的设计。

因为理论证明任何一个贝叶斯纳什均衡都可以用一个说实话购直接机制取代表（揭示原理）,而任何拍卖规则对应的拍卖博弈都可以用贝叶斯纳什均衡进行分析和预测，这说明任何拍卖规则实现的结果肯定能用直接机制加以实现，这可以在很大程度上简化拍卖规则设计。

进一步在理论上，直接机制及其与拍卖博弈贝叶斯纳什均衡之间的关系，也揭示了在拍卖博弈或其他包含激励问题的机制设计问题中，通过机制设计所能达到效

果的最大限度。

因为说实话的直接机制包含获取信息的成本（鼓励激励对象揭示真实情况的代价）,拍卖博弈等的贝叶斯纳什均衡与一个说实话的直接机制等价,说明任何拍卖规则或其他激励机制设计能达到的最理想效果，就是激励对象的真实情况所决定的最大潜在出价或努力，减去上述信息成本。

2•不正确。

即使自己对古玩价值的判断是完全正确的，仍然有可能后悔。

因为古玩交易的价格和利益不仅取决于古玩的实际价值和自己的估价，还取决对于对方的估价和园艺接受的成交价格，因此仅仅自己做出正确的估价并不等于实现了最大的潜在利益。

3.解答：

从不完全信息博弈的角度，荷兰式拍卖与无底价的暗标拍卖其实基本上是相同的。

因为虽然荷兰式拍卖的公开叫价与暗标拍卖的密封标书拍卖在形式上有较大差异，但这两种拍卖方式中各个博弈方的信息状态是相同的，最高价中标的拍卖规则也是相同的，而且荷兰式拍卖中各个竞拍者在参与竞拍时事实上事先必须有一个心理价位，这个价值与暗标拍卖中密封在信封中的标价应该相同，得到的最终结果也相同。

因此从不完全信息博奔的角度，荷兰式拍卖与暗标拍卖实质上是相同的。

这两种拍卖方式的主要不同是适用的拍卖标的物不同，附加规则、条件的难易程度不同，以及不同的形式和现场气氛对参加者会产生不同的心理作用等。

（不扩展，扩展）表示当成本为高时在位者采取不扩展而当成本低时在位者采取扩展行动，这是在位者的严格占优策略。

当高成本的概率为1/3时，进入者的期望得益为1/3X1+2/3X（-1）=—1/3,不进入的期望得益为0。

所以｛不进入，

（不扩展，扩展）｝是博弈的纳什均衡。

5•正确。

事实上，不完全信息动态博弈与不完美信息动态博弈本质上常常是相同的，是一种博弈问题的两种不同的理解方法，而将他们联系起来的桥梁正是海萨尼转换。

6.（1：

这是完全信息的情况，得益矩阵如下：

Try

提供

不提供

提供

090.5

0.9,1

不提供

1,0.5

0,0

根据矩阵中的得益情况容易得出该博弈有两个纯策略纳什均衡，（提供，不提供）和（不提供，提供），还有一个混合策略纳什均衡。

在这儿个纳什均衡中第一个的效率是最高的，而且也是所有策略织合中总得益最高的，因此双方都采用这个均衡结果最理想。

但因为这时候笫一户人家没有实现最大得益，而且相对得益反而比对方差，因此属于能者多劳、吃亏的不合理情况。

这种均衡在现实中并不总是很容易实现，除非居民之间能够发展出一种补偿机制给第一户居民合理的补偿。

（2）对于C1和C2都是独立均匀分布在［0,1］上的悄况，假设居民1采用如下的临界值策略：

当3〈1C时采用“提供”策略；当3>1C时采用'‘不提供”策略。

假设居民2采用如下的临界值策略：

当tc〈2时采用“提供”策略；当tc〉2时采用“不提供”策略。

此时居民1提供的概率是3,不提供的概率是1-3;厂商2提供的概率是仁下提供的概率是-1。

从居民1的角度来看，选择提供和不提供的期望得益分别为：

1111）1）（l（）l（cctct——和ttt=-^o）l（l

当提供的期望得益大于不提供的期望得益时，居民1才会采用提供。

也就是tcYll时会提供，由此得到临界值:

Z13。

从居民2的角度来看，选择提供和不提供的期望得益分别为：

2221）1）（1（）1（CCC——一33和333二T0）1（1

当提供的期望得益大于不提供的期望得益时，居民2才会采用提供。

也就是3-〈12c时会提供，由此得到临界值：

3=1仁

结合上述两个临界值公式得，满足1二+3t时上述临界值策略组合都是这个博弈的贝叫期纳什均衡。

因此这个博弈有无数的均衡解。

7.假设丿•商1的产量是lq,厂商2在2t=3/4和2t=5/4时的产量分别是1Q2和hq2,则厂商2在两种情况下的得益函数分别为：

咒、=彳;C3—%-q：

）和咒、=X、（5一/一公）

厂商1的期望函数为：

上平=+倂（I一纟一4）+*硏（1一岀一硝）

用反应函数法，将上述得益和期望得益函数分别对lq2、h

q2和lq求一阶偏导

并令为0,解得反应函数后再联立可解得：

乞=1/3,4=5/24；力=11/24

这就是该博弈的纯策略贝叶斯纳什均衡。

8.在这个静态贝叶斯博弈中，博弈方1的策略是私人信息类型的函数：

当“自然”选择得益矩阵1时选择T,当“自然”选择得益矩阵2时选择Bo

博弈方2的策略则根据期望利益最大化决定。

博弈方2选择L策略的期望得益为

0.5X1+0.5X0=0.5；选择R策略的期望得益为0.5X0+0.5X2=1,因此博奔方2必定选择Ro

所以该博弃的纯策略贝叶斯纳什均衡只有：

博弈方1在“自然”选择得益矩阵1时选择T,当“自然”选择得益矩阵2时选择B：

博弈方2选择Ro

博弈论第四、五章

3・有限次童复博弈和无限次重复博弈有什么区别？

这些区别对我们有什么启发？

从研究对象和问题特征看•有限次重复博弈研究的主要是有明确结束时间的（合作、竞争等）关系，无限次重复博弈硏究的主要是没有明确结束时间，或者较长期的关系勺

从分析方法的角度，动态博弈和重复博弈分析中常用的逆推归纳法在无限次重复博弈中无法直接运用，因为没有最后一次重复。

因此无限次重复博弈分析的主要方法是构造法，即根据特定效率意义等构造子博弈完美纳什均衡。

此外，也可以运用某些技巧解决问题，如教材中利用三阶段讨价还价博弈分析无限阶段讨价还价博弈的技巧。

从博弈的结果看，无限次重复博弈的效率往往高于有限次重复博弈，冇些在右限次垂复博弈中无法实现的效率较高的结果，在无限次重复博弈中有可能实现。

例如囚徒的困境型博弈的无限次顎复博弈和有限次重复轉弈就体现了这种差别。

两类重复博弈民间定理的差并也说明了这一点。

最后，在重复次数不多的有限次重复博弈中不一定要考虑得益贴现问题，在无限次重复博弈问题中这是必须考虑的C

上述区别在理论方面对我攸最主要的启发是重视有限次和无限次重复博弈的区别，区分研究这两类博弈问题是非常重要的，在实践方面的主要启发绘促进和保持经济关系的长期稳定性，对于提高社会经济效率等常常有非常重要的倉义。

4・若三次壷复2.3.1的古诺模型■子博弈完美纳什均衡是什么？

秦考苓案？

N3.1的古诺模型是一个典型的囚徒的困境型博弈，有惟一

的纯策略纳什均衡。

根据关于有惟一纯策略纳什均衡的有限次重复博弈的定理，这个三次垂复博弈的子博弈完美纳什均衡是，两个厂商在每次重复时都会采用--次性博弈的纳什均衡，也就是2单位的古诺产量。

5.分析两次BM2.4.2中制式问题时双方的均衡策略。

参考答案：

教材2.4.2中制式问题的得益矩阵如下：

.厂商2

1.3

0.0

2,2

很显然，该博弈有两个纯策略纳什均衡（A,A）和（B,B）,而且两个纯策略纳什均衡相互之间没有帕累托意义上的优劣关系•厂商1偏好后者而厂商2偏好前者。

本博弈还有一个混合策略纳什均衡,期望得益更低，因为有一定的概率，结果是（A,B）秋B,A）o

根据重疑博弈了博弈完美纳什均衡的定义，上迖原博弈的两次垂复博弈的子博弈完美纳什均衡有好多种，包括两次重复原博弈的纯策略纳什均衡（A,A）或（B,B〉，一次采用（A,A）和一次采用（B,X）,此外还有車复混合策略纳什均衡，或者先后采用一次混令策略均衡和一次两纯策略纳什均衡之一。

因为上述各种策略组合都是子博弈完美纳什均衡，而且其中没有对双方都比较有利的，因此在没有更多信息的情况下•该重复博弈的结果并不能完全确定。

6・两次曲复下面的得益矩阵表示的静态博弈。

如果你星陣弈方1■你会采用怎样的策略。

博弈方2

LRS

12,

】0

TMB博弈方1

矣考移案：

用画线法容易找出该博弈的两个纯策略纳什均衡（T,L）和（M,R）。

这两个纳什均衡的得益都帕累托劣于（B,S）c一次性博弈中效率较高的（B,S）不可能实现。

但该博弈的结构表明存在双方合作的利益，在两次重复博弈中也有构造惩罚机制的条件，因此我会考虑运用试探合作的触发策略争取部分实现（B.S）,提高博弈的效率。

我作为博弈方1会采用这样的触发策略：

第一次磴复采用B；第•.次重复时、如果前一次的结果杲（B.S）,则采用M.如果前一次的结果是其他，则采用T」

如呆另一个博弈方有同样的分析能力、或者比较有经验，那么他（或她）也会采用相似的触发策略：

在第一次垂复时采用S;第二次重复时，如果前一次的结果是（bS）,则采用R,否则采用L。

双方采用上述触发策略构成一个子博弈完美纳什均衡，因此杲稳定的二这时候前一次重复实现了（B,S）,提髙了博弈的效率。

当然，上述触发策略也是冇风险的，因为当另一个博弈方不理解和没有采用匕述策略时，我的得益会狡低。

当然如果考虑到人们具有学习进步的能力，而且缺乏分析和学习能力，采用效率较低策略的博弈方长期中会逐步被淘汰掉，那么采用上述触发策略的合理性就得到了进-•步的支持。

8.求出下列得益矩阵表示的静态博弈的纳什均衡，并说明有限次和无限次直复该博弈时两博弈方的均衡策略。

參考答案：

首先很容易看出•博弈方】的D策相对卩T策和M策都足:

严格下策，因此可以消去c消去博弈方1的D策后四个策略组合中不存在纯策略纳什均衡。

根据混合策略纳什均衡的计算方法.不难算岀混合炙略纳什均衡为：

博弈方1以概率分布（1/2,1/2）

在T和M中随机选择，博弈方2则以概率分布（1/3,2/3）在L和R中随机选择。

由于上述静态磚弈是没冇纯策略纳什均衡的严格竞争博弈,因此在有限次重复時弈和无限次車复博弈中，两博弈方的均衡策略都是简单重星原博弈的混合策略纳什均衡。

第五章

1.有限理性博弈方之间的博弈与完全理性博弈方之间

展开阅读全文