博弈论复习题及答案.docx

资源描述

博弈论复习题及答案.docx

《博弈论复习题及答案.docx》由会员分享，可在线阅读，更多相关《博弈论复习题及答案.docx（34页珍藏版）》请在冰豆网上搜索。

博弈论复习题及答案.docx

博弈论复习题及答案

博弈论

判断题（每小题1分，共15分）

囚徒困境说明个人的理性选择不一定是集体的理性选择。

（V）

子博弈精炼纳什均衡不是一个纳什均衡。

（X）若一个博弈出现了皆大欢喜的结局，说明该博弈是一个合作的正和博弈。

（）

博弈中知道越多的一方越有利。

（X）纳什均衡一定是上策均衡。

（X）

上策均衡一定是纳什均衡。

（V）

在一个博弈中只可能存在一个纳什均衡。

（X）在一个博弈中博弈方可以有很多个。

（V）在一个博弈中如果存在多个纳什均衡则不存在上策均衡。

（V）

在博弈中纳什均衡是博弈双方能获得的最好结果。

（X）在博弈中如果某博弈方改变策略后得益增加则另一博弈方得益减少。

（X）

上策均衡是帕累托最优的均衡。

（X）因为零和博弈中博弈方之间关系都是竞争性的、对立的，因此零和博弈就是非合作博弈。

（X）

在动态博弈中，因为后行动的博弈方可以先观察对方行为后再选择行为，因此总是有利的。

（X）

在博弈中存在着先动优势和后动优势，所以后行动的人不一定总有利，例如：

在斯塔克伯格模型中，企业就可能具有先动优势。

囚徒的困境博弈中两个囚徒之所以会处于困境，无法得到较理想的结果，是因为两囚徒都不在乎坐牢时间长短本身，只在乎不能比对方坐牢的时间更长。

（X）

纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合。

（V）不存在纯战略纳什均衡和存在惟一的纯战略纳什均衡，作为原博弈构成的有限次重复博弈，共同特点是重复博弈本质上不过是原博弈的简单重复，重复博弈的子博弈完美纳什均衡就是每次重复采用原博弈的纳什均衡。

（V）多个纯战略纳什均衡博弈的有限次重复博弈子博弈完美纳什均衡路径：

两阶段都采用原博弈同一个纯战略纳什均衡，或者轮流采用不同纯战略纳什均衡，或者两次都采用混合战略纳什均衡，或者混合战略和纯战略轮流采用。

（V）如果阶段博弈G={A1,A2,…,An;u1,u2,…,un）具有多重Nash均衡，那么可能（但不必）存在重复博弈G（T）的子博弈完美均衡结局，其中对于任意的t

（V）（或：

如果阶段博弈G={A1,A2,…,An;u1,u2,…,un）具有多重Nash均衡，那么该重复博弈G（T）的子博弈完美均衡结局，对于任意的t

）零和博弈的无限次重复博弈中，所有阶段都不可能发生合作，局中人会一直重复原博弈的混合战略纳什均衡。

（V）（或：

零和博弈的无限次重复博弈中，可能发生合作，局中人不一定会一直重复原博弈的混合战略纳什均衡。

（X））原博弈惟一的纳什均衡本身是帕雷托效率意义上最佳战略组合，符合各局中人最大利益：

采用原博弈的纯战略纳什均衡本身是各局中人能实现的最好结果，符合所有局中人的利益，因此，不管是重复有限次还是无限次，不会和一次性博弈有区别。

（V）原博弈惟一的纳什均衡本身是帕雷托效率意义上最佳战略组合，符合各局中人最大利益，但惟一的纳什均衡不是效率最高的战略组合，存在潜在合作利益的囚徒困境博弈。

（V）（或：

原博弈惟一的纳什均衡本身是帕雷托效率意义上最佳战略组合，符合各局中人最大利益，不存在潜在合作利益的囚徒困境博弈。

（X））根据参与人行动的先后顺序，博弈可以划分为静态博弈（staticgame）和动态博弈（dynamicgame）。

如果阶段博弈G有唯一的Nash均衡，那么对任意有限次T,重复博弈G（T）有唯一的子博弈完美结局：

在每一阶段取G勺Nash均衡策略。

（V）

四、名词解释（每小题3分，共15分）

参与人（player）指的是博弈中选择行动以最大化自己效用（收益）的决策主体，参与人有时也称局中人，可以是个人，也可以是企业、国家等团体；

策略（strategy）是参与人选择行动的规则，如“以牙还牙”是一种策略；

信息（information）是指参与人在博弈中的知识，尤其是有关其他参与人的特征和行动的知识；

支付（payoff）函数是参与人从博弈中获得的效用水平，它是所有参与人策略或行动的函数，是每个参与人很关心的东西；

结果（outcome）是指博弈分析者感兴趣的要素的集合，常用支付矩阵或收益矩阵来表示；

均衡（equilibrium）是所有参与人的最优策略或行动的组合。

静态博弈指参与人同时选择行动或虽非同时但后行动者并不知道先行动者采取什么

样的行动；

动态博弈指参与人的行动有先后顺序，且后行动者能够观察到先行动者所选择的行

动。

博弈就是一些个人、队组或其他组织，面对一定的环境条件，在一定的规则下，同时或先后，一次或多次，从各自允许选择的行为或策略中进行选择并加以实施，各自取得相应结果的过程。

零和博弈：

也称“严格竞争博弈”。

博弈方之间利益始终对立，偏好通常不同

变和博弈：

零和博弈和常和博弈以外的所有博弈。

合作利益存在，博弈效率问题的重要

性。

完全信息静态博弈

即各博弈方同时决策，且所有博弈方对各方得益都了解的博弈。

上策：

不管其它博弈方选择什么策略，一博弈方的某个策略给他带来的得益始终高于其它的策略，至少不低于其他策略的策略

上策均衡：

一个博弈的某个策略组合中的所有策略都是各个博弈方各自的上策，必然是该博弈比较稳定的结果

严格下策：

不管其它博弈方的策略如何变化，给一个博弈方带来的收益总是比另一种策略给他带来的收益小的策略

合作博弈

非合作博弈

零和博弈

常和博弈

变和博弈

上策均衡

纳什均衡

纳什均衡：

在博弈G二｛S,…Sn；ui厂Un｝中，如果由各个博弈方的各一个策略组成的某个策略组合*（s*L4）中，任一博弈方的策略，都是对其余博弈方策略的组合（S，Si丄Si1,…Sn）

的最佳对策，也即U（s*,…sWs+.s；）》Ui（S*,…S*」,Sj,s出…s；）

对任意sjeS

都成立，则称（s*,…s：

）为的一个纳什均衡

（或纳什均衡是指这样一种策略组合，这种策略组合由所有参与人的最优策略组成，即给定别人策略的情况下，没有任何单个参与人有积极性选择其他策略，从

而没有任何参与人有积极性打破这种均衡。

）

完全信息博弈

混合策略：

在博弈G二⑹…u：

｝中，博弈方i的策略空间

为S琨环,…％｝，则博弈方以概率分布Pi=（Pii,…PQ随机

在其k个可选策略中选择的“策略”，称为一个“混合策略”，其中

°期“对j=…k都成立，且…+瓜日

帕累托上策均衡''

风险上策均衡

聚点均衡

重复博弈

指同样结构的博弈重复多次，其中的每次博弈称为“阶段博弈”。

阶段博弈

重复博弈中的每次博弈称为“阶段博弈”。

贴现因子

下一期的一单位支付在这一期的价值。

触发战略（TriggerStrategy）

首先试探合作，一旦发现对方不合作，则也用不合作相报复的战略。

子博弈精炼纳什均衡

（夫妻博弈）一对新婚夫妻为晚上看什么电视节目争执不下，丈夫（记为I方）

要看足球比赛节目，而妻子（记为U方）要看戏曲节目•他们新婚燕尔，相亲相

爱，所以若这方面的行动不一致，则是很伤感情的•因此，这对夫妻间的争执是一次非零和对策。

二、计算与分析题（每小题15分，共45分）

1、无限次重复博弈与有限重复博弈的区别：

a.无限次重复博弈没有结束重复的确定时间。

在有限次重复博弈中，存在最后一次重复正是破坏重复博弈中局中人利益和行为的相互制约关系，使重复博弈无法实现更高效率均衡的关键问题。

b.无限次重复博弈不能忽视不同时间得益的价值差异和贴现问题，必须考虑后一期得益的贴现系数，对局中人和博弈均衡的分析必须以平均得益或总得益的现值为根据。

c.无限次重复博弈与有限次重复博弈的共同点：

试图“合作”和惩罚“不合作”是实现理想均衡的关键，是构造高效率均衡战略的核心构件。

2、可口可乐与百事可乐（参与者）的价格决策：

双方都可以保持价格不变或者

提高价格（策略）；博弈的目标和得失情况体现为利润的多少（收益）；利润

的大小取决于双方的策略组合（收益函数）；博弈有四种策略组合，其结局是：

（1）如果双方都不涨价，各得利润10单位；

（2）如果可口可乐不涨价，百事可乐涨价，可口可乐利润100，百事可乐利润

-30；

（3）如果可口可乐涨价，百事可乐不涨价，可口可乐利润-20，百事可乐利润

30；

（4）如果双方都涨价，可口可乐利润140，百事可乐利润35；

求纳什均衡。

博弈的稳定状态有两个：

都不涨价或者都涨价（均衡），均衡称为博弈的解。

3、猪圈里有一头大猪和一头小猪，猪圈的一头有一个饲料槽，另一头装有控制

饲料供应的按钮。

按一下按钮就会有10个单位饲料进槽，但谁按谁就要付出2个单位的成本。

谁去按按纽则谁后到；都去按则同时到。

若大猪先到，大猪吃到

9个单位，小猪吃到一个单位；若同时到，大猪吃7个单位，小猪吃3个单位；

若小猪先到，大猪吃六个单位，小猪吃4个单位。

各种情况组合扣除成本后的支付矩阵可如下表示（每格第一个数字是大猪的得益，第二个数字是小猪的得益）：

小猪

按等待

大猪按5，14,4

等待9，-10，0

求纳什均衡。

在这个例子中，我们可以发现，大猪选择按，小猪最好选择等待，大猪选择不按，小猪还是最好选择等待。

即不管大猪选择按还是不按，小猪的最佳策略都是等待。

也就是说，无论如何，小猪都只会选择等待。

这样的情况下，大猪最好选择是按，因为不按的话都饿肚子，按的话还可以有4个单位的收益。

所以纳什均衡是（大猪按，小猪等待）。

4、根据两人博弈的支付矩阵回答问题:

2,3

0,0

4,2

（1）写出两人各自的全部策略，并用等价的博弈树来重新表示这个博弈（6分）

⑵找出该博弈的全部纯策略纳什均衡，并判断均衡的结果是否是Pareto有效

（3）求出该博弈的混合策略纳什均衡。

（7分）

⑴策略

甲：

乙：

博弈树

（草图如下：

（2）PureNE（A,a）;（B,b）

都是Pareto有效，仅（B,b）是K—H有效。

（3）MixedNE（（2/5,3/5）;（2/3,1/3））5、用反应函数法求出下列博弈的所有纯战略纳什均衡。

参与人2

参与人

2,3

3,2

3,4

0,3

4,4

5,2

0,1

1,2

3,1

4,1

1,4

10,2

3,1

4,1

-1,2

10,1

解答：

纯策略纳什均衡为（B,&）与（A,c）

分析过程：

设两个参与人的行动分别为

印和a2,

B,如果a?

彳的舷B,如果a2=b

playerl的反应函数R（a）=二

A,如果a2=c

Q或者D,如果a2=d

c,如果a=A

player2的反应函数R2（a）二戶如果印_B

2（ai）c,如果a—C

c,如果a^i=D

交点为（B,&）与（A,c）,因此纯策略纳什均衡为（B,&）与（A,c）6（entrydeterrenee市场威慑）考虑下面一个动态博弈：

首先，在一个市场上潜在的进入者选择是否进入，然后市场上的已有企业（在位者）选择是否与新企业展开竞争。

在位者可能有两种类型，温柔型（左图）和残酷型（右图），回答下面问题。

（1）找出给定在位者的两种类型所分别对应的纳什均衡，以及子博弈精炼纳什均衡（12分）

（2）已有企业为温柔型的概率至少多少时，新企业才愿意进入（8分）

（1）温柔NE（in,accommodate）和（out,fight）。

SPNE为（in,accommodate）

残酷NE（out,fight）.SPNE同理

⑵20p-10（1-p）=0得到p=1/3

8、博弈方1和博弈方2就如何分10,000元钱进行讨价还价。

假设确定了以下规则：

双方同时提出自己要求的数额A和B,0

如果A+B

<10,000,贝U两博弈方的要求得到满足，即分别得A和B，但如果A+B>10,

000,则该笔钱就没收。

问该博弈的纳什均衡是什么？

如果你是其中一个博弈方，你会选择什么数额？

为什么？

答十、纳什均衡有无数个。

最可能的结果是（5000,5000）这个聚点均衡。

9、北方航空公司和新华航空公司分享了从北京到南方冬天度假胜地的市场。

如果它们合作，各获得500000元的垄断利润，但不受限制的竞争会使每一方的利润降至60000元。

如果一方在价格决策方面选择合作而另一方却选择降低价格，则合作的厂商获利将为零，竞争厂商将获利900000元。

（1）将这一市场用囚徒困境的博弈加以表示。

（2）解释为什么均衡结果可能是两家公司都选择竞争性策略。

答：

（1）用囚徒困境的博弈表示如下表：

北方航空公司

合作

竞争

新华航空公司

合作

500000,500000

0,900000

竞争

900000,0

60000,60000

（2）如果新华航空公司选择竞争，则北方航空公司也会选择竞争（60000>0）；若新华航空公司选择合作，北方航空公司仍会选择竞争（900000>500000。

若北方航空公司选择竞争，新华航空公司也将选择竞争（60000>0）;若北方航空公司选择合作，新华航空公司仍会选择竞争（900000>0）。

由于双方总偏好竞争，故均衡结果为两家公司都选择竞争性策略，每一家公司所获利润均为600000元。

12、设啤酒市场上有两家厂商，各自选择是生产咼价啤酒还是低价啤酒，相应的利润（单位：

万元）由下图的得益矩阵给出：

厂商B

低价高价

（1）有哪些结果是纳什均衡？

（2）两厂商合作的结果是什么？

答

（1）（低价，高价），（高价，低价）

（2）（低价，高价）

13、A、B两企业利用广告进行竞争。

若A、B两企业都做广告，在未来销售中，A企业可以获得20万元利润，B企业可获得8万元利润；若A企业做广告，B企业不做广告，A企业可获得25万元利润，B企业可获得2万元利润；若A企业不做广告，B企业做广告，A企业可获得10万元利润，B企业可获得12万元利润；若A、B两企业都不做广告，A企业可获得30万元利润，B企业可获得6万元利润。

（1）画出A、B两企业的支付矩阵。

（2）求纳什均衡。

3.答：

（1）由题目中所提供的信息，可画出AB两企业的支付矩阵（如下

表）

B企业

做广告

不做广告

A企业

做广告

20,8

25,2

不做广告

10,12

30,6

（2）因为这是一个简单的完全信息静态博弈，对于纯策纳什均衡解可运用划横线法求解。

如果A厂商做广告，则B厂商的最优选择是做广告，因为做广告所获得的利润8大于不做广告获得的利润2,故在8下面划一横线。

如果A厂商不做广告，则B厂商的最优选择也是做广告，因为做广告获得的利润为12,而不做广告的利润为6,故在12下面划一横线。

如果B厂商做广告，则A厂商的最优选择是做广告，因为做广告获得的利润20大于不做广告所获得的利润10，故在20下面划一横线。

如果B厂商不做广告,A厂商的最优选择是不做广告，因为不做广告获得的利润30大于做广告所获得的利润25,故在30下面划一横线。

在本题中不存在混合策略的纳什均衡解，因此，最终的纯策略纳什均衡就是

A、B两厂商都做广告。

15、求出下面博弈的纳什均衡

（含纯策略和混合策略）。

乙

甲

5,0

0,8

2,61

4,5

由划线法易知，该矩阵博弈没有纯策略Nash均衡

可得如下不等式组

Q=a+d-b-c=7,q=d-b=4,R=0+5-8-6=-9,r=-1

可得混合策略Nash均衡（（丄,8）,（4,

9977

16、某产品市场上有两个厂商，各自都可以选择高质量，还是低质量。

相应的利润由如下得益矩阵给出：

（1）该博弈是否存在纳什均衡？

如果存在的话，哪些结果是纳什均衡？

参考答案：

由划线法可知，该矩阵博弈有两个纯策略Nash均衡，即（低质量，高质量），（高质量，低质量）。

乙企业

如果乙企业所在国政府想保护本国企业利

17、甲、乙两企业分属两个国家，在开发某种新产品方面有如下收益矩阵表示的博弈关系。

试求出该博弈的纳什均衡

益，可以米取什么措施？

乙企业

一―10,—10

100卫—

]0,100

0,0」

所以可知该问题有两个纯策略纳什均衡点（开发,不开发）和（不开发,开发）。

该博弈还有一个混合的纳什均衡（（10,1）,（10,1））o

11111111

如果乙企业所在国政府对企业开发新产品补贴

：

10,X0+a100,01

I0,100+a0,0

a个单位，则收益矩阵变为：

要使（不开发，开发）成为该博弈的唯一纳什均衡点，只需

a>10。

此时乙企业的收益为100+a。

18、博弈的收益矩阵如下表:

乙

左

右

甲

上

a，b

c，d

下

e，f

g，h

（1）如果（上，左）是占优策略均衡，则a、b、c、d、e、f、g、h之间必

然满足哪些关系？

（尽量把所有必要的关系式都写出来）

（2）如果（上，左）是纳什均衡，则

（1）中的关系式哪些必须满足？

（3）如果（上，左）是占优策略均衡，那么它是否必定是纳什均衡？

为什么？

（4）在什么情况下，纯战略纳什均衡不存在？

答：

（1）ae，cg，bd，fh。

本题另外一个思考角度是从占优策略

均衡的定义出发。

对乙而言，占优策略为（b,f）（d,h）;而对甲而言，占优策略为

（a,c）.（e,g）。

综合起来可得到所需结论

（2）纳什均衡只需满足：

故本题中纳什均衡的条件为：

甲选上的策略时，bd，同时乙选左的策略时，a.e。

bd，a.e。

（3）占优策略均衡一定是纳什均衡，因为占优策略均衡的条件包含了纳什均衡的条件。

（4）当对每一方来说，任意一种策略组合都不满足纳什均衡时，纯战略纳什均衡就不存在。

19、Smith和John玩数字匹配游戏，每个人选择1、2、3，如果数字相同，John给Smith3美元，如果不同，Smith给John1美元。

（1）列出收益矩阵。

（2）如果参与者以1/3的概率选择每一个数字，证明该混合策略存在一个纳什均衡，它为多少？

答：

（1）此博弈的收益矩阵如下表。

该博弈是零和博弈，无纳什均衡。

John

Smith

3，-3

-1，1

3，-3

-1，1

3，-3

（2）Smith选（1/3，1/3，1/3）的混合概率时,

1111

John选2的效用为：

U2二11■-（；）・丄1二-—

3333

1111

John选3的效用为：

U3=-1■-1■-（-3）=--

3333

类似地，John选（1/3，1/3，1/3）的混合概率时,

Smith选1的效用为：

u1二-31（-1）」（-1）=丄

3333

Smith选2的效用为：

U2J（-1）•丄3-（-1）J

3333

1111

Smith选3的效用为：

U3二-（-1）」（-1）•-3=-

3333

因为U1=U2=U3，u1=U2=u3，所以:

（対据知是纳什均衡，策略值分别为John：

UV；Smith:

20、假设双头垄断企业的成本函数分别为：

G-20Q1，C2-2Q2，市场需求曲线

为P=400-2Q，其中，Q=Q1Q2。

（1）求出古诺（Cournot）均衡情况下的产量、价格和利润，求出各自的反应和等利润曲线，并图示均衡点。

（2）求出斯塔克博格（Stackelberg）均衡情况下的产量、价格和利润，并以图形表示。

（3）说明导致上述两种均衡结果差异的原因。

答：

（1）对于垄断企业1来说：

max[400-2（QiQ2）]Qi-20Qi

190-Q2

=Q1:

这是垄断企业1的反应函数。

其等利润曲线为：

皿=380Q1-2Q1Q2—2Q?

对垄断企业2来说：

max[400-2（Q1Q2）]Q2—2Q2=■Q2=50—Q1

这是垄断企业2的反应函数。

其等利润曲线为：

兀2=400Q2-2Q1Q2-4Q2

在达到均衡时，有:

Q1严侶工

Qt=80

‘02=30

均衡时的价格为：

P=400—2x（80+30）=180

两垄断企业的利润分别为：

卜1=38080-28030-280—12800

二2=40030-28030-4302=3600

均衡点可图示为：

（2）当垄断企业1为领导者时，企业2视企业1的产量为既定，其反应函数为：

Q2=50-Qi/4

则企业1的问题可简化为：

max4002心+50°1曲20Q!

14丿」

p=280/3

=©=80/3

均衡时价格为：

f28080、

400_2〔上严1=160

I33丿

利润为：

皿=39200/3，兀2=25600/9

该均衡可用下图表示:

企业2领先时可依此类推。

|（3）当企业1为领先者时，其获得的利润要比古诺竞争下多。

而企业2获得的利润较少。

这是因为，企业1先行动时，其能考虑企业2的反应，并以此来制定自己的生产计划，而企业2只能被动地接受企业1的既定产量，计划自己的产出，这是一种“先动优势”

21、在一个由三寡头操纵的垄断市场中，逆需求函数为p=a-qi-q2-q3，这里qi是

企业i的产量。

每一企业生产的单位成本为常数c。

三企业决定各自产量的顺序如下：

（1）企业1首先选择q1>0;⑵企业2和企业3观察到q1，然后同时分别选择q2和q3。

试解出该博弈的子博弈完美纳什均衡。

答：

该博弈分为两个阶段，第一阶段企业1选择产量q1，第二阶段企业2和3

观测到q1后，他们之间作一完全信息的静态博弈。

我们按照逆向递归法对博弈进行求解。

（1）假设企业1已选定产量q1，先进行第二阶段的计算。

设企业2,3的利润函数分别为：

二2=（a-q1-q2_q3）q2_cq2

二3=（a_q1—q2-'q3）q2-'Cq3

由于两企业均要追求利润最大，故对以上两式分别求一阶条件：

d）

；：

二2

_=a_q1-耳_q3_c=0q

3=a_qi_q2_2q3_c=0P3

求解（i）、

（2）

展开阅读全文