博弈论复习题及答案.docx

资源描述

博弈论复习题及答案.docx

《博弈论复习题及答案.docx》由会员分享，可在线阅读，更多相关《博弈论复习题及答案.docx（18页珍藏版）》请在冰豆网上搜索。

博弈论复习题及答案.docx

博弈论复习题及答案

可口可乐与百事可乐（参与者）的价格决策：

双方都可以保持价格不变或者提高价格（策略）；博弈的目标和得失情况体现为利润的多少（收益）；利润的大小取决于双方的策略组合（收益函数）；博弈有四种策略组合，其结局是：

（1）双方都不涨价，各得利润10单位；

（2）可口可乐不涨价，百事可乐涨价，可口可乐利润100，百事可乐利润-30；

（3）可口可乐涨价，百事可乐不涨价，可口可乐利润-20，百事可乐利润30；

（4）双方都涨价，可口可乐利润140，百事可乐利润35；

画出两企业的损益矩阵求纳什均衡。

9、北方航空公司和新华航空公司分享了从北京到南方冬天度假胜地的市场。

如果它们合作，各获得500000元的垄断利润，但不受限制的竞争会使每一方的利润降至60000元。

如果一方在价格决策方面选择合作而另一方却选择降低价格，则合作的厂商获利将为零，竞争厂商将获利900000元。

（1）将这一市场用囚徒困境的博弈加以表示。

（2）解释为什么均衡结果可能是两家公司都选择竞争性策略。

答：

（1）用囚徒困境的博弈表示如下表：

北方航空公司

合作

竞争

新华航空公司

合作

500000，500000

0，900000

竞争

900000，0

60000，60000

（2）如果新华航空公司选择竞争，则北方航空公司也会选择竞争（60000>0）；若新华航空公司选择合作，北方航空公司仍会选择竞争（900000>500000）。

若北方航空公司选择竞争，新华航空公司也将选择竞争（60000>0）；若北方航空公司选择合作，新华航空公司仍会选择竞争（900000>0）。

由于双方总偏好竞争，故均衡结果为两家公司都选择竞争性策略，每一家公司所获利润均为600000元。

12、设啤酒市场上有两家厂商，各自选择是生产高价啤酒还是低价啤酒，相应的利润（单位：

万元）由下图的得益矩阵给出：

（1）有哪些结果是纳什均衡

（2）两厂商合作的结果是什么

答

（1）（低价，高价），（高价，低价）

（2）（低价，高价）

13、A、B两企业利用广告进行竞争。

若A、B两企业都做广告，在未来销售中，A企业可以获得20万元利润，B企业可获得8万元利润；若A企业做广告，B企业不做广告，A企业可获得25万元利润，B企业可获得2万元利润；若A企业不做广告，B企业做广告，A企业可获得10万元利润，B企业可获得12万元利润；若A、B两企业都不做广告，A企业可获得30万元利润，B企业可获得6万元利润。

（1）画出A、B两企业的支付矩阵。

（2）求纳什均衡。

3.答：

（1）由题目中所提供的信息，可画出A、B两企业的支付矩阵（如下表）。

B企业

做广告

不做广告

A企业

做广告

20，8

25，2

不做广告

10，12

30，6

（2）因为这是一个简单的完全信息静态博弈，对于纯策纳什均衡解可运用划横线法求解。

如果A厂商做广告，则B厂商的最优选择是做广告，因为做广告所获得的利润8大于不做广告获得的利润2，故在8下面划一横线。

如果A厂商不做广告，则B厂商的最优选择也是做广告，因为做广告获得的利润为12，而不做广告的利润为6，故在12下面划一横线。

如果B厂商做广告，则A厂商的最优选择是做广告，因为做广告获得的利润20大于不做广告所获得的利润10，故在20下面划一横线。

如果B厂商不做广告，A厂商的最优选择是不做广告，因为不做广告获得的利润30大于做广告所获得的利润25，故在30下面划一横线。

在本题中不存在混合策略的纳什均衡解，因此，最终的纯策略纳什均衡就是A、B两厂商都做广告。

假定两家企业A与B之间就做广告与不做广告展开博弈，它们的报酬矩阵如下：

企业B做广告不做广告企业A做广告100，100300，0不做广告0，300200，2001、这是不是一个“囚犯的困境”2、如果该对局只进行一次，其纳什均衡是什么3.、如果博弈是重复的，但我们不考虑无限次的情形，假设只进行10次对局。

再假定企业A采取的是“以牙还牙”的策略，并在第一次对局中不做广告，企业B也将采取“以牙还牙”的策略。

对企业B，考虑两种不同的情况：

在第一次做广告或第一次不做广告，分别计算这两种情况下企业B的累计利润，试问企业B将如何行动

1、是。

虽然两人都不做广告都能获得较高的收益，但是两人为了各自的利益而不是整体的利益考虑时都会选择做广告。

2、企业B做广告时，企业A做广告的收益100大于不做广告的收益0；企业B不做广告时，企业A做广告的收益300大于不做广告的收益，所以对于企业A做广告时它的，企业B同理，即无论对方选择什么策略，做广告都是对自己最好的策略。

该博弈的结果是两企业都选择做广告，双方各获利100，局中人单独改变策略没有好处。

3、假如B在第一次做广告，则B获利300A获利为0，企业A采取“以牙还牙”的策略在第二次对局中也做广告，则两者的获利各为100，因为企业A已经做广告此时企业B不能以降低利润为代价不做广告，所以企业B累计利润300+100*9=1200；企业B第一次不做广告，在的假设下两者在今后会出现追求私利的现象，有限次数的不能改变囚徒困境原来的均衡结果，企业B的累计利润可能为200+100*9=1100。

16、某产品市场上有两个厂商，各自都可以选择高质量，还是低质量。

相应的利润由如下得益矩阵给出：

（1）该博弈是否存在纳什均衡如果存在的话，哪些结果是纳什均衡

参考答案：

由划线法可知，该矩阵博弈有两个纯策略Nash均衡，即（低质量,高质量），（高质量,低质量）。

乙企业

高质量

低质量

甲企业

高质量

50,50

100,800

低质量

900,600

-20,-30

该矩阵博弈还有一个混合的纳什均衡

Q=a+d-b-c=-970,q=d-b=-120,R=-1380,r=-630，可得

因此该问题的混合纳什均衡为

。

17、甲、乙两企业分属两个国家，在开发某种新产品方面有如下收益矩阵表示的博弈关系。

试求出该博弈的纳什均衡。

如果乙企业所在国政府想保护本国企业利益，可以采取什么措施

乙企业

开发

不开发

甲企业

开发

-10,-10

100,0

不开发

0,100

0,0

解：

用划线法找出问题的纯策略纳什均衡点。

所以可知该问题有两个纯策略纳什均衡点（开发,不开发）和（不开发,开发）。

该博弈还有一个混合的纳什均衡（（

）,（

））。

如果乙企业所在国政府对企业开发新产品补贴a个单位,则收益矩阵变为：

要使（不开发,开发）成为该博弈的唯一纳什均衡点,只需a>10。

此时乙企业的收益为100+a。

18、博弈的收益矩阵如下表：

乙

左

右

甲

上

a，b

c，d

下

e，f

g，h

（1）如果（上，左）是占优策略均衡，则a、b、c、d、e、f、g、h之间必然满足哪些关系（尽量把所有必要的关系式都写出来）

（2）如果（上，左）是纳什均衡，则

（1）中的关系式哪些必须满足

（3）如果（上，左）是占优策略均衡，那么它是否必定是纳什均衡为什么

（4）在什么情况下，纯战略纳什均衡不存在

答：

（1）

，

。

本题另外一个思考角度是从占优策略均衡的定义出发。

对乙而言，占优策略为

；而对甲而言，占优策略为

。

综合起来可得到所需结论。

（2）纳什均衡只需满足：

甲选上的策略时，

，同时乙选左的策略时，

。

故本题中纳什均衡的条件为：

，

。

（3）占优策略均衡一定是纳什均衡，因为占优策略均衡的条件包含了纳什均衡的条件。

（4）当对每一方来说，任意一种策略组合都不满足纳什均衡时，纯战略纳什均衡就不存在。

19、Smith和John玩数字匹配游戏，每个人选择1、2、3，如果数字相同，John给Smith3美元，如果不同，Smith给John1美元。

（1）列出收益矩阵。

（2）如果参与者以1/3的概率选择每一个数字，证明该混合策略存在一个纳什均衡，它为多少

答：

（1）此博弈的收益矩阵如下表。

该博弈是零和博弈，无纳什均衡。

John

Smith

3，-3

-1，1

3，-3

-1，1

3，-3

（2）Smith选（1/3，1/3，1/3）的混合概率时，

John选1的效用为：

John选2的效用为：

John选3的效用为：

类似地，John选（1/3，1/3，1/3）的混合概率时，

Smith选1的效用为：

Smith选2的效用为：

Smith选3的效用为：

因为

，

，所以：

是纳什均衡，策略值分别为John：

；Smith：

。

20、假设双头垄断企业的成本函数分别为：

，

，市场需求曲线为

，其中，

。

（1）求出古诺（Cournot）均衡情况下的产量、价格和利润，求出各自的反应和等利润曲线，并图示均衡点。

（2）求出斯塔克博格（Stackelberg）均衡情况下的产量、价格和利润，并以图形表示。

（3）说明导致上述两种均衡结果差异的原因。

答：

（1）对于垄断企业1来说：

这是垄断企业1的反应函数。

其等利润曲线为：

对垄断企业2来说：

这是垄断企业2的反应函数。

其等利润曲线为：

在达到均衡时，有：

均衡时的价格为：

两垄断企业的利润分别为：

均衡点可图示为：

企业1

200

190

企业2

企业1的反应线

均衡点

（2）当垄断企业1为领导者时，企业2视企业1的产量为既定，其反应函数为：

则企业1的问题可简化为：

均衡时价格为：

利润为：

，

该均衡可用下图表示：

Stackelberg均衡点

企业2的反应线

企业1

200

190

企业2

企业1的反应线

企业2领先时可依此类推。

（3）当企业1为领先者时，其获得的利润要比古诺竞争下多。

而企业2获得的利润较少。

这是因为，企业1先行动时，其能考虑企业2的反应，并以此来制定自己的生产计划，而企业2只能被动地接受企业1的既定产量，计划自己的产出，这是一种“先动优势”

21、在一个由三寡头操纵的垄断市场中，逆需求函数为p=a-q1-q2-q3，这里qi是企业i的产量。

每一企业生产的单位成本为常数c。

三企业决定各自产量的顺序如下：

（1）企业1首先选择q1≥0；

（2）企业2和企业3观察到q1，然后同时分别选择q2和q3。

试解出该博弈的子博弈完美纳什均衡。

答：

该博弈分为两个阶段，第一阶段企业1选择产量q1，第二阶段企业2和3观测到q1后，他们之间作一完全信息的静态博弈。

我们按照逆向递归法对博弈进行求解。

（1）假设企业1已选定产量q1，先进行第二阶段的计算。

设企业2，3的利润函数分别为：

由于两企业均要追求利润最大，故对以上两式分别求一阶条件：

（1）

（2）

求解

（1）、

（2）组成的方程组有：

（3）

（2）现进行第一阶段的博弈分析：

对与企业1，其利润函数为；

将（3）代入可得：

（4）

式（4）对q1求导：

解得：

（5）

此时，

（3）将式（5）代回（3）和（4）有该博弈的子博弈完美纳什均衡：

25、某寡头垄断市场上有两个厂商，总成本均为自身产量的20倍，市场需求函数为Q=200-P。

求

（1）若两个厂商同时决定产量，产量分别是多少

（2）若两个厂商达成协议垄断市场，共同安排产量，则各自的利润情况如何

答：

（1）分别求反应函数，180-2Q1-Q2=0，180-Q1-2Q2=0，Q1=Q2=60

（2）200-2Q=20，Q=90，Q1=Q2=45

26、一个工人给一个老板干活，工资标准是100元。

工人可以选择是否偷懒，老板则选择是否克扣工资。

假设工人不偷懒有相当于50元的负效用，老板想克扣工资则总有借口扣掉60元工资，工人不偷懒老板有150元产出，而工人偷懒时老板只有80元产出，但老板在支付工资之前无法知道实际产出，这些情况双方都知道。

请问：

（1）如果老板完全能够看出工人是否偷懒，博弈属于哪种类型用得益矩阵或扩展形表示该博弈并作简单分析。

（2）如果老板无法看出工人是否偷懒，博弈属于哪种类型用得益矩阵或扩展形表示该博弈并作简单分析。

（1）完全信息动态博弈。

博弈结果应该是工人偷懒，老板克扣。

（2）完全信息静态博弈，结果仍然是工人偷懒，老板克扣。

28、给定两家酿酒企业A、B的收益矩阵如下表：

A企业

白酒

啤酒

B企业

白酒

700，600

900，1000

啤酒

800，900

600，800

表中每组数字前面一个表示B企业的收益，后一个数字表示B企业的收益。

（1）求出该博弈问题的均衡解，是占优策略均衡还是纳什均衡

（2）存在帕累托改进吗如果存在，在什么条件下可以实现福利增量是多少

（3）如何改变上述A、B企业的收益才能使均衡成为纳什均衡或占优策略均衡如何改变上述A、B企业的收益才能使该博弈不存在均衡

答：

（1）有两个纳什均衡，即（啤酒，白酒）、（白酒，啤酒），都是纳什均衡而不是占优策略均衡。

（2）显然，（白酒，啤酒）是最佳均衡，此时双方均获得其最大收益。

若均衡解为（啤酒，白酒），则存在帕累托改善的可能。

方法是双方沟通，共同做出理性选择，也可由一方向另一方支付报酬。

福利由800+900变为900+1000，增量为200。

（3）如将（啤酒，白酒）支付改为（1000，1100），则（啤酒，白酒）就成为占优策略均衡。

比如将（啤酒，白酒）支付改为（800，500），将（白酒，啤酒）支付改为（900，500），则该博弈就不存在任何占优策略均衡或纳什均衡。

30、在纳税检查的博弈中，假设A为应纳税款，C为检查成本，F是偷税罚款，且C

（1）写出支付矩阵。

（2）分析混合策略纳什均衡。

答：

（1）该博弈的支付矩阵如下表：

纳税人

逃税

不逃税

税收机关

检查

A-C+F，-A-F

A-C，-A

不检查

0，0

A，-A

（2）先分析税收检查边际：

因为S为税务机关检查的概率，E为纳税人逃税的概率。

给定E，税收机关选择检查与否的期望收益为：

解

，得：

。

如果纳税人逃税概率小于E，税收机关的最优决策是不检查，否则是检查。

再分析逃税边际：

给定S，纳税人选择逃税与否的期望收益是：

解

，得：

。

即如果税收机关检查的概率小于S，纳税人的最优选择是逃税，否则是交税。

因此，混合纳什均衡是（S，E），即税收机关以S的概率查税，而纳税人以E的概率逃税。

34、假设古诺的双寡头模型中双寡头面临如下一条线性需求曲线：

P=30-Q

其中Q为两厂商的总产量，即Q=Q1+Q2。

再假设边际成本为零，即MC1=MC2=0

解释并讨论此例的纳斯均衡，为什么其均衡是一种囚徒困境。

厂商1的总收益TR1由下式给出：

厂商1的边际收益MR1为：

MR1=30-2Q1-Q2

利用利润最大化条件MR1=MC1=0，得厂商1的反应函数（reactionfunction）或反应曲线为：

Q1=（6-1）

同理可得厂商2的反应曲线为：

Q2=（6-2）

均衡产量水平就是两反应曲线交点Q1和Q2的值，即方程组6-1和6-2的解。

可以求得古诺均衡时的均衡产量水平为：

Q1=Q2=10。

因此，在本例中，两个寡头的总产量Q为Q1+Q2=20，均衡价格为P=30-Q=10。

刚才我们讨论了两寡头厂商相互竞争时的均衡产量。

现在我们放松第（6）条不能串谋的假设，假定两寡头可以串谋。

它们能共同确定产量以使总利润最大化。

这时，两厂商的总收益TR为：

TR=PQ=（30-Q）Q=30Q-Q2

其边际收益MR为：

MR=30-2Q

根据利润最大化条件MR=MC=0，可以求得当Q=15时总利润最大。

如果两厂商同意平分利润，每个寡头厂商将各生产总产量的一半，即Q1=Q2=。

其实，任何相加为15的产量Q1和Q2的组合都使总利润最大化，因此，把Q1+Q2=15称为契约曲线，而Q1=Q2=是契约曲线上的一个点。

我们还可以求得当价格等于边际成本时，Q1=Q2=15，各厂商的利润为零。

35、两家电视台竞争周末黄金时段晚8点到10点的收视率，可选择把较好的节目放在前面还是后面。

他们决策的不同组合导致收视率如下：

（1）如果两家是同时决策，有纳什均衡吗

有（前面，后面）

（2）如果双方采用规避风险的策略，均衡的结果是什么

此题应用的思想是最大最小收益法：

也就是说，在对手采取策略时，所获得的最小收益中的最大值。

电视台1：

对方采取前面战略的最小收益为18

对方采取后面战略的最小收益为16

固电视台1会选择收益为18的战略——前面

电视台2：

前面的策略是一个优超策略——前面

策略均衡为（前面，前面）

（3）如果电视台1先选择，结果有什么若电视台2先选择呢

（4）如果两家谈判合作，电视台1许诺将好节目放在前面，这许诺可信吗结果能是什么

电视台1许诺将好节目放在前面的许诺不可信。

因为电视台2，前面为占优策略，

而在电视台2，选择前面的时候，电视台1选择后面的收益要大于前面的收益。

所以，最终结果为（前面，后面）

36、如果将如下的囚徒困境博弈重复进行无穷次，惩罚机制为触发策略，贴现因子为δ。

试问δ应满足什么条件，才存在子博弈完美纳什均衡

乙

甲

坦白

不坦白

坦白

4,4

0,5

不坦白

5,0

1,1

参考答案：

由划线法求得该博弈的纯策略纳什均衡点为（不坦白,不坦白），均衡结果为（1,1），采用触发策略，局中人i的策略组合s的最好反应支付

=5,Pi（s*）=4，Pi（sc）=1。

若存在子博弈完美纳什均衡，必须满足：

，即只有当贴现因子

>1/4时，才存在子博弈完美纳什均衡。

37、在Bertrand价格博弈中，假定有n个生产企业，需求函数为P=a-Q，其中P是市场价格，Q是n个生产企业的总供给量。

假定博弈重复无穷多次，每次的价格都立即被观测到，企业使用“触发策略”（一旦某个企业选择垄断价格，则执行“冷酷策略”）。

求使垄断价格可以作为完美均衡结果出现的最低贴现因子δ是多少。

并请解释δ与n的关系。

分析：

此题可分解为3个步骤

（1）n个企业合作，产量总和为垄断产量，价格为垄断价格，然后平分利润。

（2）其中一个企业采取欺骗手段降价，那个这家企业就占有的全部市场，获得垄断利润

（3）其他企业触发战略，将价格降到等于边际成本，所有的企业利润为零。

参考答案：

（1）设每个企业的边际成本为c，固定成本为0

P=a-Q

TR=P*Q=（a-Q）*Q

MR=a-2Q

因为：

MR=MC

a-2Q=c

则:

Q=（a-c）/2

P=（a+c）/2

π=（P-c）*Q=（a-c）2/4

每家企业的利润为（a-c）2/4n

（2）假设A企业自主降价，虽然只是微小的价格调整，但足以占领整个市场，获得所有的垄断利润——（a-c）2/4

（3）其他企业在下一期采取冷酷策略，使得所有企业的利润为0

考虑：

A企业不降价：

（a-c）2/4n，（a-c）2/4n，……

A企业降价：

（a-c）2/4，0，……

使垄断价格可以作为完美均衡结果，就要使得不降价的贴现值大于等于降价的贴现值。

设贴现因子为δ

A不降价的贴现值：

[（a-c）2/4n][1/（1-δ）]

A降价的现值：

（a-c）2/4

于是：

[（a-c）2/4n][1/（1-δ）]≥（a-c）2/4

解得：

δ≥1-1/n

一、若你正在考虑收购一家公司的一万股股票，卖方的开价是2元/股。

根据经营情况的好坏，该公司股票的价值对你来说有1元/股和5元/股两种可能，但只有卖方知道经营的真实情况，你只知经营好、坏的概率各为。

如果公司经营不好时，卖方做到使你无法识别真实情况的“包装”费为5万元，你是否会按卖方的价格买下这些股票如果“包装”费仅为万元，你会如何选择

答：

当卖方使买房无法识别真实情况的包装费为5万元时，买方的股票价值期望值为

E=×﹙1-5﹚+0.5×5=元/股

在这种情况下，无法接受卖方给出的价格

当卖方的包装费为万元时，买方的股票价值期望值为

E=×﹙﹚+0.5×5=元/股

在这种情况下，接受卖方给出的价格

二、现实生活中常常是既有部分卖假冒伪劣产品的厂商会打出“质量三包”、“假一罚十”等旗号，也有一些卖假冒伪劣产品的厂商声明“售出商品概不退换”。

问这两类厂商有什么不同，他们各自战略的根据是什么

答：

第一类厂商实行战略的根据是：

“最大最小战略”，根据无限次重复博弈中的子博弈精炼纳什均衡实际上是参与人相互合作的结果，要使合作成功，其战略中必须要有惩罚措施。

所谓最小最大战略是指当违规者不采取合作行为而对他进行惩罚时，违规者可能得到的最严厉的制裁的战略。

第二类厂商采取战略的根据是：

“冷酷战略”，任何为了短期利益的背叛行为的所得对长期利益而言都是微不足道的，且会遭到对方一直背叛的冷酷打击，故参与人有积极性为自己建立一个乐于合作的声誉，同时也有积极性惩罚对方的背叛行为。

三、在有两个投标者的暗标拍卖中，投标者的估价独立分布于[0，1]且两人的估价相同，则贝叶斯纳什均衡是什么博弈的结果是什么如果两投标者知道他们的估价是相同的，结果会发生什么变化

解：

两个人投标人为i，j,投标者i的支付如下：

最终解得，拍卖的对称贝叶斯均衡战略为∶

同理可得，对投标人j也可得到相同的结论

即，在只有两个投标人时，这个博弈的贝叶斯均衡是，每个投标人的出价是其实际价值的一半。

如果两个投标者知道他们的估价相同，即信息是完全的，买者之间的竞争将使卖者得到买者价值的全部。

在一个长长的沙滩上，姑且将沙滩的长度定为1，有许多游泳和享受日光浴的游客，平均分布在这个沙滩上。

张三和李四在沙滩上卖矿泉水，假设每个游客只到离自己最近的摊位购买且仅购买一瓶矿泉水。

现在，将沙滩的左端尽头定为0，那么沙滩的右边就是1，请问张三和李四应当如何布置他们的矿泉水摊才可以最大化自己的销售量

两次重复下面这个得益矩阵表示的两人静态博弈。

问能否有一个精炼纳什均衡战略组合，实现第一阶段的得益是（4，4）如能，给出双方的战略，如不能，证明为什么不能。

如果战略组合（x3，y1）的得益改为（1，5），会发生什么变化，至少能在部分阶段实现（4，4）的条件是什么

答：

（1）该博弈有两个纯战略纳什均衡（X1，Y1）（X2，Y2），支付函数分别为（3，1）和（1，2），但对双方均有利的战略组合（X3,Y3）不是纳什均衡，因此在一次博弈中不可能出现。

（2）采用“触发战略”，即首先试探合作，如果对方合作，则给予奖励；如果对方不合作，则给予惩罚。

我们先假设这种触发策略可行，则第一阶段合作两方的策略为（X3,Y3），支付为（4，4），第二阶段合作双方的策略为（X1,Y1）或（X2,Y2），此时支付分别为（3,1）和（1,2）达到纳什均衡。

采用触发战略的两个参与人的战略是：

参与人X的战略：

第一次选X3，则参与人Y为了收益最大必定会选择Y3，此时的策略为（X3，Y3）。

在种情况下，

展开阅读全文