博弈论习题参考答案.docx

资源描述

博弈论习题参考答案.docx

《博弈论习题参考答案.docx》由会员分享，可在线阅读，更多相关《博弈论习题参考答案.docx（12页珍藏版）》请在冰豆网上搜索。

博弈论习题参考答案.docx

博弈论习题参考答案

《博弈论》习题参考答案（第2次作业）

一、选择题

1.B2.C3.A4.A5.B6.ABCD

7.C8.B9.C

二、判断正误并说明理由

1.F上策均衡是比纳什均衡更严格的均衡概论

2.T上策均衡是比纳什均衡更严格的均衡概论

3.T博弈类型按局中人数多少分为单人博弈、双人博弈和多人博弈

4.F博弈双方偏好存在差异的条件下，一个博弈模型中可能存在2个纳什均衡，如性别战

5.T零和博弈指参与博弈各方在严格竞争下，一方收益等于另一方损失，博弈各方收益与损失之和恒为零，所以双方不存在合作可能性

6.T上策均衡是通过严格下策消去法（重复剔除下策）所得到的占优策略，只能有一个纳什均衡

7.F纳什均衡是上策的集合，指在给定的别人策略情况下，博弈方总是选择利益相对较大的策略，并不保证结果是最好的。

8.F局中人总是以自己的利益最大化选择自己的策略，并不以对方收益的变化为目标

9.T纳什均衡是上策的集合，指在给定的别人策略情况下，没有人会改变自己的策略而减低自己的收益

10.F局中人总是以自己的利益最大化选择自己的策略，并不以对方收益的变化为目标

11.F局中人总是以自己的利益最大化选择自己的策略，并不以对方收益的变化为目标

12.T虽然斯塔格伯格模型各方利润总和小于古诺模型，但是领导者的利润比古诺模型时高

三、计算与分析题

1、

（1）画出A、B两企业的损益矩阵。

B企业

做广告

不做广告

A企业

做广告

20，8

25，2

不做广告

10，12

30，6

（2）求纯策略纳什均衡。

（做广告，做广告）

2、画出两企业的损益矩阵求纳什均衡。

（1）画出A、B两企业的损益矩阵

百事可乐

原价

涨价

可口可乐

原价

10，10

100，-30

涨价

-20，30

140，35

（2）求纳什均衡。

两个：

（原价，原价），（涨价，涨价）

3、假定某博弈的报酬矩阵如下：

甲

乙

左

右

上

a,b

c,d

下

e,f

g,h

（1）如果（上，左）是上策均衡，那么，a>?

b>?

f>?

答：

a>e,b>d,f>h,g

（2）如果（上，左）是纳什均衡，上述哪几个不等式必须满足？

答：

a>e,b>d

4、答：

（1）将这一市场用囚徒困境的博弈加以表示。

北方航空公司

合作

竞争

新华航空公司

合作

500000，500000

0，900000

竞争

900000，0

60000，60000

（2）解释为什么均衡结果可能是两家公司都选择竞争性策略。

答：

若新华选择“竞争”，则北方也会选择“竞争”（60000>0）；若新华选择“合作”，北方仍会选择“竞争”（900000>500000）。

若北方选择“竞争”，新华也将选择“竞争”（60000>0）；若北方选择“合作”，新华仍会选择“竞争”（900000>0）。

由于“竞争”为双方的占优策略，故均衡结果为两家公司都选择竞争性策略。

5、博弈的收益矩阵如下表：

乙

左

右

甲

上

a，b

c，d

下

e，f

g，h

（1）如果（上，左）是占优策略均衡，则a、b、c、d、e、f、g、h之间必然满足哪些关系？

答：

从占优策略均衡的定义出发：

对甲而言，策略“上”（a,c）优于策略“下”（e,g）；

对乙而言，策略“左”（b,f）优于策略“右”（d,h）。

所以结论是：

a>e,b>d,f>h,c>g

（2）如果（上，左）是纳什均衡，则

（1）中的关系式哪些必须满足？

答：

纳什均衡只需满足：

a>e,b>d,

（3）如果（上，左）是上策均衡，那么它是否必定是纳什均衡？

为什么？

答：

占优策略均衡一定是纳什均衡，因为占优策略均衡的条件包含了纳什均衡的条件。

（4）在什么情况下，纯策略纳什均衡不存在？

答：

当对每一方来说，任意一种策略组合都不满足纳什均衡时，纯战略纳什均衡就不存在。

7、求纳什均衡。

小猪

按

等

大猪

按

5，1

4，4

等

9，-1

0，0

纳什均衡为：

大猪“按”，小猪“等”，即（按，等）

6、

乙

低价

高价

甲

低价

100，800

50，50

高价

-20，-30

900，600

（1）有哪些结果是纳什均衡？

答：

（低价，低价），（高价，高价）

（2）两厂商合作的结果是什么？

答：

（高价，高价）

8、用反应函数法结合划线法，求出下列博弈的所有纯策略纳什均衡。

参与人1

参与人2

甲

乙

丙

丁

2,3

3,2

3,4

0,3

4,4

5,2

0,1

1,2

3,1

4,1

1,4

10,2

3,1

4,1

-1,2

10,1

参与人1的反应函数：

（2）=B,若2选择甲

=B,若2选择乙

=A,若2选择丙

=C或D,若2选择丁

参与人2的反应函数：

（1）=丙,若2选择A

=甲,若2选择B

=丙,若2选择C

=丙,若2选择D

求共集，得纯策略纳什均衡为（B，甲）与（A，丙）

9、求出下面博弈的纳什均衡（含纯策略和混合策略）。

甲

乙

5,0

0,8

2,6

4,5

解：

（1）纯策略Nash均衡：

由划线法可知，该矩阵博弈没有纯策略Nash均衡。

（2）混合策略Nash均衡

设甲选择“U”的概率为P1，则选择“D”的概率为1-P1

乙选择“L”的概率为P2，则选择“R”的概率为1-P2

对甲而言，最佳策略是按一定的概率选“U”和“D”，使乙选择“L”和“R”的期望值相等

即P1*0+（1-P1）*6=P1*8+（1-P1）*5

解得P1=1/9

即（1/9,8/9）按1/9概率选“U”、8/9概率选“D”为甲的混合策略Nash均衡

对乙而言，最佳策略是按一定的概率选“L”和“R”，使乙选择“U”和“D”的期望值相等

即P2*5+（1-P2）*0=P2*2+（1-P2）*4

解得P2=4/7

即（4/7,3/7）按4/7概率选“L”、3/7概率选“R”为乙的混合策略Nash均衡

10、根据两人博弈的损益矩阵回答问题：

甲

乙

左

右

上

2,3

0,0

下

0,0

4,2

（1）写出两人各自的全部策略。

答：

全部策略：

（上，左），（上，右），（下，左），（下，右）

（2）找出该博弈的全部纯策略纳什均衡。

答：

由划线法可知，该矩阵博弈全部纯策略Nash均衡为

（上，左）和（下，右）两个

（3）求出该博弈的混合策略纳什均衡。

解：

设甲选择“上”的概率为P1，则选择“下”的概率为1-P1

乙选择“左”的概率为P2，则选择“右”的概率为1-P2

对甲而言，最佳策略是按一定的概率选“上”和“下”，使乙选择“左”和“右”的期望值相等

即P1*3+（1-P1）*0=P1*0+（1-P1）*2

解得P1=2/5

即（2/5,3/5）按2/5概率选“上”、3/5概率选“下”为甲的混合策略Nash均衡

对乙而言，最佳策略是按一定的概率选“左”和“右”，使乙选择“上”和“下”的期望值相等

即P2*2+（1-P2）*0=P2*0+（1-P2）*4

解得P2=2/3

即（2/3,1/3）按2/3概率选“左”、1/3概率选“右”为乙的混合策略Nash均衡

11、某寡头垄断市场上有两个厂商，总成本均为自身产量的20倍，市场需求函

数为Q=200-P。

求：

（1）若两个厂商同时决定产量，产量分别是多少？

（2）若两个厂商达成协议垄断市场，共同安排产量，则各自的利润情况如何？

（3）用该案例解释囚徒困境。

答：

（1）由已知条件Q=200-P，P=200-Q

TC1=20q1，TC2=20q2q1+q2=Q

可得1,2厂商的利润函数分别为：

K1=Pq1-TC1=（200-（q1+q2））q1-20q1=180q1-q12-q1q2

K2=Pq2-TC2=（200-（q1+q2））q2-20q2=180q2-q22-q1q2

令dK/dq1=0得厂商1的反应函数为180-2Q1-Q2=0，

令dK/dq2=0得厂商2的反应函数为180-Q1-2Q2=0，

联解可得q1=q2=60

K1=K2=3600

（2）由已知条件Q=200-P，P=200-Q

TC=TC1+TC2=20q1+20q2=20Q

可得1,2厂商的总利润函数为：

K=PQ-TC=（200-Q）Q-20Q=180Q-Q2

令dK/dQ=0得Q=90,q1=q2=45

K=PQ-TC=（200-Q）Q-20Q=180Q-Q2=8100

K1=K2=4050

（3）将q1=45,q2=60和q1=60,q2=45分别代入1,2厂商的利润函数

可得1,2厂商的利润为：

K1（q1=45,q2=60）=Pq1-TC1=（200-（q1+q2））q1-20q1=180q1-q12-q1q2=3375

K1（q1=60,q2=45）=Pq1-TC1=（200-（q1+q2））q1-20q1=180q1-q12-q1q2=4500

K2（q1=45,q2=60）=Pq2-TC2=（200-（q1+q2））q2-20q2=180q2-q22-q1q2=4500

K1（q1=60,q2=45）=Pq1-TC1=（200-（q1+q2））q1-20q1=180q1-q12-q1q2=3375

厂商2

合作（q2=45）

不合作（q2=60）

厂商1

合作（q1=45）

4050，4050

3375，4500

不合作（q1=60）

4500，3375

3600，3600

根据划线法，可得厂商1.2的上策是（不合作，不合作）即（3600,3600）

双方利润均低于（合作，合作）（4050,4050）显然它属于“囚徒困境”

13、（市场威慑）考虑下面一个动态博弈：

首先，在一个市场上潜在的进入者选择是否进入，然后市场上的已有企业（在位者）选择是否与新企业展开竞争。

在位者可能有两种类型，温柔型（左图）和残酷型（右图），回答下面问题。

进入者

在位者

进入

不进入

默许

斗争

（20，30）

（-10，0）

（0，100）

进入者

在位者

进入

不进入

默许

斗争

（-10，25）

（0，100）

（10，20）

左图：

温柔型右图：

残酷型

（1）找出给定在位者的两种类型所分别对应的纳什均衡，以及子博弈精炼纳什均衡

（1）温柔型在位者的纳什均衡为（进入,默认）

残酷型在位者的纳什均衡为（不进入,（进入，斗争））

（2）已有企业为温柔型的概率至少多少时，新企业才愿意进入？

四、论述题

1、解释“囚犯困境”，并举商业案例说明。

（1）假设条件举例：

两囚徒被指控是一宗罪案的同案犯。

他们被分别关在不同的牢房无法互通信息。

各囚徒都被要求坦白罪行。

如果两囚徒都坦白，各将被判入狱5年；如果两人都不坦白，两囚徒可以期望被从轻发落入狱2年；如果一个囚徒坦白而另一个囚徒不坦白，坦白的这个囚徒就只需入狱1年，而不坦白的囚徒将被判入狱10年。

（2）囚徒困境的策略矩阵表。

每个囚徒都有两种策略：

坦白或不坦白。

表中的数字分别代表囚徒甲和乙的得益。

囚徒乙

坦白

不坦白

囚徒甲

坦白

-5，-5

-1，-10

不坦白

-10，-1

-2，-2

（3）分析：

通过划线法可知：

在囚徒困境这个模型中，纳什均衡就是双方都“坦白”。

给定甲坦白的情况下，乙的最优策略是坦白；给定乙坦白的情况下，甲的最优策略也是坦白。

而且这里双方都坦白不仅是纳什均衡，而且是一个上策均衡，即不论对方如何选择，个人的最优选择是坦白。

其结果是双方都坦白。

（4）商业案例：

寡头垄断厂商经常发现它们自己处于一种囚徒的困境。

当寡头厂商选择产量时，如果寡头厂商们联合起来形成卡特尔，选择垄断利润最大化产量，每个厂商都可以得到更多的利润。

但卡特尔协定不是一个纳什均衡，因为给定双方遵守协议的情况下，每个厂商都想增加生产，结果是每个厂商都只得到纳什均衡产量的利润，它远小于卡特尔产量下的利润。

2、解释并讨论古诺的双寡头模型的纳什均衡。

为什么其均衡是一种囚徒困境？

见上课笔记

或计算题第11题

3、用“小偷与守卫的博弈”说明“激励（监管）悖论”。

（1）假设条件举例：

偷窃和防止偷窃是小偷和门卫之间进行博弈的一场游戏。

门卫可以不睡觉，或者睡觉。

小偷可以采取偷、不偷两种策略。

如果小偷知道门卫睡觉，他的最佳选择就是偷；如果门卫不睡觉，他最好还是不偷。

对于门卫，如果他知道小偷想偷，他的最佳选择是不睡觉，如果小偷采取不偷，自己最好去睡觉。

（2）小偷与门卫的支付矩阵表（假定小偷在门卫睡觉时一定偷成功，在门卫不睡觉时偷一定会被抓住）：

门卫

睡觉

不睡觉

小偷

偷

1，-1

-2,0

不偷

0,2

0,0

（3）分析：

通过划线法可知：

这个博弈是没有纳什均衡的。

门卫不睡觉，小偷不偷，双方都没有收益也没有损失；门卫不睡觉，小偷偷，门卫因为是本职工作得不到奖励，小偷被判刑丧失效用2单位；门卫睡觉，小偷不偷，门卫睡觉的很愉快得到效用2单位，小偷没有收益也没有损失；门卫睡觉，小偷偷，门卫因失职被处分而丧失效用1单位，小偷偷窃成功获得效用1单位。

（4）“激励（监管）悖论”说明：

现实中，我们看到，当门卫不睡觉时，偷窃分子便收敛一阵；严打的时期一过，偷窃分子又开始兴风作浪，在不能容忍小偷过分猖狂的时候，门卫不得不再次开始认真。

即偷的小偷越多，那么不睡觉的门卫将会越多，偷的小偷越少，不睡觉的门卫将越少；反过来，不睡觉的门卫越多，偷的小偷就越少，不睡觉的门卫越少，偷的小偷就越多。

如果偷窃集团倾巢出动，那么门卫的选择也是全部不睡觉，但门卫一旦全部不睡觉，小偷最好选择全部不偷，小偷一旦选择全部不偷，门卫最好全部选择睡觉。

（5）结论：

加重对小偷的处罚在长期中并不能抑制偷窃（而只能使门卫偷懒）；加重处罚失职门卫恰恰是会降低偷窃发生的概率。

这种门卫和小偷的博弈所揭示的，政策目标和政策结果之间的这种意外关系，常被称为“激励的悖论”。

展开阅读全文