博弈论习题参考答案.docx

上传人:b****5 文档编号:7738752 上传时间:2023-01-26 格式:DOCX 页数:12 大小:25.94KB
下载 相关 举报
博弈论习题参考答案.docx_第1页
第1页 / 共12页
博弈论习题参考答案.docx_第2页
第2页 / 共12页
博弈论习题参考答案.docx_第3页
第3页 / 共12页
博弈论习题参考答案.docx_第4页
第4页 / 共12页
博弈论习题参考答案.docx_第5页
第5页 / 共12页
点击查看更多>>
下载资源
资源描述

博弈论习题参考答案.docx

《博弈论习题参考答案.docx》由会员分享,可在线阅读,更多相关《博弈论习题参考答案.docx(12页珍藏版)》请在冰豆网上搜索。

博弈论习题参考答案.docx

博弈论习题参考答案

《博弈论》习题参考答案(第2次作业)

一、选择题

1.B2.C3.A4.A5.B6.ABCD

7.C8.B9.C

二、判断正误并说明理由

1.F上策均衡是比纳什均衡更严格的均衡概论

2.T上策均衡是比纳什均衡更严格的均衡概论

3.T博弈类型按局中人数多少分为单人博弈、双人博弈和多人博弈

4.F博弈双方偏好存在差异的条件下,一个博弈模型中可能存在2个纳什均衡,如性别战

5.T零和博弈指参与博弈各方在严格竞争下,一方收益等于另一方损失,博弈各方收益与损失之和恒为零,所以双方不存在合作可能性

6.T上策均衡是通过严格下策消去法(重复剔除下策)所得到的占优策略,只能有一个纳什均衡

7.F纳什均衡是上策的集合,指在给定的别人策略情况下,博弈方总是选择利益相对较大的策略,并不保证结果是最好的。

8.F局中人总是以自己的利益最大化选择自己的策略,并不以对方收益的变化为目标

9.T纳什均衡是上策的集合,指在给定的别人策略情况下,没有人会改变自己的策略而减低自己的收益

10.F局中人总是以自己的利益最大化选择自己的策略,并不以对方收益的变化为目标

11.F局中人总是以自己的利益最大化选择自己的策略,并不以对方收益的变化为目标

12.T虽然斯塔格伯格模型各方利润总和小于古诺模型,但是领导者的利润比古诺模型时高

三、计算与分析题

1、

(1)画出A、B两企业的损益矩阵。

B企业

做广告

不做广告

A企业

做广告

20,8

25,2

不做广告

10,12

30,6

(2)求纯策略纳什均衡。

(做广告,做广告)

2、画出两企业的损益矩阵求纳什均衡。

(1)画出A、B两企业的损益矩阵

百事可乐

原价

涨价

可口可乐

原价

10,10

100,-30

涨价

-20,30

140,35

(2)求纳什均衡。

两个:

(原价,原价),(涨价,涨价)

3、假定某博弈的报酬矩阵如下:

 

a,b

c,d

e,f

g,h

(1)如果(上,左)是上策均衡,那么,a>?

b>?

g

f>?

答:

a>e,b>d,f>h,g

(2)如果(上,左)是纳什均衡,上述哪几个不等式必须满足?

答:

a>e,b>d

4、答:

(1)将这一市场用囚徒困境的博弈加以表示。

北方航空公司

合作

竞争

新华航空公司

合作

500000,500000

0,900000

竞争

900000,0

60000,60000

(2)解释为什么均衡结果可能是两家公司都选择竞争性策略。

答:

若新华选择“竞争”,则北方也会选择“竞争”(60000>0);若新华选择“合作”,北方仍会选择“竞争”(900000>500000)。

若北方选择“竞争”,新华也将选择“竞争”(60000>0);若北方选择“合作”,新华仍会选择“竞争”(900000>0)。

由于“竞争”为双方的占优策略,故均衡结果为两家公司都选择竞争性策略。

5、博弈的收益矩阵如下表:

a,b

c,d

e,f

g,h

(1)如果(上,左)是占优策略均衡,则a、b、c、d、e、f、g、h之间必然满足哪些关系?

答:

从占优策略均衡的定义出发:

对甲而言,策略“上”(a,c)优于策略“下”(e,g);

对乙而言,策略“左”(b,f)优于策略“右”(d,h)。

所以结论是:

a>e,b>d,f>h,c>g

(2)如果(上,左)是纳什均衡,则

(1)中的关系式哪些必须满足?

答:

纳什均衡只需满足:

a>e,b>d,

(3)如果(上,左)是上策均衡,那么它是否必定是纳什均衡?

为什么?

答:

占优策略均衡一定是纳什均衡,因为占优策略均衡的条件包含了纳什均衡的条件。

(4)在什么情况下,纯策略纳什均衡不存在?

答:

当对每一方来说,任意一种策略组合都不满足纳什均衡时,纯战略纳什均衡就不存在。

7、求纳什均衡。

小猪

大猪

5,1

4,4

9,-1

0,0

纳什均衡为:

大猪“按”,小猪“等”,即(按,等)

6、

低价

高价

低价

100,800

50,50

高价

-20,-30

900,600

(1)有哪些结果是纳什均衡?

答:

(低价,低价),(高价,高价)

(2)两厂商合作的结果是什么?

答:

(高价,高价)

8、用反应函数法结合划线法,求出下列博弈的所有纯策略纳什均衡。

 

参与人1

参与人2

A

2,3

3,2

3,4

0,3

B

4,4

5,2

0,1

1,2

C

3,1

4,1

1,4

10,2

D

3,1

4,1

-1,2

10,1

参与人1的反应函数:

R1

(2)=B,若2选择甲

=B,若2选择乙

=A,若2选择丙

=C或D,若2选择丁

参与人2的反应函数:

R2

(1)=丙,若2选择A

=甲,若2选择B

=丙,若2选择C

=丙,若2选择D

求共集,得纯策略纳什均衡为(B,甲)与(A,丙)

9、求出下面博弈的纳什均衡(含纯策略和混合策略)。

 

L

R

U

5,0

0,8

D

2,6

4,5

解:

(1)纯策略Nash均衡:

由划线法可知,该矩阵博弈没有纯策略Nash均衡。

(2)混合策略Nash均衡

设甲选择“U”的概率为P1,则选择“D”的概率为1-P1

乙选择“L”的概率为P2,则选择“R”的概率为1-P2

对甲而言,最佳策略是按一定的概率选“U”和“D”,使乙选择“L”和“R”的期望值相等

即P1*0+(1-P1)*6=P1*8+(1-P1)*5

解得P1=1/9

即(1/9,8/9)按1/9概率选“U”、8/9概率选“D”为甲的混合策略Nash均衡

对乙而言,最佳策略是按一定的概率选“L”和“R”,使乙选择“U”和“D”的期望值相等

即P2*5+(1-P2)*0=P2*2+(1-P2)*4

解得P2=4/7

即(4/7,3/7)按4/7概率选“L”、3/7概率选“R”为乙的混合策略Nash均衡

10、根据两人博弈的损益矩阵回答问题:

 

2,3

0,0

0,0

4,2

(1)写出两人各自的全部策略。

答:

全部策略:

(上,左),(上,右),(下,左),(下,右)

(2)找出该博弈的全部纯策略纳什均衡。

答:

由划线法可知,该矩阵博弈全部纯策略Nash均衡为

(上,左)和(下,右)两个

(3)求出该博弈的混合策略纳什均衡。

解:

设甲选择“上”的概率为P1,则选择“下”的概率为1-P1

乙选择“左”的概率为P2,则选择“右”的概率为1-P2

对甲而言,最佳策略是按一定的概率选“上”和“下”,使乙选择“左”和“右”的期望值相等

即P1*3+(1-P1)*0=P1*0+(1-P1)*2

解得P1=2/5

即(2/5,3/5)按2/5概率选“上”、3/5概率选“下”为甲的混合策略Nash均衡

对乙而言,最佳策略是按一定的概率选“左”和“右”,使乙选择“上”和“下”的期望值相等

即P2*2+(1-P2)*0=P2*0+(1-P2)*4

解得P2=2/3

即(2/3,1/3)按2/3概率选“左”、1/3概率选“右”为乙的混合策略Nash均衡

11、某寡头垄断市场上有两个厂商,总成本均为自身产量的20倍,市场需求函

数为Q=200-P。

求:

(1)若两个厂商同时决定产量,产量分别是多少?

(2)若两个厂商达成协议垄断市场,共同安排产量,则各自的利润情况如何?

(3)用该案例解释囚徒困境。

答:

(1)由已知条件Q=200-P,P=200-Q

TC1=20q1,TC2=20q2q1+q2=Q

可得1,2厂商的利润函数分别为:

K1=Pq1-TC1=(200-(q1+q2))q1-20q1=180q1-q12-q1q2

K2=Pq2-TC2=(200-(q1+q2))q2-20q2=180q2-q22-q1q2

令dK/dq1=0得厂商1的反应函数为180-2Q1-Q2=0,

令dK/dq2=0得厂商2的反应函数为180-Q1-2Q2=0,

联解可得q1=q2=60

K1=K2=3600

(2)由已知条件Q=200-P,P=200-Q

TC=TC1+TC2=20q1+20q2=20Q

可得1,2厂商的总利润函数为:

K=PQ-TC=(200-Q)Q-20Q=180Q-Q2

令dK/dQ=0得Q=90,q1=q2=45

K=PQ-TC=(200-Q)Q-20Q=180Q-Q2=8100

K1=K2=4050

(3)将q1=45,q2=60和q1=60,q2=45分别代入1,2厂商的利润函数

可得1,2厂商的利润为:

K1(q1=45,q2=60)=Pq1-TC1=(200-(q1+q2))q1-20q1=180q1-q12-q1q2=3375

K1(q1=60,q2=45)=Pq1-TC1=(200-(q1+q2))q1-20q1=180q1-q12-q1q2=4500

K2(q1=45,q2=60)=Pq2-TC2=(200-(q1+q2))q2-20q2=180q2-q22-q1q2=4500

K1(q1=60,q2=45)=Pq1-TC1=(200-(q1+q2))q1-20q1=180q1-q12-q1q2=3375

厂商2

合作(q2=45)

不合作(q2=60)

厂商1

合作(q1=45)

4050,4050

3375,4500

不合作(q1=60)

4500,3375

3600,3600

根据划线法,可得厂商1.2的上策是(不合作,不合作)即(3600,3600)

双方利润均低于(合作,合作)(4050,4050)显然它属于“囚徒困境”

13、(市场威慑)考虑下面一个动态博弈:

首先,在一个市场上潜在的进入者选择是否进入,然后市场上的已有企业(在位者)选择是否与新企业展开竞争。

在位者可能有两种类型,温柔型(左图)和残酷型(右图),回答下面问题。

 

.

进入者

在位者

进入

不进入

默许

斗争

(20,30)

(-10,0)

(0,100)

进入者

在位者

进入

不进入

默许

斗争

(-10,25)

(0,100)

(10,20)

左图:

温柔型右图:

残酷型

(1)找出给定在位者的两种类型所分别对应的纳什均衡,以及子博弈精炼纳什均衡

(1)温柔型在位者的纳什均衡为(进入,默认)

残酷型在位者的纳什均衡为(不进入,(进入,斗争))

(2)已有企业为温柔型的概率至少多少时,新企业才愿意进入?

 

四、论述题

1、解释“囚犯困境”,并举商业案例说明。

(1)假设条件举例:

两囚徒被指控是一宗罪案的同案犯。

他们被分别关在不同的牢房无法互通信息。

各囚徒都被要求坦白罪行。

如果两囚徒都坦白,各将被判入狱5年;如果两人都不坦白,两囚徒可以期望被从轻发落入狱2年;如果一个囚徒坦白而另一个囚徒不坦白,坦白的这个囚徒就只需入狱1年,而不坦白的囚徒将被判入狱10年。

(2)囚徒困境的策略矩阵表。

每个囚徒都有两种策略:

坦白或不坦白。

表中的数字分别代表囚徒甲和乙的得益。

囚徒乙

坦白

不坦白

囚徒甲

坦白

-5,-5

-1,-10

不坦白

-10,-1

-2,-2

(3)分析:

通过划线法可知:

在囚徒困境这个模型中,纳什均衡就是双方都“坦白”。

给定甲坦白的情况下,乙的最优策略是坦白;给定乙坦白的情况下,甲的最优策略也是坦白。

而且这里双方都坦白不仅是纳什均衡,而且是一个上策均衡,即不论对方如何选择,个人的最优选择是坦白。

其结果是双方都坦白。

(4)商业案例:

寡头垄断厂商经常发现它们自己处于一种囚徒的困境。

当寡头厂商选择产量时,如果寡头厂商们联合起来形成卡特尔,选择垄断利润最大化产量,每个厂商都可以得到更多的利润。

但卡特尔协定不是一个纳什均衡,因为给定双方遵守协议的情况下,每个厂商都想增加生产,结果是每个厂商都只得到纳什均衡产量的利润,它远小于卡特尔产量下的利润。

2、解释并讨论古诺的双寡头模型的纳什均衡。

为什么其均衡是一种囚徒困境?

见上课笔记

或计算题第11题

3、用“小偷与守卫的博弈”说明“激励(监管)悖论”。

(1)假设条件举例:

偷窃和防止偷窃是小偷和门卫之间进行博弈的一场游戏。

门卫可以不睡觉,或者睡觉。

小偷可以采取偷、不偷两种策略。

如果小偷知道门卫睡觉,他的最佳选择就是偷;如果门卫不睡觉,他最好还是不偷。

对于门卫,如果他知道小偷想偷,他的最佳选择是不睡觉,如果小偷采取不偷,自己最好去睡觉。

(2)小偷与门卫的支付矩阵表(假定小偷在门卫睡觉时一定偷成功,在门卫不睡觉时偷一定会被抓住):

门卫

睡觉

不睡觉

小偷

1,-1

-2,0

不偷

0,2

0,0

(3)分析:

通过划线法可知:

这个博弈是没有纳什均衡的。

门卫不睡觉,小偷不偷,双方都没有收益也没有损失;门卫不睡觉,小偷偷,门卫因为是本职工作得不到奖励,小偷被判刑丧失效用2单位;门卫睡觉,小偷不偷,门卫睡觉的很愉快得到效用2单位,小偷没有收益也没有损失;门卫睡觉,小偷偷,门卫因失职被处分而丧失效用1单位,小偷偷窃成功获得效用1单位。

(4)“激励(监管)悖论”说明:

现实中,我们看到,当门卫不睡觉时,偷窃分子便收敛一阵;严打的时期一过,偷窃分子又开始兴风作浪,在不能容忍小偷过分猖狂的时候,门卫不得不再次开始认真。

即偷的小偷越多,那么不睡觉的门卫将会越多,偷的小偷越少,不睡觉的门卫将越少;反过来,不睡觉的门卫越多,偷的小偷就越少,不睡觉的门卫越少,偷的小偷就越多。

如果偷窃集团倾巢出动,那么门卫的选择也是全部不睡觉,但门卫一旦全部不睡觉,小偷最好选择全部不偷,小偷一旦选择全部不偷,门卫最好全部选择睡觉。

(5)结论:

加重对小偷的处罚在长期中并不能抑制偷窃(而只能使门卫偷懒);加重处罚失职门卫恰恰是会降低偷窃发生的概率。

这种门卫和小偷的博弈所揭示的,政策目标和政策结果之间的这种意外关系,常被称为“激励的悖论”。

 

 

 

 

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 高等教育 > 理学

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1