)
零和博弈的无限次重复博弈中,所有阶段都不可能发生合作,局中人会一直重复原博弈的混合战略纳什均衡。
(√)(或:
零和博弈的无限次重复博弈中,可能发生合作,局中人不一定会一直重复原博弈的混合战略纳什均衡。
(×))
原博弈惟一的纳什均衡本身是帕雷托效率意义上最佳战略组合,符合各局中人最大利益:
采用原博弈的纯战略纳什均衡本身是各局中人能实现的最好结果,符合所有局中人的利益,因此,不管是重复有限次还是无限次,不会和一次性博弈有区别。
(√)
原博弈惟一的纳什均衡本身是帕雷托效率意义上最佳战略组合,符合各局中人最大利益,但惟一的纳什均衡不是效率最高的战略组合,存在潜在合作利益的囚徒困境博弈。
(√)(或:
原博弈惟一的纳什均衡本身是帕雷托效率意义上最佳战略组合,符合各局中人最大利益,不存在潜在合作利益的囚徒困境博弈。
(×))
根据参与人行动的先后顺序,博弈可以划分为静态博弈(staticgame)和动态博弈(dynamicgame)。
如果阶段博弈G有唯一的Nash均衡,那么对任意有限次T,重复博弈G(T)有唯一的子博弈完美结局:
在每一阶段取G的Nash均衡策略。
(√)
四、名词解释(每小题3分,共15分)
参与人(player)
指的是博弈中选择行动以最大化自己效用(收益)的决策主体,参与人有时也称局中人,可以是个人,也可以是企业、国家等团体;
策略(strategy)
是参与人选择行动的规则,如“以牙还牙”是一种策略;
信息(information)
是指参与人在博弈中的知识,尤其是有关其他参与人的特征和行动的知识;
支付(payoff)函数
是参与人从博弈中获得的效用水平,它是所有参与人策略或行动的函数,是每个参与人很关心的东西;
结果(outcome)
是指博弈分析者感兴趣的要素的集合,常用支付矩阵或收益矩阵来表示;
均衡(equilibrium)
是所有参与人的最优策略或行动的组合。
静态博弈
指参与人同时选择行动或虽非同时但后行动者并不知道先行动者采取什么样的行动;
动态博弈
指参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。
博弈
就是一些个人、队组或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,各自取得相应结果的过程。
零和博弈:
也称“严格竞争博弈”。
博弈方之间利益始终对立,偏好通常不同
变和博弈:
零和博弈和常和博弈以外的所有博弈。
合作利益存在,博弈效率问题的重要性。
完全信息静态博弈
即各博弈方同时决策,且所有博弈方对各方得益都了解的博弈。
上策:
不管其它博弈方选择什么策略,一博弈方的某个策略给他带来的得益始终高于其它的策略,至少不低于其他策略的策略
上策均衡:
一个博弈的某个策略组合中的所有策略都是各个博弈方各自的上策,必然是该博弈比较稳定的结果
严格下策:
不管其它博弈方的策略如何变化,给一个博弈方带来的收益总是比另一种策略给他带来的收益小的策略
合作博弈
非合作博弈
零和博弈
常和博弈
变和博弈
上策均衡
纳什均衡
纳什均衡:
在博弈中,如果由各个博弈方的各一个策略组成的某个策略组合中,任一博弈方的策略,都是对其余博弈方策略的组合
的最佳对策,也即
对任意
都成立,则称为的一个纳什均衡
(或纳什均衡是指这样一种策略组合,这种策略组合由所有参与人的最优策略组成,即给定别人策略的情况下,没有任何单个参与人有积极性选择其他策略,从而没有任何参与人有积极性打破这种均衡。
)
完全信息博弈
混合策略:
在博弈中,博弈方i的策略空间为,则博弈方以概率分布随机在其k个可选策略中选择的“策略”,称为一个“混合策略”,其中
对都成立,且
帕累托上策均衡
风险上策均衡
聚点均衡
重复博弈
指同样结构的博弈重复多次,其中的每次博弈称为“阶段博弈”。
阶段博弈
重复博弈中的每次博弈称为“阶段博弈”。
贴现因子
下一期的一单位支付在这一期的价值。
触发战略(TriggerStrategy)
首先试探合作,一旦发现对方不合作,则也用不合作相报复的战略。
子博弈精炼纳什均衡
(夫妻博弈)一对新婚夫妻为晚上看什么电视节目争执不下,丈夫(记为I方)要看足球比赛节目,而妻子(记为Ⅱ方)要看戏曲节目.他们新婚燕尔,相亲相爱,所以若这方面的行动不一致,则是很伤感情的.因此,这对夫妻间的争执是一次非零和对策。
二、计算与分析题(每小题15分,共45分)
1、无限次重复博弈与有限重复博弈的区别:
a.无限次重复博弈没有结束重复的确定时间。
在有限次重复博弈中,存在最后一次重复正是破坏重复博弈中局中人利益和行为的相互制约关系,使重复博弈无法实现更高效率均衡的关键问题。
b.无限次重复博弈不能忽视不同时间得益的价值差异和贴现问题,必须考虑后一期得益的贴现系数,对局中人和博弈均衡的分析必须以平均得益或总得益的现值为根据。
c.无限次重复博弈与有限次重复博弈的共同点:
试图“合作”和惩罚“不合作”是实现理想均衡的关键,是构造高效率均衡战略的核心构件。
2、可口可乐与百事可乐(参与者)的价格决策:
双方都可以保持价格不变或者提高价格(策略);博弈的目标和得失情况体现为利润的多少(收益);利润的大小取决于双方的策略组合(收益函数);博弈有四种策略组合,其结局是:
(1)如果双方都不涨价,各得利润10单位;
(2)如果可口可乐不涨价,百事可乐涨价,可口可乐利润100,百事可乐利润-30;
(3)如果可口可乐涨价,百事可乐不涨价,可口可乐利润-20,百事可乐利润30;
(4)如果双方都涨价,可口可乐利润140,百事可乐利润35;
求纳什均衡。
博弈的稳定状态有两个:
都不涨价或者都涨价(均衡),均衡称为博弈的解。
3、猪圈里有一头大猪和一头小猪,猪圈的一头有一个饲料槽,另一头装有控制饲料供应的按钮。
按一下按钮就会有10个单位饲料进槽,但谁按谁就要付出2个单位的成本。
谁去按按纽则谁后到;都去按则同时到。
若大猪先到,大猪吃到9个单位,小猪吃到一个单位;若同时到,大猪吃7个单位,小猪吃3个单位;若小猪先到,大猪吃六个单位,小猪吃4个单位。
各种情况组合扣除成本后的支付矩阵可如下表示(每格第一个数字是大猪的得益,第二个数字是小猪的得益):
小猪
按 等待
大猪 按5,1 4,4
等待9,-1 0,0
求纳什均衡。
在这个例子中,我们可以发现,大猪选择按,小猪最好选择等待,大猪选择不按,小猪还是最好选择等待。
即不管大猪选择按还是不按,小猪的最佳策略都是等待。
也就是说,无论如何,小猪都只会选择等待。
这样的情况下,大猪最好选择是按,因为不按的话都饿肚子,按的话还可以有4个单位的收益。
所以纳什均衡是(大猪按,小猪等待)。
4、根据两人博弈的支付矩阵回答问题:
a
b
A
2,3
0,0
B
0,0
4,2
(1)写出两人各自的全部策略,并用等价的博弈树来重新表示这个博弈(6分)
(2)找出该博弈的全部纯策略纳什均衡,并判断均衡的结果是否是Pareto有效。
(3)求出该博弈的混合策略纳什均衡。
(7分)
(1)策略
甲:
A B
乙:
a b
博弈树 (草图如下:
(2)PureNE(A,a);(B,b)
都是Pareto有效,仅(B,b)是K-H有效。
(3)MixedNE((2/5,3/5);(2/3,1/3))
5、用反应函数法求出下列博弈的所有纯战略纳什均衡。
参与人2
a
b
c
d
A
2,3
3,2
3,4
0,3
参与人1
B
4,4
5,2
0,1
1,2
C
3,1
4,1
1,4
10,2
D
3,1
4,1
-1,2
10,1
解答:
纯策略纳什均衡为(B,a)与(A,c)
分析过程:
设两个参与人的行动分别为
,
player1的反应函数
player2的反应函数
交点为(B,a)与(A,c),因此纯策略纳什均衡为(B,a)与(A,c)。
6、(entrydeterrence市场威慑)考虑下面一个动态博弈:
首先,在一个市场上潜在的进入者选择是否进入,然后市场上的已有企业(在位者)选择是否与新企业展开竞争。
在位者可能有两种类型,温柔型(左图)和残酷型(右图),回答下面问题。
.
左图:
温柔型右图:
残酷型
(1)找出给定在位者的两种类型所分别对应的纳什均衡,以及子博弈精炼纳什均衡(12分)
(2)已有企业为温柔型的概率至少多少时,新企业才愿意进入(8分)
(1)温柔 NE(in,accommodate)和 (out,fight)。
SPNE为(in,accommodate)
残酷 NE(out,fight).SPNE同理
8、博弈方1和博弈方2就如何分10,000元钱进行讨价还价。
假设确定了以下规则:
双方同时提出自己要求的数额A和B,0≤A,B≤10,000。
如果A+B≤10,000,则两博弈方的要求得到满足,即分别得A和B,但如果A+B>10,000,则该笔钱就没收。
问该博弈的纳什均衡是什么?
如果你是其中一个博弈方,你会选择什么数额?
为什么?
答十、纳什均衡有无数个。
最可能的结果是(5000,5000)这个聚点均衡。
9、北方航空公司和新华航空公司分享了从北京到南方冬天度假胜地的市场。
如果它们合作,各获得500000元的垄断利润,但不受限制的竞争会使每一方的利润降至60000元。
如果一方在价格决策方面选择合作而另一方却选择降低价格,则合作的厂商获利将为零,竞争厂商将获利900000元。
(1)将这一市场用囚徒困境的博弈加以表示。
(2)解释为什么均衡结果可能是两家公司都选择竞争性策略。
答:
(1)用囚徒困境的博弈表示如下表:
北方航空公司
合作
竞争
新华航空公司
合作
500000,500000
0,900000
竞争
900000,0
60000,60000
(2)如果新华航空公司选择竞争,则北方航空公司也会选择竞争(60000>0);若新华航空公司选择合作,北方航空公司仍会选择竞争(900000>500000)。
若北方航空公司选择竞争,新华航空公司也将选择竞争(60000>0);若北方航空公司选择合作,新华航空公司仍会选择竞争(900000>0)。
由于双方总偏好竞争,故均衡结果为两家公司都选择竞争性策略,每一家公司所获利润均为600000元。
12、设啤酒市场上有两家厂商,各自选择是生产高价啤酒还是低价啤酒,相应的利润(单位:
万元)由下图的得益矩阵给出:
(1)有哪些结果是纳什均衡?
(2)两厂商合作的结果是什么?
答
(1)(低价,高价),(高价,低价)
(2)(低价,高价)
13、A、B两企业利用广告进行竞争。
若A、B两企业都做广告,在未来销售中,A企业可以获得20万元利润,B企业可获得8万元利润;若A企业做广告,B企业不做广告,A企业可获得25万元利润,B企业可获得2万元利润;若A企业不做广告,B企业做广告,A企业可获得10万元利润,B企业可获得12万元利润;若A、B两企业都不做广告,A企业可获得30万元利润,B企业可获得6万元利润。
(1)画出A、B两企业的支付矩阵。
(2)求纳什均衡。
3.答:
(1)由题目中所提供的信息,可画出A、B两企业的支付矩阵(如下表)。
B企业
做广告
不做广告
A企业
做广告
20,8
25,2
不做广告
10,12
30,6
(2)因为这是一个简单的完全信息静态博弈,对于纯策纳什均衡解可运用划横线法求解。
如果A厂商做广告,则B厂商的最优选择是做广告,因为做广告所获得的利润8大于不做广告获得的利润2,故在8下面划一横线。
如果A厂商不做广告,则B厂商的最优选择也是做广告,因为做广告获得的利润为12,而不做广告的利润为6,故在12下面划一横线。
如果B厂商做广告,则A厂商的最优选择是做广告,因为做广告获得的利润20大于不做广告所获得的利润10,故在20下面划一横线。
如果B厂商不做广告,A厂商的最优选择是不做广告,因为不做广告获得的利润30大于做广告所获得的利润25,故在30下面划一横线。
在本题中不存在混合策略的纳什均衡解,因此,最终的纯策略纳什均衡就是A、B两厂商都做广告。
15、求出下面博弈的纳什均衡(含纯策略和混合策略)。
乙
L
R
甲
U
5,0
0,8
D
2,6
4,5
由划线法易知,该矩阵博弈没有纯策略Nash均衡。
可得如下不等式组
Q=a+d-b-c=7,q=d-b=4,R=0+5-8-6=-9,r=-1
可得混合策略Nash均衡((
),(
)
16、某产品市场上有两个厂商,各自都可以选择高质量,还是低质量。
相应的利润由如下得益矩阵给出:
(1)该博弈是否存在纳什均衡?
如果存在的话,哪些结果是纳什均衡
参考答案:
由划线法可知,该矩阵博弈有两个纯策略Nash均衡,即(低质量,高质量),(高质量,低质量)。
乙企业
高质量
低质量
甲企业
高质量
50,50
100,800
低质量
900,600
-20,-30
该矩阵博弈还有一个混合的纳什均衡
Q=a+d-b-c=-970,q=d-b=-120,R=-1380,r=-630,可得
因此该问题的混合纳什均衡为
。
17、甲、乙两企业分属两个国家,在开发某种新产品方面有如下收益矩阵表示的博弈关系。
试求出该博弈的纳什均衡。
如果乙企业所在国政府想保护本国企业利益,可以采取什么措施?
乙企业
开发
不开发
甲企业
开发
-10,-10
100,0
不开发
0,100
0,0
解:
用划线法找出问题的纯策略纳什均衡点。
所以可知该问题有两个纯策略纳什均衡点(开发,不开发)和(不开发,开发)。
该博弈还有一个混合的纳什均衡((
),(
))。
如果乙企业所在国政府对企业开发新产品补贴a个单位,则收益矩阵变为:
要使(不开发,开发)成为该博弈的唯一纳什均衡点,只需a>10。
此时乙企业的收益为100+a。
18、博弈的收益矩阵如下表:
乙
左
右
甲
上
a,b
c,d
下
e,f
g,h
(1)如果(上,左)是占优策略均衡,则a、b、c、d、e、f、g、h之间必然满足哪些关系?
(尽量把所有必要的关系式都写出来)
(2)如果(上,左)是纳什均衡,则
(1)中的关系式哪些必须满足?
(3)如果(上,左)是占优策略均衡,那么它是否必定是纳什均衡?
为什么?
(4)在什么情况下,纯战略纳什均衡不存在?
答:
(1)
,
,
,
。
本题另外一个思考角度是从占优策略均衡的定义出发。
对乙而言,占优策略为
;而对甲而言,占优策略为
。
综合起来可得到所需结论。
(2)纳什均衡只需满足:
甲选上的策略时,
,同时乙选左的策略时,
。
故本题中纳什均衡的条件为:
,
。
(3)占优策略均衡一定是纳什均衡,因为占优策略均衡的条件包含了纳什均衡的条件。
(4)当对每一方来说,任意一种策略组合都不满足纳什均衡时,纯战略纳什均衡就不存在。
19、Smith和John玩数字匹配游戏,每个人选择1、2、3,如果数字相同,John给Smith3美元,如果不同,Smith给John1美元。
(1)列出收益矩阵。
(2)如果参与者以1/3的概率选择每一个数字,证明该混合策略存在一个纳什均衡,它为多少?
答:
(1)此博弈的收益矩阵如下表。
该博弈是零和博弈,无纳什均衡。
John
1
2
3
Smith
1
3,-3
-1,1
-1,1
2
-1,1
3,-3
-1,1
3
-1,1
-1,1
3,-3
(2)Smith选(1/3,1/3,1/3)的混合概率时,
John选1的效用为:
John选2的效用为:
John选3的效用为:
类似地,John选(1/3,1/3,1/3)的混合概率时,
Smith选1的效用为:
Smith选2的效用为:
Smith选3的效用为:
因为
,
,所以:
是纳什均衡,策略值分别为John:
;Smith:
。
20、假设双头垄断企业的成本函数分别为:
,
,市场需求曲线为
,其中,
。
(1)求出古诺(Cournot)均衡情况下的产量、价格和利润,求出各自的反应和等利润曲线,并图示均衡点。
(2)求出斯塔克博格(Stackelberg)均衡情况下的产量、价格和利润,并以图形表示。
(3)说明导致上述两种均衡结果差异的原因。
答:
(1)对于垄断企业1来说:
这是垄断企业1的反应函数。
其等利润曲线为:
对垄断企业2来说:
这是垄断企业2的反应函数。
其等利润曲线为:
在达到均衡时,有:
均衡时的价格为:
两垄断企业的利润分别为:
均衡点可图示为:
(2)当垄断企业1为领导者时,企业2视企业1的产量为既定,其反应函数为:
则企业1的问题可简化为:
均衡时价格为:
利润为:
,
该均衡可用下图表示:
企业2领先时可依此类推。
(3)当企业1为领先者时,其获得的利润要比古诺竞争下多。
而企业2获得的利润较少。
这是因为,企业1先行动时,其能考虑企业2的反应,并以此来制定自己的生产计划,而企业2只能被动地接受企业1的既定产量,计划自己的产出,这是一种“先动优势”
21、在一个由三寡头操纵的垄断市场中,逆需求函数为p=a-q1-q2-q3,这里qi是企业i的产量。
每一企业生产的单位成本为常数c。
三企业决定各自产量的顺序如下:
(1)企业1首先选择q1≥0;
(2)企业2和企业3观察到q1,然后同时分别选择q2和q3。
试解出该博弈的子博弈完美纳什均衡。
答:
该博弈分为两个阶段,第一阶段企业1选择产量q1,第二阶段企业2和3观测到q1后,他们之间作一完全信息的静态博弈。
我们按照逆向递归法对博弈进行求解。
(1)假设企业1已选定产量q1,先进行第二阶段的计算。
设企业2,3的利润函数分别为:
由于两企业均要追求利润最大,故对以上两式分别求一阶条件:
(1)
(2)
求解
(1)、
(2)组成的方程组有:
(3)
(2)现进行第一阶段的博弈分析:
对与企业1,其利润函数为;
将(3)代入可得:
(4)
式(4)对q1求导:
解得:
(5)
此时,
(3)将式(5)代回(3)和(4)有该博弈的子博弈完美纳什均衡:
25、某寡头垄断市场上有两个厂商,总成本均为自身产量的20倍,市场需求函数为Q=200-P。
求
(1)若两个厂商同时决定产量,产量分别是多少?
(2)若两个厂商达成协议垄断市场,共同安排产量,则各自的利润情况如何?
答:
(1)分别求反应函数,180-2Q1-Q2=0,180-Q1-2Q2=0,Q1=Q2=60
(2)200-2Q=20,Q=90,Q1=Q2=45
26、一个工人给一个老板干活,工资标准是100元。
工人可以选择是否偷懒,老板则选择是否克扣工资。
假设工人不偷懒有相当于50元的负效用,老板想克扣工资则总有借口扣掉60元工资,工人不偷懒老板有150元产出,而工人偷懒时老板只有80元产出,但老板在支付工资之前无法知道实际产出,这些情况双方都知道。
请问:
(1)如果老板完全能够看出工人是否偷懒,博弈属于哪种类型?
用得益矩阵或扩展形表示
该博弈并作简单分析。
(2)如果老板无法看出工人是否偷懒,博弈属于哪种类型?
用得益矩阵或扩展形表示该博
弈并作简单分析。
(1)完全信息动态博弈。
博弈结果应该是工人偷懒,老板克扣。
(2)完全信息静态博弈,结果仍然是工人偷懒,老板克扣。
27、举一个你在现实生活中遇到的囚犯两难困境的例子。
答:
在校园的人行道交叉路口,无需红绿灯。
现在两人分别骑车从东西方向和南北方向通过路口。
若同时往前冲,必定相撞,各自支付为(-2,-2);若同时停下,都不能按时前进,支付为(0,0);若一人前进一人停下,支付为(2,0)或(0,2)。
相应的策略和支付矩阵如下表。
乙
前进
停下
甲
前进
-2,-2
2,0
停下
0,2
0,0
28、给定两家酿酒企业A、B的收益矩阵如下表:
A企业
白酒
啤酒
B企业
白酒
700,600
900,1000
啤酒
800,900
600,800
表中每组数字前面一个表示B企业的收益,后一个数字表示B企业的收益。
(1)求出该博弈问题的均衡解,是占优策略均衡还是纳什均衡?
(2)存在帕累托改进吗?
如果存在,在什么条件下可以实现?
福利增量是多少?
(3)如何改变上述A、B企业的收益才能使均衡成为纳什均衡或占优策略均衡?
如何改变上述A、B企业的收益才能使该博弈不存在均衡?
答:
(1)有两个纳什均衡,即(啤酒,白酒)、(白酒,啤酒),都是纳什均衡而不是占优策略均衡。
(2)显然,(白酒,啤酒)是最佳均衡,此时双方均获得其最大收益。
若均衡解为(啤酒,白酒),