(1)写出支付矩阵。
(2)分析混合策略纳什均衡。
(五)案例分析题
1.阅读以下材料,联系实际情况,运用所学理论进行评析。
囚徒困境中的宝洁公司
宝洁(P&G)、联合利华和花牌同时计划进入杀虫胶带市场。
它们都面临同样的成本和需求条件,而各厂商必须在考虑到他的竞争者们的情况下决定一个价格。
如果P&G和它的竞争者都将价格定在1.50美元,他能得到更多的利润。
这从下表中的支付矩阵中看得很清楚。
如果所有厂商都定价1.50美元,它们每月各可赚到20000美元利润,而不是定价l.40美元可以赚到的12000美元。
那么为什么它们不定价1.50美元呢?
联合利华和花牌定价
l.40美元
1.50美元
宝洁(P&G)
l.40美元
12,12
29,11
1.50美元
3,21
20,20
*假设联合利华和花牌定相同的价格。
矩阵中数字以每月千美元为单位。
因为这些厂商处在一个囚徒的困境中,不管联合利华和花牌定价多少,宝洁定价l.40美元都能赚更多的钱。
例如,若联合利华和花牌定价1.50美元,宝洁定价l.40美元每月可赚29000美元,而定价1.50美元只能赚20000美元。
这对联合利华和花牌也是正确的。
例如,宝洁定价l.50美元而联合利华和花牌定价1.40美元,它们将各赚到21000美元而不是20000美元。
结果,宝洁知道如果它定价1.50美元,它的竞争者会有强烈的低价竞争,定价l.40美元的冲动,这样P&G将只有一个很小的市场份额和只能赚到每月3000美元的利润。
P&G应该冒险防信任竞争者定价1.50美元吗?
如果你面对这样的困境,你会怎么做呢?
2.一个工人给老板干活,工资标准是100元。
工人可以选择是否偷懒,老板则选择是否克扣工资。
假设工人不偷懒有相当于50元的负效用,老板想克扣工资则总有借口扣掉60元工资,工人不偷懒老板有150元产出,而工人偷懒时老板只有80元产出,但老板在支付工资之前无法知道实际产出,这些情况双方都知道。
请问
(1)如果老板完全能够看出工人是否偷懒,博弈属于哪种类型?
用得益矩阵或扩展形式表示该博弈并作简单分析。
(2)如果老板无法看出工人是否偷懒,博弈属于哪种类型?
用得益矩阵或扩展形式表示该博弈并作简单分析。
参考答案
(一)单项选择题
1.(B)2.(B)3.(C)4.(D)5.(A)6.(C)7.(A)
8.(A)9.(C)10.(D) 11.(C) 12.(B)13.(B) 14.(D)
(二)判断说明题
1.错
【解题思路】:
本题分析博弈论与寡头垄断企业的关系。
【解析】:
博弈论是用来分析寡头垄断企业行为的理论。
2.错
【解题思路】:
本题分析占优战略。
【解析】:
在囚徒困境博弈中,占优战略是招供,即不管对方的行为是怎样的,每个囚徒都会采取招供的战略。
3.错
【解题思路】:
本题考察零和博弈和非合作博弈的关系。
【解析】:
虽然零和博弈中博弈方的利益确实是对立的,但非合作博弈的含义并不是博弈方之间的关系是竞争性的、对立的,而是指博弈方是以个体理性、个体利益最大化为行为的逻辑和依据,是指博弈中不能包含有约束力的协议。
4.错
【解题思路】:
本题考察动态博弈。
【解析】:
其实并不是所有选择、行为有先后次序的博弈问题都是动态博弈。
例如两个厂商先后确定自己的产量,但只要后确定产量的厂商在定产之前不知道另一厂商的产量是多少,就是静态博弈问题而非动态博弈问题。
5.错
【解题思路】:
本题考察合作博弈。
【解析】:
合作博弈在博弈论中专门指博弈方之间可以达成和运用有约束力的协议限制行为选择的博弈问题,与博弈方的态度是否合作无关。
6.错
【解题思路】:
本题考察纳什均衡。
【解析】:
只要任一博弈方单独改变策略不会增加利益,策略组合就是纳什均衡了。
单独改变策略只能得到更小得益的策略组合是严格纳什均衡,是比纳什均衡更强的均衡概念。
7.对
【解题思路】:
本题考察纳什均衡。
【解析】:
这是纳什均衡的基本性质之一:
奇数性所保证的。
8.错
【解题思路】:
本题考察动态博弈。
【解析】:
实际上动态博弈中先行为的博弈方往往是有先行优势的,因此常常是先行为的博弈方更有利而不是后行为的博弈方有利。
9.错
【解题思路】:
本题考察多人博弈。
【解析】:
多人博弈中的“破坏者”对博弈方的利益是否有影响和影响方向是不确定的。
事实上,正是因为这种不确定性才被视为“破坏者”。
这种“破坏者”实质上是指对博弈分析造成破坏,而不是对博弈方的利益造成破坏,因此肯定会受到不利影响的是博弈分析者而不是博弈方。
10.错
【解题思路】:
本题考察纳什均衡。
【解析】:
虽然纯策略纳什均衡不一定存在,但在我们所分析的博弈中混合策略纳什均衡总是存在的。
这正是纳什定理的根本结论。
也许在有些博弈中只有惟一的纯策略纳什均衡,没有严格意义上上的混合策略纳什均衡,这时把纯策略理解成特殊的混合策略,混合策略纳什均衡就存在了。
(三)计算题
1.【解题思路】:
这是一个有关囚徒困境博弈的题目。
【解析】:
(1)用囚徒困境的博弈表示如下表:
北方航空公司
合作
竞争
新华航空公司
合作
500000,500000
0,900000
竞争
900000,0
60000,60000
(2)如果新华航空公司选择竞争,则北方航空公司也会选择竞争(60000>0);若新华航空公司选择合作,北方航空公司仍会选择竞争(900000>500000)。
若北方航空公司选择竞争,新华航空公司也将选择竞争(60000>0);若北方航空公司选择合作,新华航空公司仍会选择竞争(900000>0)。
由于双方总偏好竞争,故均衡结果为两家公司都选择竞争性策略,每一家公司所获利润均为600000元。
2.【解题思路】:
这是一个有关零和博弈的题目。
【解析】:
(1)此博弈的收益矩阵如下表。
该博弈是零和博弈,无纳什均衡。
John
1
2
3
Smith
1
3,-3
-1,1
-1,1
2
-1,1
3,-3
-1,1
3
-1,1
-1,1
3,-3
(2)Smith选(1/3,1/3,1/3)的混合概率时,
John选1的效用为:
John选2的效用为:
John选3的效用为:
类似地,John选(1/3,1/3,1/3)的混合概率时,
Smith选1的效用为:
Smith选2的效用为:
Smith选3的效用为:
因为
,
,
所以:
是纳什均衡,策略值分别为John:
;Smith:
。
3.【解题思路】:
本题考察双寡头博弈中的生产决策。
【解析】:
(1)对于垄断企业1来说:
这是垄断企业1的反应函数。
其等利润曲线为:
对垄断企业2来说:
这是垄断企业2的反应函数。
其等利润曲线为:
在达到均衡时,有:
均衡时的价格为:
两垄断企业的利润分别为:
均衡点可图示为:
(2)当垄断企业1为领导者时,企业2视企业1的产量为既定,其反应函数为:
则企业1的问题可简化为:
均衡时价格为:
利润为:
,
该均衡可用下图表示:
企业2领先时可依此类推。
(3)当企业1为领先者时,其获得的利润要比古诺竞争下多。
而企业2获得的利润较少。
这是因为,企业1先行动时,其能考虑企业2的反应,并以此来制定自己的生产计划,而企业2只能被动地接受企业1的既定产量,计划自己的产出,这是一种“先动优势”。
4.【解题思路】:
本题重点考察子博弈完美纳什均衡。
【解析】:
(1)如果企业A先走一步,则企业B的策略选择有四种:
①若A选择“大”,B也选择“大”;若A选择“小”,B仍然选择“大”。
②若A选择“大”,B也选择“大”;若A选择“小”,B也选择“小”。
③若A选择“大”,B选择“小”;若A选择“小”,B选择“大”。
④若A选择“大”,B选择“小”;若A选择“小”,B也选择“小”。
根据B的策略选择,可得到一个2×4的标准型博弈,如下表所示:
B企业
(大,大)
(大,小)
(小,大)
(小,小)
A企业
大
2,2(X)
2,2(Y)
-1,-1
-1,-1
小
-1,-1
1,1
-1,-1
1,1(Z)
(2)上述A和B的策略组合中有三个均衡,即X={大,(大,大)}、Y={大,(大,小)}和Z={小,(小,小)}。
而且,这三个均衡都是纳什均衡。
先看X。
当A选“大”时,B必定选“大”;而由于B必然选“大”,故A选“大”是其最优反应。
再看Y。
当A选“大”时,B也选“大”;当A选“小”时,B也选“小”,结果两者仍选“大”,这是合作均衡。
最后看Z。
若A选“小”,则B必选“小”,与X一样,(小,小)是两者最优反应的组合,所以是纳什均衡。
(3)如果将上述策略组合写成广延型博弈形式,则如下图所示:
从上图可以看出,策略组合X={大,(大,大)}不是子博弈完美纳什均衡。
因为,尽管X是整个博弈的纳什均衡,也是以B1为始点的子博弈的纳什均衡,但它不是以B2为始点的子博弈的纳什均衡。
策略组合Z={小,(小,小)}也不是子博弈完美纳什均衡。
理由是,Z是整个博弈和以B2为始点的纳什均衡,但不是以B1为始点的子博弈的纳什均衡。
因而,只有Y={大,(大,小)}属于子博弈完美纳什均衡,因为组合Y在上述三个子博弈中,都是纳什均衡。
5.【解题思路】:
这是一道有关完全信息动态博弈模型的题目。
【解析】:
因为是在给定私人部门通货膨胀预期的情况下制定货币政策,也就是确定实际通货膨胀率,所以,政府面临的最大化问题就是:
运用拉格朗日函数解这一最大化问题,可得
的值:
上式是政府的反应函数。
又由于假设私人部门具有理性预期,也就是说预期的通货膨胀率等于
,这样就将
代入政府的反应函数,可得:
这样,由于私人部门具有理性预期,实际产出水平将与通货膨胀率无关而等于自然失业率下的产出水平;另一方面却要忍受通货膨胀率的痛苦。
因此,原题结论得以证明。
(四)问答题
1.【解题思路】:
日常生活中囚徒困境博弈的例子很多。
【解析】:
在校园的人行道交叉路口,无需红绿灯。
现在两人分别骑车从东西方向和南北方向通过路口。
若同时往前冲,必定相撞,各自支付为(-2,-2);若同时停下,都不能按时前进,支付为(0,0);若一人前进一人停下,支付为(2,0)或(0,2)。
相应的策略和支付矩阵如下表。
乙
前进
停下
甲
前进
-2,-2
2,0
停下
0,2
0,0
2.【解题思路】:
本题重点考察纳什均衡。
【解析】:
(1)有两个纳什均衡,即(啤酒,白酒)、(白酒,啤酒),都是纳什均衡而不是占优策略均衡。
(2)显然,(白酒,啤酒)是最佳均衡,此时双方均获得其最大收益。
若均衡解为(啤酒,白酒),则存在帕累托改善的可能。
方法是双方沟通,共同做出理性选择,也可由一方向另一方支付报酬。
福利由800+900变为900+1000,增量为200。
(3)如将(啤酒,白酒)支付改为(1000,1100),则(啤酒,白酒)就成为占优策略均衡。
比如将(啤酒,白酒)支付改为(800,500),将(白酒,啤酒)支付改为(900,500),则该博弈就不存在任何占优策略均衡或纳什均衡。
3.【解题思路】:
本题从混合纳什均衡出发进行考虑。
【解析】:
(1)该博弈的支付矩阵如下表:
纳税人
逃税
不逃税
税收机关
检查
A-C+F,-A-F
A-C,-A
不检查
0,0
A,-A
(2)先分析税收检查边际:
因为S为税务机关检查的概率,E为纳税人逃税的概率。
给定E,税收机关选择检查与否的期望收益为:
解
,得:
。
如果纳税人逃税概率小于E,税收机关的最优决策是不检查,否则是检查。
再分析逃税边际:
给定S,纳税人选择逃税与否的期望收益是:
解
,得:
。
即如果税收机关检查的概率小于S,纳税人的最优选择是逃税,否则是交税。
因此,混合纳什均衡是(S,E),即税收机关以S的概率查税,而纳税人以E的概率逃税。
(五)案例分析题
1.【解题思路】:
这是一道有关日常生活中囚徒困境博弈的示例。
【解析】:
囚徒困境是一种“二人博弈”。
在一次性的囚徒困境博弈中,每个博弈者都有一种欺骗的优势策略,即招供。
囚徒困境的内在根源是在个体之间存在行为和利益相互制约的博弈结构中,以个体理性和个体选择为其基础的分散决策方式,无法有效地协调各方面的利益,并实现整体、个体利益共同最优。
简单的说,囚徒困境问题都是个体理性与集体理性的矛盾引起的。
从案例的分析来看,定价1.4美元成为企业的占优战略。
而我们现实生活中囚徒困境的例子很多的,例如厂商之间的价格战、恶性的广告竞争,初等、中等教育中的应试教育等,其实都是囚徒困境博弈的表现形式。
对于任何想进入中国市场的跨国公司来说,也面临着类似的“囚徒困境”。
假设有两个跨国公司A和B正在争取同一个项目。
在这种情况下,他们在处理与政府公职人员的关系上有两个选择,行贿或者不行贿。
如果大家都不行贿,那么获得项目与否要依靠实力来决定,在两者实力相当的情况下,双方获得项目的可能性均为50%左右。
如果大家都行贿,最终的结果可能要综合考察实力强弱和贿赂的额度而定,如果一方行贿而另一方不行贿,那么在实力相当的情况下肯定是行贿方胜出,最终获得项目。
在这种情况下,跨国公司该如何选择呢?
显然,它在决定自己行为的时候必须考虑对方的行为选择。
通常,跨国公司争取的项目都是利润非常丰厚的项目,行贿所带来的成本与可以获得的收益相比是很小的。
因此,获得该项目,最终跨国公司的选择就是行贿,或者说为了获得与对手平等的竞争机会,它也会去行贿。
是在囚徒困境的激励下,跨国公司纷纷向外国政府公职人员进行违法支付。
如朗讯和西门子公司都在中国陷入“贿赂门”事件等等。
2.【解题思路】:
本题主要目的在于区分动态博弈与静态博弈。
【解析】:
(1)由于老板在决定是否克扣工资前可以完全清楚工人是否偷懒,因此这是一个动态博弈,而且是一个完全信息的动态博弈。
此外,由于双方都有关于得益的充分信息,因此这是一个完全且完美信息的动态博弈。
该博弈用扩展形表示如下:
根据上述得益情况可以看出,在该博弈中偷懒对工人总是有利的,克扣对老板也总是有利的,因此在双方都只考虑自己的利益最大化的情况下,该博弈的通常结果是工人偷懒和老板克扣。
(2)由于老板在决定是否克扣工资之前无法清楚工人是否偷懒,因此该博弈可以看作静态博弈。
由于双方仍然都有关于得益的充分信息,是一个完全信息的静态博弈。
该博弈用得益矩阵表示如下:
老板
克扣 不克扣
工
人
偷懒
不偷懒
40,40
100,-20
-10,110
50,50
其实根据该得益矩阵,不难得到与上述动态博弈同样的结论,仍然是工人会选择偷懒和老板会选择克扣。
这个博弈实际上与囚徒困境是相似的。
四、考研试题精选
(一)计算题
1.两家计算机厂商A和B正计划推出办公信息管理系统。
两厂商可开发的管理系统有高速、高质(H)和低速、低质两种(L)。
市场研究表明各厂商在不同策略下相应的利润由如下的收益矩阵给出。
厂商B
H
L
厂商A
H
30,30
50,35
L
40,60
20,20
(1)如果两厂商同时做出决策且使用极大化极小(低风险)策略,结果将是什么?
(2