)
零和博弈的无限次重复博弈中,所有阶段都不可能发生合作,局中人会一直重复原博弈的混合战略纳什均衡。
(√)(或:
零和博弈的无限次重复博弈中,可能发生合作,局中人不一定会一直重复原博弈的混合战略纳什均衡。
(×))
原博弈惟一的纳什均衡本身是帕雷托效率意义上最佳战略组合,符合各局中人最大利益:
采用原博弈的纯战略纳什均衡本身是各局中人能实现的最好结果,符合所有局中人的利益,因此,不管是重复有限次还是无限次,不会和一次性博弈有区别。
(√)
原博弈惟一的纳什均衡本身是帕雷托效率意义上最佳战略组合,符合各局中人最大利益,但惟一的纳什均衡不是效率最高的战略组合,存在潜在合作利益的囚徒困境博弈。
(√)(或:
原博弈惟一的纳什均衡本身是帕雷托效率意义上最佳战略组合,符合各局中人最大利益,不存在潜在合作利益的囚徒困境博弈。
(×))
根据参与人行动的先后顺序,博弈可以划分为静态博弈(staticgame)和动态博弈(dynamicgame)。
如果阶段博弈G有唯一的Nash均衡,那么对任意有限次T,重复博弈G(T)有唯一的子博弈完美结局:
在每一阶段取G的Nash均衡策略。
(√)
四、名词解释(每小题3分,共15分)
参与人(player)
指的是博弈中选择行动以最大化自己效用(收益)的决策主体,参与人有时也称局中人,可以是个人,也可以是企业、国家等团体;
策略(strategy)
是参与人选择行动的规则,如“以牙还牙”是一种策略;
信息(information)
是指参与人在博弈中的知识,尤其是有关其他参与人的特征和行动的知识;
支付(payoff)函数
是参与人从博弈中获得的效用水平,它是所有参与人策略或行动的函数,是每个参与人很关心的东西;
结果(outcome)
是指博弈分析者感兴趣的要素的集合,常用支付矩阵或收益矩阵来表示;
均衡(equilibrium)
是所有参与人的最优策略或行动的组合。
静态博弈
指参与人同时选择行动或虽非同时但后行动者并不知道先行动者采取什么样的行动;
动态博弈
指参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。
博弈
就是一些个人、队组或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,各自取得相应结果的过程。
零和博弈:
也称“严格竞争博弈”。
博弈方之间利益始终对立,偏好通常不同
变和博弈:
零和博弈和常和博弈以外的所有博弈。
合作利益存在,博弈效率问题的重要性。
完全信息静态博弈
即各博弈方同时决策,且所有博弈方对各方得益都了解的博弈。
上策:
不管其它博弈方选择什么策略,一博弈方的某个策略给他带来的得益始终高于其它的策略,至少不低于其他策略的策略
上策均衡:
一个博弈的某个策略组合中的所有策略都是各个博弈方各自的上策,必然是该博弈比较稳定的结果
严格下策:
不管其它博弈方的策略如何变化,给一个博弈方带来的收益总是比另一种策略给他带来的收益小的策略
合作博弈
非合作博弈
零和博弈
常和博弈
变和博弈
上策均衡
纳什均衡
纳什均衡:
在博弈中,如果由各个博弈方的各一个策略组成的某个策略组合中,任一博弈方的策略,都是对其余博弈方策略的组合
的最佳对策,也即
对任意
都成立,则称为的一个纳什均衡
(或纳什均衡是指这样一种策略组合,这种策略组合由所有参与人的最优策略组成,即给定别人策略的情况下,没有任何单个参与人有积极性选择其他策略,从而没有任何参与人有积极性打破这种均衡。
)
完全信息博弈
混合策略:
在博弈中,博弈方i的策略空间为,则博弈方以概率分布随机在其k个可选策略中选择的“策略”,称为一个“混合策略”,其中
对都成立,且
帕累托上策均衡
风险上策均衡
聚点均衡
重复博弈
指同样结构的博弈重复多次,其中的每次博弈称为“阶段博弈”。
阶段博弈
重复博弈中的每次博弈称为“阶段博弈”。
贴现因子
下一期的一单位支付在这一期的价值。
触发战略(TriggerStrategy)
首先试探合作,一旦发现对方不合作,则也用不合作相报复的战略。
子博弈精炼纳什均衡
(夫妻博弈)一对新婚夫妻为晚上看什么电视节目争执不下,丈夫(记为I方)要看足球比赛节目,而妻子(记为Ⅱ方)要看戏曲节目.他们新婚燕尔,相亲相爱,所以若这方面的行动不一致,则是很伤感情的.因此,这对夫妻间的争执是一次非零和对策。
二、计算与分析题(每小题15分,共45分)
1、无限次重复博弈与有限重复博弈的区别:
a.无限次重复博弈没有结束重复的确定时间。
在有限次重复博弈中,存在最后一次重复正是破坏重复博弈中局中人利益和行为的相互制约关系,使重复博弈无法实现更高效率均衡的关键问题。
b.无限次重复博弈不能忽视不同时间得益的价值差异和贴现问题,必须考虑后一期得益的贴现系数,对局中人和博弈均衡的分析必须以平均得益或总得益的现值为根据。
c.无限次重复博弈与有限次重复博弈的共同点:
试图“合作”和惩罚“不合作”是实现理想均衡的关键,是构造高效率均衡战略的核心构件。
2、可口可乐与百事可乐(参与者)的价格决策:
双方都可以保持价格不变或者提高价格(策略);博弈的目标和得失情况体现为利润的多少(收益);利润的大小取决于双方的策略组合(收益函数);博弈有四种策略组合,其结局是:
(1)如果双方都不涨价,各得利润10单位;
(2)如果可口可乐不涨价,百事可乐涨价,可口可乐利润100,百事可乐利润-30;
(3)如果可口可乐涨价,百事可乐不涨价,可口可乐利润-20,百事可乐利润30;
(4)如果双方都涨价,可口可乐利润140,百事可乐利润35;
求纳什均衡。
博弈的稳定状态有两个:
都不涨价或者都涨价(均衡),均衡称为博弈的解。
3、猪圈里有一头大猪和一头小猪,猪圈的一头有一个饲料槽,另一头装有控制饲料供应的按钮。
按一下按钮就会有10个单位饲料进槽,但谁按谁就要付出2个单位的成本。
谁去按按纽则谁后到;都去按则同时到。
若大猪先到,大猪吃到9个单位,小猪吃到一个单位;若同时到,大猪吃7个单位,小猪吃3个单位;若小猪先到,大猪吃六个单位,小猪吃4个单位。
各种情况组合扣除成本后的支付矩阵可如下表示(每格第一个数字是大猪的得益,第二个数字是小猪的得益):
小猪
按 等待
大猪 按5,1 4,4
等待9,-1 0,0
求纳什均衡。
在这个例子中,我们可以发现,大猪选择按,小猪最好选择等待,大猪选择不按,小猪还是最好选择等待。
即不管大猪选择按还是不按,小猪的最佳策略都是等待。
也就是说,无论如何,小猪都只会选择等待。
这样的情况下,大猪最好选择是按,因为不按的话都饿肚子,按的话还可以有4个单位的收益。
所以纳什均衡是(大猪按,小猪等待)。
4、根据两人博弈的支付矩阵回答问题:
a
b
A
2,3
0,0
B
0,0
4,2
(1)写出两人各自的全部策略,并用等价的博弈树来重新表示这个博弈(6分)
(2)找出该博弈的全部纯策略纳什均衡,并判断均衡的结果是否是Pareto有效。
(3)求出该博弈的混合策略纳什均衡。
(7分)
(1)策略
甲:
A B
乙:
a b
博弈树 (草图如下:
(2)PureNE(A,a);(B,b)
都是Pareto有效,仅(B,b)是K-H有效。
(3)MixedNE((2/5,3/5);(2/3,1/3))
5、用反应函数法求出下列博弈的所有纯战略纳什均衡。
参与人2
a
b
c
d
A
2,3
3,2
3,4
0,3
参与人1
B
4,4
5,2
0,1
1,2
C
3,1
4,1
1,4
10,2
D
3,1
4,1
-1,2
10,1
解答:
纯策略纳什均衡为(B,a)与(A,c)
分析过程:
设两个参与人的行动分别为,
player1的反应函数
player2的反应函数
交点为(B,a)与(A,c),因此纯策略纳什均衡为(B,a)与(A,c)。
6、(entrydeterrence市场威慑)考虑下面一个动态博弈:
首先,在一个市场上潜在的进入者选择是否进入,然后市场上的已有企业(在位者)选择是否与新企业展开竞争。
在位者可能有两种类型,温柔型(左图)和残酷型(右图),回答下面问题。
.
左图:
温柔型右图:
残酷型
(1)找出给定在位者的两种类型所分别对应的纳什均衡,以及子博弈精炼纳什均衡(12分)
(2)已有企业为温柔型的概率至少多少时,新企业才愿意进入(8分)
(1)温柔 NE(in,accommodate)和 (out,fight)。
SPNE为(in,accommodate)
残酷 NE(out,fight).SPNE同理
(2)
8、博弈方1和博弈方2就如何分10,000元钱进行讨价还价。
假设确定了以下规则:
双方同时提出自己要求的数额A和B,0≤A,B≤10,000。
如果A+B≤10,000,则两博弈方的要求得到满足,即分别得A和B,但如果A+B>10,000,则该笔钱就没收。
问该博弈的纳什均衡是什