第七章博弈论.docx
《第七章博弈论.docx》由会员分享,可在线阅读,更多相关《第七章博弈论.docx(28页珍藏版)》请在冰豆网上搜索。
![第七章博弈论.docx](https://file1.bdocx.com/fileroot1/2022-10/19/e87280cb-3d7c-4b6f-8706-c775ee8b4145/e87280cb-3d7c-4b6f-8706-c775ee8b41451.gif)
第七章博弈论
7博弈论GameTheory
7.1策略性决策的制定
如果人和人的行为是相互影响的,那么一个人的决策必须考虑到他人的决策和行为。
对策论是对决策者之间的行为的相互影响的研究。
因为对策论的研究特别强调决策者行为
的理性,在过去的二十年间,对策论已被广泛地应用于经济学中。
确实大多数经济行为能够被看成是对策论的一个特殊的情形。
博弈的分类
次序
完全信息
不完全信息
静态
静态完全信息
静态不完全信息博弈
动态
动态完全信息
动态不完全信息博弈
本章开始详尽考察了策略式博弈并进而更详尽地讨论了扩展式博弈。
前一种是指行为者同时作出单一选择的博弈,而后一种则指行为者序贯地作出行动选择。
沿着这条路径,我们将会遇到特定解的概念。
我们将研究的解的概念包括那些以占优观点、纳什均衡、贝叶斯一纳什均衡、逆向归纳、子博弈完善均衡与序贯均衡等为基础的
概念。
其中每个解概念比其前辈更复杂,并且知道在什么时候应用这一个解而非另一个解是作为一个好的应用经济学家的更为重要的一部分。
一般地,这里有两种方法描述一个对策:
策略(规范)形式的表示和扩展形式的表示,博弈矩阵(支付矩阵)和博弈树博弈矩阵:
由参与者、战略集、支付构成,通常来描述一个静态的策略式博弈
囚徒困境
囚徒2
抵赖
坦白
抵赖
-1,-1
-9,0
坦白
0,-9
-8,-8
博弈树:
参与者、战略、概率、支付,通常来描述一个动态
的扩展式博弈
7.2策略式博弈
策略式博弈的描述
定义7.1策略式博弈
1、参与人players:
指的是一个博弈中的决策主体,其目的是通过选择行动策略以最大化自己的支付(效用)水平
“自然”是虚拟参与人(pseudo-player),他在博弈的特定
时点上以特定的概率选择随机行动。
2、行动actions参与人i的行动以ai表示,是他所能做的某
一选择。
参与人i的行动集(actionset)Ai={,是其可
以采取的全部行动的集合。
一个行动组合(actionprofile)是
一个由博弈中的n个参与人每人选择一个行动而组成的有序
集,a={ai),(i=1,.・・,n).行动的顺序
3、信息information:
是参与人有关博弈的知识,如自然的选择,其他参与人的特征和行动等知识。
共同知识(CommonKnowledge),每个参与者知道的知识,
每个参与者知道每个参与者知道知识”,
私人信息,在博弈中(开始博弈前或博弈中),参与者i的
私人信息是指他知道,但不是所有参与者的共同知识。
4、参与人的策略(strategy)s参与人在给定信息集下的行
动规则,他规定参与人在每一时点选择何种行动。
Si表示参
与人i的一个特定策略,符号S_i:
其他所有人的战略。
参与人的策略集(strategyset;strategyspace)或策略空间
Si={s}是其可行策略的集合。
策略组合(strategyprofile)s=⑸急,・・・,$)是由博弈的n个参与人每人选择一个策略的集合
*策略不同于行动。
*策略必须是完备的。
比如:
红军对付白军的策略是:
人不犯我,我不犯人;人若犯我,我必犯人。
这个策略使白军不敢犯我。
但是策略必须包括人若犯我的情况。
否则,就不能保证敌人不犯我。
5、支付/收益payoff:
是指在一个特定的策略组合下参与人得到的确定效用水平(收益),或指参与人得到的期望效用水平(收益)。
u=(U1,U2,・・・Ui,・・.un)为n个参与人的支付组合payoffprofile。
参与人i的支付是所有参与人的策略的函数:
Ui:
^Sj>:
Ui=Ui(Si,・・・Sj,…Sn)
6、一个博弈(分析)的结果outcome是博弈分析者所感兴趣的所有东西,如均衡策略组合,均衡行动组合,均衡支付
组合等等,取决于博弈分析者的到底需要什么。
7、均衡是所有参与人的最优策略的组合:
S*=(S1*,・・・Si*,...,Sn*)
其中Si*表示第i个参与人在均衡条件下的最优策略:
Ui(S*,S-i)>Ui(Si',S-i)对任意的s'工S*.
721占优策略
定义7.2严格占优策略
对于一切^0,S'Si^?
,如果Ui(?
S」)•Ui(Si,S」)成立,那么,对于局中人i,策略纟是严格占优的。
如果一个参与人的某个策略是相对于其他参与人的所有策
略的严格最优策略,那么这个策略就是严格占优的。
L
R
U
3,0
0,-4
D
2,4
-1,8
定义7.3严格占劣策略
对于一切s_j亡S_j,比(?
宀)>比(§,s」),那么,对于局中人
i,策略?
是严格占优于它的另外一个策略S」。
在这种情况
下,s」在S中是严格占劣的
L
M
R
U
3,0_
0,-5
0,-4
C
1,-1
3,3
-2,4_
D
2,4
4,1
-1,8_
定义7.4重复删除严格非占劣策略
如果对于一切n-1,srSin,那么,对于局中人i而言,策略Si是S中的重复删除后留下的严格非占劣策略(或严格占
劣策略被重复删除后所留存的策略)
定义7.5弱占劣策略
对于一切s_i迂S-,Ui(?
s」)色Ui(Si,s」),并且至少有一个严格不等式成立,那么,对于局中人i,策略?
是弱占优于它的另外一个策略s。
在这种情况下,s在S中是弱占劣的。
ii
定义7.6重复删除弱非占劣策略
Si是S中的经重复删除过程所留下的弱占优策略(重复排除
弱占劣策略后留下的策略)。
7.2.2纳什均衡
定义7.7纯策略纳什均衡给定一个策略式博弈G二(Sj,ui)j=i,如果对于每一个局中人i,并且对于一切的Sj,5(?
)一Ui(Si,?
i),那么,策略组合?
S是一个纯策略纳什均衡。
给定其他参与人的(最优)策略,该参与人的纳什均衡策略
一定是最优的。
求纯策略纳什均衡的通用办法:
划线法。
有些策略式博弈可能拥有多重纳什均衡,如图7.4,也可能
没有一个纯策略纳什均衡,如下图:
守门员
射手
左
右
左
-1,1
1,-1
右
1,-1
-1,1
7.2.2.1混合策略
例1守门员和射手
最优策略:
各以0.5概率扑/射向左边/右边
例二:
社会福利博弈
流浪汉政府、、、
寻找工作
游荡
就济
3,2
-1,3
不救济
-1,1
0,0
上面博弈不存在纯策略纳什均衡
但是可能存在一个混合策略均衡:
政府(0.5,0.5)。
给定
政府混合策略,流浪汉寻找工作的期望效用是:
0.5*2+0.5*1=1.5;游荡的预期效用为0.5*3+0.5*0=1.5;
因而选择任何混合策略的期望效用都相同,并且都是对政府
所选择的混合策略的最优反映,特别的:
流浪汉:
(0.2,0.8)。
给定流浪汉的混合策略,政府救济的期望效用
=0.2*3+0.8*-仁-0.2;不救济的期望效用:
0.2*-1+0.8*0=-0.2;
混合策略(0.5,0.5)=-0.2*0.5+-0.2*0.5=-0.2。
所以,政府(0.5,0.5)和流浪汉(0.2,0.8)构成纳什均衡。
定义7.8混合策略
固定一个有限策略式博弈G二(Si,uj二。
参与人i的一个混
合策略是Si={Sii,Si2,...,Sik}上的一个概率分布
Mi二{叫‘m,...,%}。
这里,sii是纯策略,mik二m{Sik}
是i选择Sik的概率。
M二Xi=1Mi表示混合策略组合集合(混合策略空间),
M为一混合策略组合,mrMi是参与人的一个混合
策略。
如果Ui为期望效用函数,并且混合策略组合mM
被采用,则i的期望效用为:
m(m)二、mi(sj*…mN何)u,s)
s三S
例两人博弈:
Si={S11,S12,…,S1K},
Si二{S21,S22,…,S2J}。
如果参与人1相信参与人2的混合
策略为m2二(m21,…,m2J),参与人2相信参与人1的混
合策略为m1二(m11,…,m1k)
m21
5
m2J
S21
5
S2J
nm
Sn
5
5
miK
Sk
参与人1选择纯策略S1k的期望效用为:
m21u1(S1k,S21)m22u1(S1k,S22)…m2JU1(S1k,S2J)
每个人的期望效用都是
混合概率的线性函数;是
效用函数的凸组合9
KJ
=瓦瓦mikm2jUi(Sik,S2j)
i=1j=1
定义7.9纳什均衡
给定一个有限策略式博弈G二(Siu):
-,如果对于每个参与人i,对于一切Mi,总有Uj(m)色Ui(mj,m_i),那么,这个策略组合就是一个纳什均衡。
定理7.1简化的纳什均衡检验
如下命题a、b、c是等价的:
a、mM是一个纳什均衡;
b、对于每一个参与人i,对于每一个Si•Sj――由r?
i给定正权数,Uj(m)=Ui(Sj,m_i),并且对于每一个SieSi,——由m给定0权数,Ui(m)aUi(Si,m_j
社会福利博弈例
c、对于每一个参与人i,对于每一个S-Si,
Uj(m)-比(勺凤)
b表明:
1、混合策略均衡和进入混合策略均衡的纯策略的期
望收益是相等的,且每一个纯策略的期望收益都相等,例社
会福利博弈。
这样,每一个进入混合策略均衡的纯策略都是最优的,因而是无差异的。
2、混合策略均衡一定不比没有
进入混合策略均衡的纯策略差。
C表明:
混合策略均衡一定不比纯策略差。
证明:
思路a=b=c=a。
1、a-b
假设m?
是一个纳什均衡,因此,对于所有Mi,有
Uj(m)兰Ui(mi,m?
_i)。
特别的,任选Si壬Si,选择m为赋予Si的概率为1的策略(蜕化策略),使得事实上对于每一个Si,都有Ui(m)一Ui(Sj,m」)。
?
5・
推论:
每一个进入混合策略均衡的纯策略的期望收益都相等,因而
可以用期望收益相等法求解混合策略均衡。
例7.1
Wp(q)
Mw(1-q)
Wp(1-p)
2,1
0,0
Mw(p)
0,0
1,2
混合策略
对于2的混合策略(q,1-q),1选择纯策略wp和mw的收益
应该相等:
q*2+(1-q)*0=q*0+(1-q)*1
对于1的混合策略(1-p,p),2选择纯策略wp和mW勺收益
应该相等:
(1-p)*1+p*0=(1-p)*0+p*2
联立求解得:
p=q=1/3.
混合策略的概率的解释:
1、参与人随机的选择其纯策略,比如点球;
2、参与人对对方选择某一纯策略的信念(belief),如上
例中,参与人2认为参与人1选择wp的概率是2/3,选择mw的概率是1/3。
定理7.2纳什均衡存在性定理:
每一个有限策略式博弈都至少存在一个纳什均衡
证明:
Brouwer不定点定理:
设SRn是一个非空1的有界的闭2且凸3的集合。
设f:
s>S4是一个连续5映射。
那么,在S中至少存在一个f的不动点,这便是至少存在一个X*•S使得X*二f(X*)。
两维空间图示: