ImageVerifierCode 换一换
格式:DOCX , 页数:28 ,大小:247.95KB ,
资源ID:1242112      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/1242112.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(第七章博弈论.docx)为本站会员(b****2)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

第七章博弈论.docx

1、第七章博弈论7 博弈论 Game Theory7.1策略性决策的制定如果人和人的行为是相互影响的,那么一个人的决策必 须考虑到他人的决策和行为。对策论是对决策者之间的行为 的相互影响的研究。 因为对策论的研究特别强调决策者行为的理性,在过去的二十年间,对策论已被广泛地应用于经济 学中。确实大多数经济行为能够被看成是对策论的一个特殊 的情形。博弈的分类次序完全信息不完全信息静态静态完全信息静态不完全信息博弈动态动态完全信息动态不完全信息博弈本章开始详尽考察了策略式博弈并进而更详尽地讨论 了扩展式博弈。前一种是指行为者同时作出单一选择的博 弈,而后一种则指行为者序贯地作出行动选择。沿着这条路径,我

2、们将会遇到特定解的概念。我们将研 究的解的概念包括那些以占优观点、纳什均衡、贝叶斯一纳 什均衡、逆向归纳、子博弈完善均衡与序贯均衡等为基础的 概念。其中每个解概念比其前辈更复杂,并且知道在什么时 候应用这一个解而非另一个解是作为一个好的应用经济学 家的更为重要的一部分。一般地,这里有两种方法描述一个对策:策略(规范) 形式的表示和扩展形式的表示,博弈矩阵(支付矩阵)和博 弈树 博弈矩阵:由参与者、战略集、支付构成,通常来描述一个 静态的策略式博弈囚徒困境囚徒2抵赖坦白抵赖-1, -1-9, 0坦白0, -9-8, -8博弈树:参与者、战略、概率、支付,通常来描述一个动态的扩展式博弈7.2策略式

3、博弈策略式博弈的描述定义7.1策略式博弈1、 参与人players:指的是一个博弈中的决策主体,其目的 是通过选择行动策略以最大化自己的支付(效用)水平“自然”是虚拟参与人(pseudo-player),他在博弈的特定时点上以特定的概率选择随机行动。2、 行动actions参与人i的行动以ai表示,是他所能做的某一选择。参与人i的行动集(action set) Ai= ,是其可以采取的全部行动的集合。一个 行动组合(action profile)是一个由博弈中的n个参与人每人选择一个行动而组成的有序集,a=a i),(i=1,.,n).行动的顺序3、 信息information :是参与人有关

4、博弈的知识,如自然的 选择,其他参与人的特征和行动等知识。共同知识(Common Knowledge),每个参与者知道的知识,每个参与者知道每个参与者知道知识”, 私人信息,在博弈中(开始博弈前或博弈中) ,参与者i的私人信息是指他知道,但不是所有参与者的共同知识。4、 参与人的策略(strategy) s参与人在给定信息集下的行动规则,他规定参与人在每一时点选择何种行动。 Si表示参与人i的一个特定策略,符号S_i :其他所有人的战略。参与人的策略集 (strategy set;strategy space)或策略空间Si=s是其可行策略的集合。策略组合(strategy profile)s

5、=急,$)是由博弈的 n个参 与人每人选择一个策略的集合*策略不同于行动。*策略必须是完备的。比如:红军对付白军的策略是:人不 犯我,我不犯人;人若犯我,我必犯人。这个策略使白军不 敢犯我。但是策略必须包括人若犯我的情况。否则,就不能 保证敌人不犯我。5、 支付/收益payoff:是指在一个特定的策略组合下参与人 得到的确定效用水平(收益),或指参与人得到的期望效用 水平(收益)。u=(U1,U2,Ui,.un)为n个参与人的支付组合payoff profile。参与人i的支付是所有参与人的策略的函数: Ui : Sj :Ui=Ui(Si, Sj,Sn)6、 一个博弈(分析)的 结果outco

6、me是博弈分析者所感兴 趣的所有东西,如均衡策略组合,均衡行动组合,均衡支付组合等等,取决于博弈分析者的到底需要什么。7、 均衡是所有参与人的最优策略的组合:S*=(S1*, Si*,. ,Sn*)其中Si*表示第i个参与人在均衡条件下的最优策略:Ui(S*,S-i) Ui(Si,S-i)对任意的 s工 S*.721占优策略定义7.2严格占优策略对于一切 0, SSi ?,如果 Ui(?,S) Ui(Si,S)成立, 那么,对于局中人i,策略纟是严格占优的。如果一个参与人的某个策略是相对于其他参与人的所有策略的严格最优策略,那么这个策略就是严格占优的。LRU3,00,-4D2,4-1,8定义7

7、.3严格占劣策略对于一切s_j亡S_j ,比(?宀) 比( , s),那么,对于局中人i,策略?是严格占优于它的另外一个策略 S。在这种情况下,s在S中是严格占劣的LMRU3,0_0,-50,-4C1,-13,3-2,4_D2,44,1-1,8_定义7.4重复删除严格非占劣策略如果对于一切n - 1,sr Sin,那么,对于局中人i而言,策 略Si是S中的重复删除后留下的严格非占劣策略 (或严格占劣策略被重复删除后所留存的策略)定义7.5弱占劣策略对于一切s_i迂S- , Ui (? ,s)色Ui (Si ,s),并且至少有一个严 格不等式成立,那么,对于局中人 i,策略?是弱占优于它 的另外

8、一个策略s。在这种情况下,s在S中是弱占劣的。i i定义7.6重复删除弱非占劣策略Si是S中的经重复删除过程所留下的弱占优策略 (重复排除弱占劣策略后留下的策略)。7.2.2纳什均衡定义7.7纯策略纳什均衡 给定一个策略式博弈 G二(Sj,ui)j=i,如果对于每一个局中 人i,并且对于一切的Sj ,5 (?) 一 Ui (Si ,? i),那么,策略 组合? S是一个纯策略纳什均衡。给定其他参与人的(最优)策略,该参与人的纳什均衡策略一定是最优的。求纯策略纳什均衡的通用办法:划线法。有些策略式博弈可能拥有多重纳什均衡,如图 7.4,也可能没有一个纯策略纳什均衡,如下图:守门员射手左右左-1,

9、11,-1右1,-1-1,17.2.2.1 混合策略例1守门员和射手最优策略:各以0.5概率扑/射向左边/右边例二:社会福利博弈流浪汉 政府 、寻找工作游荡就济3,2-1,3不救济-1,10,0上面博弈不存在纯策略纳什均衡但是可能存在一个混合策略均衡: 政府(0.5 , 0.5 )。给定政府混合策略,流浪汉寻找工作的期望效用是:0.5*2+0.5*1=1.5 ;游荡的预期效用为 0.5*3+0.5*0=1.5 ;因而选择任何混合策略的期望效用都相同, 并且都是对政府所选择的混合策略的最优反映, 特别的:流浪汉:(0.2 ,0.8 )。给定流浪汉的混合策略,政府救济的期望效用=0.2*3+0.8

10、* -仁-0.2 ;不救济的期望效用:0.2*-1+0.8*0=-0.2 ;混合策略(0.5,0.5)=-0.2*0.5+-0.2*0.5=-0.2 。所以,政府(0.5,0.5 )和流浪汉(0.2,0.8 )构成纳什均 衡。定义7.8混合策略固定一个有限策略式博弈 G二(Si,uj二。参与人i的一个混合策略是Si = Sii , Si2,.,Sik 上的一个概率分布M i 二叫m,., %。这里,sii 是纯策略, mik 二 m Sik是i选择Sik的概率。M二X i =1M i表示混合策略组合集合(混合策略空间) ,M为一混合策略组合, mr M i是参与人的一个混合策略。如果Ui为期望

11、效用函数,并且混合策略组合 m M被采用,则i的期望效用为:m(m)二、 mi(sj* mN 何)u,s)s三S例两人博弈:Si = S11,S12,S1K ,Si二 S21,S22,S2J。如果参与人1相信参与人2的混合策略为m2二(m21,m2J ),参与人2相信参与人1的混合策略为m1二(m11,m1k)m 215m 2JS215S2JnmSn55miKSk参与人1选择纯策略S1k的期望效用为:m21 u1 (S1k,S21 ) m22 u1 (S1k,S22 ) m2JU1(S1k,S2J)每个人的期望效用都是混合概率的线性函数;是效用函数的凸组合 9K J=瓦瓦 mikm2jUi(S

12、ik,S2j)i =1 j =1定义7.9纳什均衡给定一个有限策略式博弈 G二(Siu):-,如果对于每个参与 人i,对于一切M i,总有Uj(m)色Ui(mj,m_i),那么, 这个策略组合就是一个纳什均衡。定理7.1简化的纳什均衡检验如下命题a、b、c是等价的:a、 m M是一个纳什均衡;b、 对于每一个参与人i,对于每一个Si Sj 由r?i给定 正权数,Uj(m)= Ui(Sj,m_i),并且对于 每一个Si e Si, 由 m 给定 0权数,Ui(m)a Ui (Si, m_j社会福利博弈例c、 对于每一个参与人i,对于每一个S- Si,Uj(m)-比(勺凤)b表明:1、混合策略均衡

13、和进入混合策略均衡的纯策略的期望收益是相等的,且每一个纯策略的期望收益都相等,例社会福利博弈。这样,每一个进入混合策略均衡的纯策略都是 最优的,因而是无差异的。 2、混合策略均衡一定不比没有进入混合策略均衡的纯策略差。C表明:混合策略均衡一定不比纯策略差。证明:思路a = b = c = a。1、a - b假设m?是一个纳什均衡,因此,对于所有 Mi,有Uj(m)兰Ui(mi,m?_i)。特别的,任选Si壬Si,选择m为赋 予Si的概率为1的策略(蜕化策略),使得事实上对于每一 个 Si,都有 Ui(m)一 Ui(Sj,m)。?5 推论:每一个进入混合策略均衡的纯策略的期望收益都相等,因而可以

14、用期望收益相等法求解混合策略均衡。例7.1Wp(q)Mw (1-q)Wp (1-p)2,10,0Mw (p)0,01,2混合策略对于2的混合策略(q,1-q ), 1选择纯策略 wp和mw的收益应该相等:q*2+(1 -q)*0=q*0+(1 -q)*1对于1的混合策略(1-p,p ), 2选择纯策略 wp和mW勺收益应该相等:(1- p)*1+p*0=(1 -p)*0+p*2联立求解得:p=q=1/3.混合策略的概率的解释:1、 参与人随机的选择其纯策略,比如点球;2、 参与人对对方选择某一纯策略的信念( belief ),如上例中,参与人2认为参与人1选择wp的概率是2/3, 选择mw的概率是1/3。定理7.2纳什均衡存在性定理:每一个有限策略式博弈都至少存在一个纳什均衡证明:Brouwer不定点定理:设S Rn是一个非空1的有界的闭2且凸3的集合。设f : s S 4 是一个连续5映射。那么,在S中至少存在一个f的不动点, 这便是至少存在一个 X * S使得X *二f (X*)。两维空间图示:

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1