1、约翰海萨尼,1920年生于美国 1994年Nobel 经济学奖得主在非合作博弈的均衡分析理论方面做出了开创性的贡献,对博弈论和经济学产生了重大影响。莱因哈德泽尔腾,1930年生于德国 1994年Nobel 经济学奖得主背景冯诺依曼(Von Neumann),摩根斯坦恩(Morgenstern)(1944),博弈论和经济行为(The Theory of Games and Economic Behavior)。标志着博弈理论的初步形成Nash(1950,1951)两篇关于非合作博弈的重要文章,在非常一般的意义下。定义了非合作博弈及其均衡解,并证明了均衡解的存在。基本上奠定了现代非合作博弈论的基石
2、。第一章 导论1.什么是博弈论定定义义:关于包含相互依存情况中理性行为的研究。目的:决策,合理的预测思想:有限性,东方性 妻子 B F B 丈夫 F1,20,00,02,1性别战(battle of sexes)腐败问题的博弈分析 政府 监督 不监督 受贿 官员 不受贿R-F,F-C-SR,-S0,-C0,0贸易自由化的博弈分析 乙国 自由化 保护 自由化 甲国 保护10,10-10,2020,-10-5,-5大户与散户的博弈模型 散户 分析并进入 跟随大户进入 分析并进入大户 跟随散户进入0.7p-c,0.3p-c0.7p-c,0.3p0.7p,0.3p-c0,0国有股减持 投资者 支持 不
3、支持 减持 国有股东 不减持5,-6-8,-2-3,-1-5,0机构投资者之间的博弈分析 机构乙 合作 不合作 合作 机构甲 不合作0.5,0.5双方获利均为溢价的一半0,1乙获全部溢价1,0甲获全部溢价0,0双方获利均为零货币政策目标的博弈分析 企业 增加投资 不增加投资 增加货币供给中央银行 不增加货币供给0,2通货膨胀率10%经济增长率5%2,1通货膨胀率0%经济增长率10%-1,0通货膨胀率10%经济增长率0%1,3通货膨胀率0%经济增长率5%上市公司虚假信息披露行为的博弈分析发现()F-C+E,-F-D-C,0未发现(1-)-C,E-D0,E-D0,0证券监管机构上市公司 造假 不造
4、假检查不检查E:造假行为对上市公司的额外收益;F:监管机构发现公司造假后的惩罚;C:监管机构的检查成本;D:上市公司造假的成本;:监管机构成功查实公司造假行为之概率。2.博弈要素局中人策略纯策略空间Si=Si1,Si2,Siki盈利(支付)函数(payoff function):Ui(s)3.博弈的分类从信息的角度:完全信息、不完全信息从局中人行动的先后次序:静态博弈、动态博弈完全信息静态博弈完全信息动态博弈不完全信息静态博弈不完全信息动态博弈第一部分 完全信息静态博弈第二章 策略型博弈与Nash均衡1.博弈的正则型两人零和游戏(猜谜游戏)局中人2 1 2 局中人11,-1-1,1-1,11,
5、-112定定义义:n人博弈正则型(或策略型)表示指定了n个局中人的纯策略空间,以及对应每个策略组合的盈利函数U1,U2,Un,可将该博弈表示为:G=S1,S2,Sn;U1,U2,Un2.混合策略猜谜游戏无纯策略解设甲的策略为(p,1-p)乙的策略为(q,1-q)对于甲来说,如果乙伸一个指头,期望盈利为:p+(-1)(1-p)=2p-10p0.5如果乙伸两个指头,期望盈利为:-p+(1-p)=-2p+10 p0.5因此理想的混合策略是:(0.5,0.5)1,-1-1,1-1,11,-1定定义义:局中人i(i=1,2,n)中的一个混合 策 略 是 该 局 中 人 的 纯 策 略 空 间Si=(si
6、1,si2,siki)上的一个概率分布,可用i来表示。所有n个局中人各自的混合策略1,2,n是独立的。n个混合策略构成的=1,2,n是一个策略组合(策略剖面,profile)。i(si j)表示第i个局中人混合策略i在纯策略si j上的概率,因此局中人i在混合策略上的期望盈利为:算例 局中人2 L M R U局中人1 M D4,35,16,22,18,43,63,09,62,8局中人1的混合策略:1=(1(U),1(M),1(D)=(1/3,1/3,1/3)局中人2的混合策略:2=(2(U),2(M),2(D)=(0,1/2,1/2)策略组合:=(1,2)4,35,16,22,18,43,63
7、,09,62,8局中人1策略组合 的期望盈利为:U1()=4*1/3*0+5*1/3*1/2+6*1/3*1/2+2*1/3*0+8*1/3*1/2+3*1/3*1/2+3*1/2*0+9*1/3*1/2+2*1/3*1/2 =11/2局中人1的混合策略:=(1,2)4,35,16,22,18,43,63,09,62,8局中人2策略组合 的期望盈利为:U2()=3*1/3*0+1*1/3*1/2+2*1/3*1/2+1*1/3*0+4*1/3*1/2+6*1/3*1/2+0*1/2*0+6*1/3*1/2+8*1/3*1/2 =9/23.累次严优(iterated dominance)隐含着N
8、ash均衡的思想 局中人2 L M R U局中人1 M D4,35,16,22,18,43,63,09,62,8 局中人2 L M R4562833923121460684,35,16,22,18,43,63,09,62,8局中人1 局中人2 L R U局中人1 M D 局中人2 L R局中人1 U4,36,22,13,63,02,84,36,2312146068合理,符合逻辑的过程,得到累次严优的解为:局中人2 L 局中人1 U累次严优的局限性 4,3严劣纯策略定义定义:对局中人i的某个纯策略si,如果存在混合策略i*,使得s-i S-iUi(i*,s-i)Ui(si,s-i)且在S-i中至
9、少存在一个纯策略组合s-i*S-i,使上式中的不等号严格成立Ui(i*,s-I*)Ui(si,s-I*)则称纯策略si为局中人i的弱劣纯策略。如果对一切s-i S-I,上式中的不等式严格的成立Ui(i*,s-i)Ui(si,s-i)s-i S-i 则称si为局中人i的严劣纯策略。4.累次严优的应用囚徒困境 乙 坦白 抗拒 坦白 甲 抗拒-8,-8 0,-15-15,0-1,-1虽然(坦白,坦白)是累次严优的解,但不是有效解。定义定义:如果不存在其他的结局,使得某些局中人的效用(盈利)比在这个结果的效用好,同时又不会使其他局中人的效用变的更差,则称博弈的这个结局是有效的。(抗拒,抗拒)是有效的,
10、但不是博弈的解。个体理性并非一定导致集体理性。教案网址密码:123456使用方法:1.进入:2.点击右上角的:电邮3.输入用户名与密码,登录4.进入收件箱5.在主题下点击:class16.不扫描,直接下载第一章 策略型博弈与Nash均衡5.Nash均衡为什么要考虑均衡?均衡的含义役使原理工程问题和社会问题索罗斯:经济理论设法模仿物理学,古典经济学以牛顿为荣,却忘记牛顿曾在南海泡沫事件中丧失一大笔财富。索罗斯:我正好对真理有上瘾一般的渴望,因此我坚持社会科学是一种炼金术,不是科学。社会学家和自然科学家一样有心追求真理,但是他们有玩弄魔法的机会,自然科学家大致上没有这种机会。要防止滥用,最好的方法
11、是承认这种可能性。规律:预测的基础西方哲人苏格拉底的名言休谟:不可知论,规律的本质哈耶克:在社会的演进中,没有什么东西是不可避免的,使其成为不可避免的是思想。波普尔:科学的本质不可预测性与市场经济、法制社会。可知论定定义义:完全信息静态博弈问题中的混合策略组合i*,如果对所有的局中人i,均成立Ui(i*,*-i)Ui(sij,*-i),sij Si那么i*被称为该博弈的Nash均衡。如果 i*是退化的,那么就称为纯策略Nash均衡。严劣策略有没有可能是Nash均衡?累次严优解与Nash均衡的关系?寻找纯策略Nash均衡的方法:划线法a,eb,fc,gd,ha,eb,fc,gd,ha,eb,fc
12、,gd,ha,eb,fc,gd,ha,eb,fc,gd,h 妻子 B F B 丈夫 F1,20,00,02,1性别战(battle of sexes)贸易自由化的博弈分析 乙国 自由化 保护 自由化 甲国 保护10,10-10,2020,-10-5,-5国有股减持 投资者 支持 不支持 减持 国有股东 不减持5,-6-8,-2-3,-1-5,0机构投资者之间的博弈分析 机构乙 合作 不合作 合作 机构甲 不合作0.5,0.5双方获利均为溢价的一半0,1乙获全部溢价1,0甲获全部溢价0,0双方获利均为零猜谜游戏无纯策略解设甲的策略为(p,1-p)乙的策略为(q,1-q)固定乙的混合策略(q,1-
13、q),则甲的期望盈利为:pq+(1-p)(1-q)-p(1-q)-q(1-p)=1+4pq-2p-2q要使甲的收益达到最大:4q-2=0q=0.5同理可得:p=0.5因此理想的混合策略是:(0.5,0.5)1,-1-1,1-1,11,-1寻找混合策略Nash均衡的方法p1-pq1-q L R U D预测的稳定性问题3,02,23,20,1弱劣策略有没有可能是Nash均衡?严格均衡(Harsanyi,1973)定义定义:在策略型博弈G(S1,S2,Sn;u1,u2,un)中,如果每一个局中人关于其他局中人的策略具有唯一的最佳反应,这样的Nash均衡称做严格的(strict)。就是说假如s*=(s
14、*i,s*-i)是严格均衡,当且仅当s*是Nash均衡。且对所有的纯策略si s*,成立ui(si*,s*-i)ui(si,s*-i)懦夫博弈(chicken game)T W T W-1,-12,11,20,0多重Nash均衡 T W T W-1,-12,11,20,0聚焦法(schelling,1960)例:要求两个局中人各自独立写出(-0.5,0.5)中任意一个数,若两个人写的数一样,则给予奖励,否则给予惩罚。-0.50.50.5N人共同投资问题 大 小 大 小 10,10-1,11,-12,2风险占优 L R U D 10,100,88,07,7Pareto最优6、Nash均衡存在性定
15、理单纯形v1v2v2v1v3定定理理:如果f(x)连续的将一个非退化的单纯形映射到自身,则至少存在一个不动点x*=f(x*)Brower不动点定理Kakutani不动点定理定理定理:设X是N维实空间中的一个有界闭凸集,对于每一个xX,设F(x)是X中一个非空凸子集,假如“图”(x,y);y F(x)是闭的,则存在x*X,使得x*F(x*)集值函数Kakutani不动点定理证明Nash(1950)均衡存在性定理定理定理:任何有限正则型(或策略型)博弈具有混合策略均衡。Nash均衡存在性证明考虑两个局中人A、B,纯策略空间:SA=s1,sI,SB=s1,sJ盈利函数:aij,bijA、B的混合策略分别为:p=p1,pI,q=q1,qJ对于B的每一个混合策略q,A选取混合策略p极大化其效用函
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1