博弈论教程PPT格式课件下载.ppt

资源描述

博弈论教程PPT格式课件下载.ppt

《博弈论教程PPT格式课件下载.ppt》由会员分享，可在线阅读，更多相关《博弈论教程PPT格式课件下载.ppt（243页珍藏版）》请在冰豆网上搜索。

博弈论教程PPT格式课件下载.ppt

要针对对方的行为选择作出对自己最有利的反应。

33、博弈论的分类、博弈论的分类

（1）

（1）合作博弈合作博弈研究人们达成合作时如何分配合作得到的收益，即收益分配问题。

（2）

（2）非合作博弈非合作博弈研究人们在利益相互影响的局势中如何选决策使自己的收益最大，即策略选择问题。

（3）完全信息不完全信息博弈：

参与者对所有参与者的策略空间及策略组合下的支付有充了解称为完全信息；

反之，则称为不完全信息。

（4）（4）静态博弈和动态博弈静态博弈和动态博弈静态博弈：

指参与者同时采取行动，或者尽管有先后顺序，但后行动者不知道先行动者的策略。

动态博弈：

指双方的的行动有先后顺序并且后行动者可以知道先行动者的策略。

博弈的分类及对应的均衡博弈的分类及对应的均衡静态动态完全信息完全信息静态博弈完全信息静态博弈纳什均衡；

Nash（1950）完全信息动态博弈完全信息动态博弈子博弈精炼纳什均衡；

泽尔腾（1965）不完全信息不完全信息静态博弈不完全信息静态博弈贝叶斯纳什均衡；

海萨尼（1967-1968）不完全信息动态博弈不完全信息动态博弈精炼贝叶斯纳什均衡；

泽尔腾（1975）Kreps,Wilson（1982）,Fudenberg,Tirole（1991）1.1.2一个非技本性的定义规定或定义一个博弈需要以下几个方面：

1参与人参与人（Player）（Player）（局局中人）中人）指博弈中的决策主体，他的目的是通过选择行动（或策略）以最大化自己的支付（效用）水平，参与人可以是自然人、团体、自然（“上帝”作为虚拟的参与人）。

2各个参与人各自可选择行动集行动集（action（actionset）set）,Ai=ai,是其可以采用的全部行动的集合。

一个行动组合（actionproile）是一个由博弈中的n个参与人每个选取一个行动所组成的有序集a=（a1,a2,an）。

3.参与人i的策略策略（strategy）（strategy）是如下的一项规则:

给定其信息集,该策略决定在博弈的每一时点他选择何种行动。

参与人i的策略集（strategyset）Si=si是其可行策略的集合。

策略组合（strategyprofile）s=（s1,s2,sn）是由博弈的n个参与人每人选择一个策略所组成的一个有序集。

4.参与人i的得益得益（支支）（）（payoff）payoff）ui（s1,s2,sn）表示这样的含义:

在所有的参与人和自然都选择了各自的策略且博弈已经完成后,参与人i获得的效用。

参与人i获得的期望效用，该期望效用是参与人i及其他参与人所选择的策略的函数。

5.一个博弈的结果是指在博弈结束以后，建模者从行动、得益和其他变量的取值中所挑选出来的他所感兴趣的要素的集合。

1.2几类经典的博弈模型1.2.1囚徒的困境囚徒的困境（prisonersdilemma）囚徒囚徒A坦白不坦白囚徒囚徒B坦白不坦白5,50,1010,01,1这个例子本身就部分奠定了非合作博弈论的基础。

1.2.2智猪博弈智猪博弈猪圈里有两头猪:

大猪和小猪,猪圈的一头有一个猪食槽,另头装有个按纽,控制着猪食的供应,按一下就会有10单位的猪食进槽,但谁按谁就要付出相当于2单位猪食的成本成本;

当猪食进槽时,若大猪先到,大猪可吃到9单位;

小猪先到,则小猪可吃到4单位,大猪吃6单位;

若两者同时到,叫大猪可吃7单位,小猪吃3单位。

小猪小猪大大猪猪按等按等5,14,49,10,01.2.3性别战性别战1.2.4斗鸡博弈斗鸡博弈女女足球芭蕾男男足球芭蕾2,10,00,01,3AB进退进退3,32,00,20,01.2.5市场进入阻挠1.2.6猜硬币博弈1.2.7石头剪子布默许在位者进入者进入不进入斗争40,5010,00,3000,300猜硬币方正反正反盖硬币方1,11,11,11,1石头石头剪子剪子布布石头石头剪子剪子布布0,01,11,11,10,01,11,11,10,0AB1.3博弈的结构和博弈的分类1.3.1博弈中的博弈方一、单人博弈实际上是最优化问题，或者是一个参与人与“自自然然”的博弈。

二、双人博弈最常见、研究得最多的博弈双人博弈中的两个博弈方之间并不总是相互对抗的。

（互补性问题）掌握信息较多的一方并不能保证获益大。

个人追自身的最大利益并不能保证所得最优。

三、多人博弈可能存在“破坏者”与“联盟”。

1.3.2博弈中的策略博弈中独立决策、独立承担博弈结果的个人或组织称为博弈方。

博弈中各博弈方的决策内容称为“策略“，但应注意到并不是每个博弈方都有相同的可选略。

如果在一个博弈中每个博弈方的策略数都是有限的，则称该博弈为有限博弈；

否则就称为无限博弈。

1.3.3博弈中的得益（支付,payoff）得益指在一个特定的策略组合策略组合下参与人得到效用水平,即各个博弈方从博弈中所获得的利益.一、零和博弈二、常和博弈三、变和博弈国内常见的博弈论参考书:

1.经济博弈论（第二版）谢识予编著复旦大学出版社,20022.博弈论与信息经济学张维迎著,上海三联书店、上海人民出版社3.博弈论施锡铨著,上海财经大学出版社,20024.GameTheory,1991,D.Fudenberg&

J.Tirole中译本,中国人民大学出版社第二章完全信息静态博弈2.1基本分析思路和方法博弈可以有两种不同的表达方式：

策略式策略式（Normal）表述和扩展式扩展式（extensive）表述，从理论上来讲，这两种表述形式几乎是完全等价的，但从分析的方便性来看，策略式更适合表述静态博弈。

在策略式表述中，所有参与人同时选择各自的策略，所有参与人选择的策略一起决定每个参与人的支付。

这里的“同时选择”的是策略，而不是行动。

这里的“同时”是一个信息概念,而不是一个时间概念。

可以设想,参与人是处于不同的房间里,要求在彼此没有联络的情况下,选择一个按纽。

通常还假设,所有的参与人都知道博弈的结构,知道他们的对手知道这一结构,知道他们的对手了解他们知道如此直至无穷,也即博弈的结构是共同知识。

更准确地,策略式表述给出:

博弈的参与人集合:

i,=1,2,n每个参与人的策略空间Si,i=1,2,n策略组合（s1,s2,sn）（4）每个参与人的支付（收益）函数ui=（s1,si,sn）,i=1,2,n一般用G=S1,S2,Sn;

u1,u2,un表示策略式博弈。

例LMRUMD4,35,16,22,18,43,63,09,62,8S1=U,M,D,S2=L,M,R支付用矩阵表示,称为双矩阵博弈。

参参与与人人A参参与与人人B2.1.1上策均衡（严格占优战略均衡）如果在某个博弈中,无论其他博弈方选择什么策略,一个博弈方的某个策略给他带来的支付始终不低于其他策略,则称该策略为这个博弈方的一个上策（优势策略Dominantstrategy）。

如果一个博弈的某个策略组合中所有策略都是各个博弈方自己的上策，则称这样的策略组合为该博弈的一个“上策均衡”。

例（囚徒的困境）囚徒囚徒AA坦白不坦白囚徒囚徒BB坦白不坦白55,550,0,101010,010,01,1,112.1.2严格下策反复消去法（逐步剔除严格劣战略）例LMRUMD8,35,16,22,18,43,09,62,83,6可以预测该博弈的合理结局为（U,L）,即参与人A选择策略U,而参与人B选择策略L。

2.2Nash均衡2.2.1Nash均衡的定义Nash均衡是指这样的策略组合策略组合（或剖面）:

为了极大化自己的收益（或效用）,每一个参与人所采取的策略一定应该是关于其他参与人所采取的策略的最佳反应.因此没有一个参与人会轻率地偏离这个策略组合而使自己蒙受损失。

定义在有n个参与人的博弈G=S1,S2Sn;

u1,u2,un）中,策略组合s*=（s1*,s2*,sn*）是一个Nash均衡,如果对于每一个i,si*是给定其他参与人的选择:

S-i*=（s1*,si-1*,si+1*,sn*）的情况下,第i个人的最优策略,即ui（si*,s-i*）ui（si,s-i*）,对所有的i或者用另一种表示方式,si*是下述最大化问题的解:

si*argui（s1*,si-1*,si,si+1*,sn*）,i=1,2,n因此,当且仅当没有一个参与人能从单方面背离某个策略组合的预见中增加自己的得益时,这个策略组合就是Nash均衡。

Si*SiNash均衡的哲学含义：

设想n个参与人在博弈前规定每一个参与人选择一个特定的策略。

s*=（si*,s-i*）代表这个协议，要问在没有外力强制的情况下，是否有参与人有积极性不遵守该协议？

如没有，则说明该协议是可以自动实施的。

能够自动实施的协议就可以看作一个Nash均衡。

例求下列博弈的Nash均衡：

CRLUMN0，44，05，34，00，45，33，53，56，6得Nash均衡为:

（D,R）.用划线法划线法可求Nash均衡有强弱之分.上述定义中给出的是弱Nash均衡,一个Nash均衡是强的,如果给定其他参与人的策略,每一个参与人的选择是唯一的。

即,s*是一个强Nash均衡,当且仅当对每一个i,sisi*总有:

ui（si*,s-i*）ui（si,s-i*）。

如果一个Nash均衡是强的,则没有任何参与人在均衡策略和其他策略之间是无差异的。

（弱Nash均衡不是）如在以下博弈中：

C1C2C3R1R2R32,121,101,120,120,100,110,120,120,13（R1,C1）和和（R1,C3）都是都是Nash均衡均衡,但没有但没有一个强一个强Nash均衡。

均衡。

本质上说,Nash均衡的概念对社会计划者和理论家施加了一个约束，使他们不能建议或者预测一种非均衡行为。

博弈论可预测到，在均衡集较小的局势中，文化规范的重要性也小。

2.2.2Nash均衡的一致性预测性质Nash均衡是参与人将如何博弈的“一致性”（consistent）预测:

如果所有参与人预测到一个特定的Nash均衡将出现,那么,没有人有兴趣作不同的选择。

也只有Nash均衡具有这样的特征：

参与人预测到均衡，参与人预测到其他参与人预到均衡等等。

对比之下，预测一个非Nash均衡的策略组合意味着至少有一个参与人会犯错误，尽管这样的错误确有可能出现。

说Nash是一致性预测并不意味着Nash均衡一定是一个好的预测，但只有Nash均衡才有：

“一致性”预测的性质。

重要结论：

一种制度安排要发生效力必须是一种Nash均衡（Nash执行的,NashImplementation）,否则,这种制度便不能“稳定”。

2.2.3Nash均衡与严格下策消去法命题2.1在博弈G=S1,S2,Sn;

u1,u2,un中,如果严格下策反复消去法排除了除（s1

展开阅读全文