管理经济学讲义-之博弈论篇PPT资料.ppt

上传人:b****3 文档编号:16095023 上传时间:2022-11-19 格式:PPT 页数:52 大小:352KB
下载 相关 举报
管理经济学讲义-之博弈论篇PPT资料.ppt_第1页
第1页 / 共52页
管理经济学讲义-之博弈论篇PPT资料.ppt_第2页
第2页 / 共52页
管理经济学讲义-之博弈论篇PPT资料.ppt_第3页
第3页 / 共52页
管理经济学讲义-之博弈论篇PPT资料.ppt_第4页
第4页 / 共52页
管理经济学讲义-之博弈论篇PPT资料.ppt_第5页
第5页 / 共52页
点击查看更多>>
下载资源
资源描述

管理经济学讲义-之博弈论篇PPT资料.ppt

《管理经济学讲义-之博弈论篇PPT资料.ppt》由会员分享,可在线阅读,更多相关《管理经济学讲义-之博弈论篇PPT资料.ppt(52页珍藏版)》请在冰豆网上搜索。

管理经济学讲义-之博弈论篇PPT资料.ppt

一局中人(players):

即博奕的参与者,他们是博奕的决策主体行为。

根据自己的利益要求决定自己的,记局中人为i,局中人集合为1,2,I,即共有I个局中人。

我们将某个局中人以外的其它局中人称为“i的对手”,记为-i。

一局中人即指每个局中人在对策中可以选择采用的行动方案,但这个方案必须是一个完整的行动,而不是行动的某一步。

每个局中人均有可供选择的多种策略。

二策略(strategies):

三支付或收益(payoffs):

二策略一局中人在策略型博奕中,一个对策有以下几种基本要素:

博弈论和对策行为q基本概念是指一局博奕的得失。

或者说是局中人从各种策略组合中获得的效用,它是策略组合的函数。

如果局中人得失的总和为零,则称这种对策为零和对策;

否则,称为非零和博奕。

例1.囚徒困境(prisonersdilemma)博弈论和对策行为q策略型博弈的实例和解(囚徒困境)囚徒囚徒BB坦白坦白抵赖抵赖囚徒囚徒AA坦白坦白-8-8,-8800,-1010抵赖抵赖-10-10,00-1-1,-11例1.囚徒困境(prisonersdilemma)博弈论和对策行为q策略型博弈的实例和解(囚徒困境)这个例子可以看作是非合作博奕现象的一个抽象概括。

它讲的是两个嫌疑犯被隔离审讯。

他们面临的处境是:

如果两人都坦白,各判刑8年;

如果两人都抵赖,各判刑1年(或许证据不足);

如果一人坦白另一人抵赖,则坦白的放出去,不坦白的判刑10年,(“坦白从宽、抗拒从严”)。

这里,两个囚徒就是两个局中人,每个局中人都有两个策略可供选择:

坦白或抵赖。

表中每一格的一对数字分别表示局中人不同策略组合的收益,第一个数字是囚徒A的收益,第二个数字是囚徒B的收益。

这种有限对策(局中人是有限个,每个局中人的策略数也是有限的)往往用矩阵形式表示。

例1.囚徒困境(prisonersdilemma)博弈论和对策行为q策略型博弈的实例和解(囚徒困境)在对博奕局势进行描述后,博奕论分析就是要求出局中人进行策略选择的理性结局,或者说找出博奕问题的解。

在非合作博奕中,有两种解的技术:

一种是纳什均衡,一种是优超解。

定义1:

给定其它局中人的策略s,局中人i的最优反应记为s,是指能给他带来最大收益的策略,即博弈论和对策行为q纳什均衡当每个局中人都选择了自己的最优反应策略,并且这些最优反应形成一个策略组合,便形成了纳什均衡。

定义2:

一个策略组合s*=(s1*,s2*,sn*)被称为纳什均衡是指,对于所有的i,博弈论和对策行为q纳什均衡纳什均衡的思想就是,博奕的理性结局是这样一种策略组合,其中每个局中人选择的策略都已是对其它局中人所选策略的最优反应,所以,谁也没有积极性去选择其它策略。

因为每一个局中人均不能因为单方面改变自己的策略而获利,于是谁也没有兴趣主动打破这种均衡。

在囚徒困境中,考虑囚徒A对他人的最优反应。

如果给定囚徒B的策略是“坦白”,那么对囚徒A来说,采取“坦白”策略得到的收益是-8,采取“抵赖”策略得到的收益是-10,显然“坦白”为好;

同理,如果给定囚徒B的策略是“抵赖”,对囚徒A来说,“坦白”也比“抵赖”好。

因此,囚徒A对囚徒B的最优反应是“坦白”。

对囚徒B作同样分析:

如果囚徒A的策略是“坦白”,则他采取“坦白”策略为好;

如果囚徒A的策略是“抵赖”,他还是采取“坦白”策略好,所以囚徒B对囚徒A的最优反应也是“坦白”。

两个最优反应形成了一个策略组合(坦白,坦白),这就是一个纳什均衡。

博弈论和对策行为q纳什均衡两个寡头企业选择产量的博奕就是一个囚徒困境问题。

回想一下古诺均衡的含义:

古诺均衡是指存在这样一对产量组合(q1*,q2*),使得:

假定企业2的产量为q2*时,q1*是企业1的最优产量;

假定企业1的产量为q1*时,q2*是企业2的最优产量。

按照纳什均衡的定义,古诺均衡(q1*,q2*)也就是博奕论中的纳什均衡。

纳什均衡只说明博奕的稳定性结局。

博弈论和对策行为q囚徒困境在经济学上的应用让我们再回到囚徒困境本身。

纳什均衡(坦白,坦白)表明两人共同的集体选择,但是这个选择是否是理性的?

理性选择是指使收益最大化的选择。

如果两人都抵赖,各判刑1年,显然比坦白各判刑8年好。

所以,纳什均衡(坦白,坦白)并不是一个集体理性选择。

但它却是个人理性选择的一个组合。

囚徒困境正是反映了一个深刻的问题,这就是个人理性与集体理性的矛盾。

博弈论和对策行为q囚徒困境在经济学上的应用博弈论和对策行为q囚徒困境在经济学上的应用一个非集体理性选择,如纳什均衡(坦白,坦白),用经济学术语说,其中存在“帕累托改进”的机会。

所谓帕累托改进就是说,它在不使另一部分人的境况变得更坏的前提下,至少能改进一部分人的境况。

如果不存在帕累托改进的情况,便达到“帕累托最优”。

这里,如果两人都选择抵赖,两人的境况都有所改进。

所以,(坦白,坦白)不是帕累托最优。

集体的理性选择应该是大家都抵赖。

但是这个帕累托改进办不到。

为什么?

因为我们已经验证,(坦白,坦白)这个策略组合正是一个纳什均衡。

在一个纳什均衡中,不会有人主动去打破这种格局的。

博弈论和对策行为q囚徒困境在经济学上的应用那么,两个囚徒事先订好攻守同盟,两人都采取抵赖的策略,不是可以改善两人的境遇吗?

但问题是,这个攻守同盟有没有意义?

没有。

原因在于(抵赖,抵赖)这个策略组合不是一个纳什均衡,没有人有积极性去遵守这个协议。

一般地,假设博奕中的每个局中人事先达成一项协议,规定了各自的行为规则。

如果局中人会自觉遵守这个协议,等于说这个协议构成了一个纳什均衡:

给定别人遵守协议的情况下,自己的最好选择就是也遵守协议。

相反,一个协议不构成纳什均衡时,它就不可能自动实施,因为至少有一个局中人会违背这个协议。

所以,不满足纳什均衡要求的协议是没有意义的。

博弈论和对策行为q囚徒困境在经济学上的应用以上的分析告诉我们,用经济学的观点来看,只有由满足个人理性选择的策略组成的集合才是均衡的,或者说只有纳什均衡才是稳定的。

博弈论和对策行为q囚徒困境在经济学上的应用看两个寡头合谋与价格卡特尔的情形,它也存在个人理性与集体理性的冲突。

在两个寡头合谋条件下的产量与价格决定,是基于两个寡头利润总和的最大化目标,而不是每个企业自己的利润最大化。

因此这种最大化目标下的产量分配符合两家企业的共同利益,却不是使每家企业自己的利润最大化的产量,换言之,并不是每家企业自己的“最优反应”。

所以,卡特尔产量分配不是一个纳什均衡。

正因为此,卡特尔下一定会有违约冲动,卡特尔具有不稳定性。

博弈论和对策行为q囚徒困境在经济学上的应用在军备竞赛中,人们年复一年的谈判,试图签订一个限制军备的条约。

但是这种条约也存在个人理性与集体理性的冲突。

签订条约对世界和平有利,但履行条约未必是各国行动的“最优反应”:

试想,如果我减少军备开支,而你增加军费支出,我不是受到威胁了吗?

所以,这种条约不构成纳什均衡,各国都有违约的冲动。

纳什均衡是各国都大量增加军费预算,结果军备竞赛就只好继续下去。

冷战时期前苏联和美国之间的军备竞赛就是典型一例,两国都在导弹上花了几万亿美元,如果把资源用于民品生产,两国的社会福利就会变得更好。

博弈论和对策行为q囚徒困境在经济学上的应用企业竞争而产生的广告资源浪费也是典型例子。

如两家寡头竞争,经理们可选择策略是“多做广告”和“少做广告”,各种策略组合的盈利矩阵如下表,企业1最优反应是多做广告,企业2最优反应也是多做广告,因此(多做广告,多做广告)是一个纳什均衡。

这个纳什均衡的结果是大量资源消耗在广告上。

企业企业22少做广告少做广告多做广告多做广告企业企业11少做广告少做广告3030,30301010,4040多做广告多做广告4040,10102020,2020博弈论和对策行为q囚徒困境在经济学上的应用纳什均衡概念的局限性在于,在博奕中有可能纳什均衡不是唯一的。

例:

两家寡头价格竞争,经理可选择的策略是价格不变或涨价,收益矩阵如下所示:

企业企业22价格不变价格不变涨价涨价企业企业11价格不变价格不变1010,1010100100,-30-30涨价涨价-20-20,3030140140,3535结果发现纳什均衡有两个:

(价格不变,价格不变)、(涨价,涨价)。

博奕中的实际结果取决于首先采取什么行动。

如果先前的情况是价格不变,那么这一博奕的预期结果就是价格不变。

另外,对有的博奕来说,也可能不存在纳什均衡。

博弈论和对策行为q策略型博弈的实例和解(性别战)例2.性别战(battleofthesexes)一男一女恋爱,有些业余活动要安排,或者去看足球比赛,或者去看芭蕾舞演出。

男的偏好足球,女的则更喜欢芭蕾舞,但他们都宁愿在一起,不愿分开。

下表给出收益矩阵:

女女足球足球芭蕾芭蕾男男足球足球22,1100,00芭蕾芭蕾00,0011,22博弈论和对策行为q策略型博弈的实例和解(性别战)例2.性别战(battleofthesexes)这个博奕中有两个纳什均衡:

(足球,足球)和(芭蕾,芭蕾)。

就是说,一方去足球场,另一方也会去足球场;

类似地,一方去看芭蕾,另一方也会去看芭蕾。

在实际生活中,也许是这一次看足球,下一次看芭蕾,如此循环,形成一种默契。

这在实际生活中是指,两种互补的活动应该配合,尽管配合的方式可能有很多种。

比如,两家工厂生产的产品可能是互补的,一家为另一家提供零配件,这里有一个标准的选择问题,由于种种原因,很可能在产品标准的选择上,生产成品的厂家与生产零配件的厂家之间有冲突。

这就需要相互妥协,但妥协的结果有两种可能,或者是生产零配件的厂家适应生产成品的厂家,或者是生产成品的厂家适应于生产零配件的厂家。

博弈论和对策行为q策略型博弈的实例和解(性别战)例2.性别战(battleofthesexes)博弈论和对策行为q策略型博弈的实例和解(性别战)例2.性别战(battleofthesexes)性别战的例子中有两个纳什均衡,那么,究竟那一个纳什均衡会实际发生?

我们不知道。

这里还有一个先动优势(first-moveradvantage),比如说,若男的先买

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 工程科技 > 电子电路

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1