ImageVerifierCode 换一换
格式:DOCX , 页数:5 ,大小:23.05KB ,
资源ID:4993619      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/4993619.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(博弈论经典模型全解析.docx)为本站会员(b****4)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

博弈论经典模型全解析.docx

1、博弈论经典模型全解析博弈论经典模型全解析(入门级)1. 囚徒困境这是博弈论中最最经典的案例了囚徒 困境,非常耐人寻味。 “囚徒困境”说的是两个囚犯的 故事。这两个囚徒一起做坏事,结果被警察发现抓了起 来,分别关在两个独立的不能互通信息的牢房里进行审 讯。在这种情形下,两个囚犯都可以做出自己的选择:或 者供出他的同伙 (即与警察合作,从而背叛他的同伙 ),或者 保持沉默 (也就是与他的同伙合作,而不是与警察合作 )。这两个囚犯都知道,如果他俩都能保持沉默的话,就都会被 释放,因为只要他们拒不承认,警方无法给他们定罪。但 警方也明白这一点,所以他们就给了这两个囚犯一点儿刺 激:如果他们中的一个人背

2、叛,即告发他的同伙,那么他 就可以被无罪释放,同时还可以得到一笔奖金。而他的同 伙就会被按照最重的罪来判决,并且为了加重惩罚,还要 对他施以罚款,作为对告发者的奖赏。当然,如果这两个 囚犯互相背叛的话,两个人都会被按照最重的罪来判决, 谁也不会得到奖赏。 那么,这两个囚犯该怎么办呢?是 选择互相合作还是互相背叛?从表面上看,他们应该互相 合作,保持沉默,因为这样他们俩都能得到最好的结果: 自由。但他们不得不仔细考虑对方可能采取什么选择。 A 犯 不是个傻子,他马上意识到,他根本无法相信他的同伙不 会向警方提供对他不利的证据,然后带着一笔丰厚的奖赏 出狱而去,让他独自坐牢。这种想法的诱惑力实在太

3、大 了。但他也意识到,他的同伙也不是傻子,也会这样来设 想他。所以 A 犯的结论是,唯一理性的选择就是背叛同 伙,把一切都告诉警方,因为如果他的同伙笨得只会保持 沉默,那么他就会是那个带奖出狱的幸运者了。而如果他 的同伙也根据这个逻辑向警方交代了,那么, A 犯反正也得 服刑,起码他不必在这之上再被罚款。所以其结果就是, 这两个囚犯按照不顾一切的逻辑得到了最糟糕的报应:坐 牢。 企业在信息化过程中需要与咨询企业、软件供 应商打交道的。在与这些企业打交道的过程中,我们不可 避免地也会遇到类似的两难境地,这个时候需要相互之间 有足够的了解与信任,没有起码的信任做基础,切不可贸 然合作。在对对方有了

4、足够的信任之后,诚意也是必不可 少的,如果没有诚意或者太过贪婪,就可能闹到双方都没 有好处的糟糕情况,造成企业之间的双输。 2. 智猪博 弈 在博弈论( Game Theory )经济学中,“智猪博弈”是 一个着名的纳什均衡的例子。假设猪圈里有一头大猪、一 头小猪。猪圈的一头有猪食槽,另一头安装着控制猪食供 应的按钮,按一下按钮会有 10 个单位的猪食进槽,但是谁 按按钮就会首先付出 2 个单位的成本,若大猪先到槽边, 大小猪吃到食物的收益比是 9: 1;同时到槽边,收益比是7 : 3;小猪先到槽边,收益比是 6 : 4。那么,在两头猪都有智慧的前提下,最终结果是小猪选择等待。 实际上小猪选择

5、等待,让大猪去按控制按钮,而自己选择“坐 船” (或称为搭便车)的原因很简单:在大猪选择行动的前提 下,小猪也行动的话,小猪可得到 1 个单位的纯收益 (吃到 3 个单位食品的同时也耗费 2 个单位的成本,以下纯收益计 算相同),而小猪等待的话,则可以获得 4 个单位的纯收 益,等待优于行动;在大猪选择等待的前提下,小猪如果 行动的话,小猪的收入将不抵成本,纯收益为 -1 单位,如 果小猪也选择等待的话,那么小猪的收益为零,成本也为 零,总之,等待还是要优于行动。 在小企业经营中,学会如何“搭便车”是一个精明的职业经理人最为基本的 素质。在某些时候,如果能够注意等待,让其他大的企业 首先开发市

6、场,是一种明智的选择。这时候有所不为才能 有所为! 高明的管理者善于利用各种有利的条件来为自 己服务。“搭便车”实际上是提供给职业经理人面对每一项花 费的另一种选择,对它的留意和研究可以给企业节省很多 不必要的费用,从而使企业的管理和发展走上一个新的台 阶。这种现象在经济生活中十分常见,却很少为小企业的 经理人所熟识。 3. 枪手博弈 有三个枪手,第一个枪手 A 的命中率是 80%, B 是 60%, C 是 40%。他们同时举枪瞄 准、同时射击另两个人中的一个,要尽可能消灭对手,每个人一次机会,一颗子弹,目标是努力使自己活下来。谁活下来的可能性最大?如果你认为枪法最准的 A 胜出,那 么你就

7、错了。 我们来看,如果你是 A,你毫无疑问的会瞄准对你威胁最大的 B,而B也会瞄准对他威胁最大的 A , 而C则也可能瞄准 A,那么三个人存活的概率都是多少 呢? A = 100% - 60% - (1-60%)* 40% = 24%B = 100% - 80% = 20% (因为命中率为 80%的 A 在瞄准他 )C = 100% (因为没 有人瞄准他) 原来,枪法最不准的 C 竟然活了下来。 那么,换一种玩法呢? 如果三个人轮流开枪,谁会生存 下来? 如果A先开枪的话,A还是会先打B,如果B被 打死了,则下一个开枪的就是 C,那么此时A生存的概率 为 60%,而 C 依然是 100%(他开

8、过枪后 A 没有子弹了,游 戏结束);如果打不死B,则下一轮在B开枪的时候一定会 全力回击,A的生存率为40%不管是否打死 A,第三轮 AB 的命运都掌握在 C 的手里了。 那么,如果游戏规则 规定必须由 C 先开枪,如果你是 C 怎么才能让自己活下来 呢? 答案是胡乱开一枪,只要不针对 AB 任何一人即 可。 当 C 开枪完毕, AB 还是会陷入互相攻击的困境。插播 1警察与小偷 令人沮丧的博弈结局。警察和小偷各只有一个机会去巡查或者偷盗 A 地或 B 地。 A 地的价 值大于 B 地,那么警察应该为了保护价值大而一直保护 A地吗。博弈论认为当然不是,警察的合理策略应当是有倾向于 A 以一定

9、概率的随机巡查。这个概率就是: p=A 地价 值/AB地总价值。这种情况下才能使小偷最大得手几率降至 最低。但是很不幸的是,此时的小偷谋求的是,最小得手 几率的最大化。也就是说,警察的最优策略将把小偷的最 差策略改良!这个便是冯诺伊曼提出的“最小最大定律”。 我们必须再一次感谢这个不完美的世界,因为现实之中, 类似的现象,对于一方仍然可以设法找到对手致命的规律 性行动(当然必须考虑到对方是不是一个更加老练的猎 手,故意放出的诱饵) 。而保持自己的行动的无序性,则有 可能成为欺骗策略的武器,这倒似张三丰所言道的:无招 胜有招。 4. 斗鸡博弈 两只斗鸡在决斗的时候,无论 选择进或退都是一个难题,

10、因为纳什均衡已经给出了一胜 一败的最优策略。在很多较量下,死拼将是得不偿失的, 因为很可能给第三者机会。因此,两个已经在战场的强势 力很可能自觉的遵循纳什均衡,当一方攻击时,另一方暂 退。虽然可能某方暂时受损,但较之于两败俱伤是好得多 的。不过,要维持这一状况,必须保证下一次先期受损的 一方发动攻势的时候,另一方同样的后退。于是这样的攻 击性行为开始变得“仪式化”,没有人真正流血。这只不过是 两个巨头玩弄的游戏,目的是警告后来者,想进来,那么 也得陪我们一起玩,可是你玩的起么? 这正是百 事的广告,即使暗含挑衅也最多只到“敢为中国红”这样的地步的原因。 插播 2协和谬误 欧洲 ZF 在大量投资

11、协和飞机后,终于不能自拔。即使前景黯淡,也撑着面子 投下去,非要走头无路才放弃。而这时投入的成本已经全 打水漂了。如果,发现不能继续的时候,就果敢放手,损 失会小得多。可是他们会、能这么做么?壮士断腕,是何 等的壮烈,却也是何等的艰难! 沉没成本很可能会延续 人们无畏的坚持。已经沉没的本该放弃,可惜大部分有赌 徒式的心理,相信阿基米德的杠杆终将启动。可惜他们在 爬到足够撬动杠杆的支点之前,已经窒息了。 协和谬 误,倒是给了人们半途而废的理由,会不会有人担心它的 滥觞会左右一些本该坚持的目标?的确有这个可能,但是 应该相信人们足够理智,完全可以比较沉没成本、机会成 本与未来收益的关系。看清了的,

12、必定会坦然地走出协和 谬误。 5. 蜈蚣博弈 一场颠前倒后的博弈。蜈蚣博弈 的机理是以最终的结果倒退至开始。这是一个睿智的策 略,因果相报,把握好因缘,自有好结果。它的另一个好 处,就是使得未来的计划明晰化,是你不再徘徊。只可 惜,很多时候,碌碌无为的我们并没有看透迷局的眼睛。 我们黑色的眼睛只习惯于黑夜。蜈蚣博弈也有一个致命的 悖论,仍旧是个人利益和集体利益的冲突,因为最后一次 的背叛收益始终优于合作。可悲的是,这一次背叛将由于 人性的理智,穿越时光隧道,回到原始的地点:人们将从 开始就拒绝合作。还是感谢我们这个不完美的世界吧,事 实上人们很少这样做。当然合作到最后的也很少,这意味 着,倒推

13、法只在中间阶段突然发生了作用,只不过谁也不 能预测,中间一步在哪里。在那里,我们只有冀望信任、 道德、良知等等。 6. 分蛋糕博弈 两个小孩怎么分蛋 糕?经典的故事,经典的解答:一个分,一个选。现实多 如此,权利的合理分配将有效促进公平与效率。经营权与 所有权的分置的确使得经济更加活力。不过分蛋糕的进阶 模型却强调了讨价还价的策略,分蛋糕不是一次性的,而 是多回合的,而且出现成本:蛋糕在融化。 时间称本的 加入,将使得分配变得复杂化。双方如果不能及时达成交 易,不仅集体的收益将减量,而且个体的收益也将减少。 在此情况下,利用时间称本以及威胁、承诺将对其中一方 极其有利。顾客可能迫于情势,必须尽

14、快结束谈判,这时 卖方却不慌不忙,故意拖延,顾客一方将不得不在价格上 作出妥协。 顾客一方当然也有策略,它的策略就是货比 三家,要求承诺或威胁。这个前提是买方市场的存在。顾 客还应当保护自己讨价还价的能力,这就是顾客有权投诉 商家。 7. 鹰鸽博弈 这个博弈很多人等同于斗鸡博弈。 不过,斗鸡是两个兼具侵略性的个体,鹰鸽却是两个不同 群体的博弈,一个和平,一个侵略。在只有鸽子一个苞谷 场里,突然加入的鹰将大大获益,并吸引同伴加入。但结果不是鹰将鸽逐出苞谷场,而是一定比例共存,因为鹰群增加一只鹰的边际收益趋零时(鹰群发生内斗) ,均衡将到 来。由此产生了 ESS进化上的稳定策略,也就是说一旦均 衡

15、形成,偏离的运动会受到自然选择的打击。也就是鹰群 饱满后,再试图加入的鹰将会被鹰群排挤。 进化上的稳定均衡最大的好处莫过于保持稳定。但问题在于形成强势 的路径依赖,也就是胜出的不一定是最好的。因为最好的 会被当作出头鸟干掉,这是个体的失败,集团的胜利以及 集体的止步不前。 8. 脏脸博弈 恍然大悟的博弈。三 个人在屋子里,不许说话。美女进来说:你们当中至少一 个人脸是脏的。三人环看,没有反应。美女又说:你们知 道吗?三人再看,顿悟,脸都红了。为什么?因为美女后 一句废话点破天机,三个人都知道脏脸的存在,而且推测 知道对方也知道了脏脸的存在(因为另两人脸没红,说明 他们看到脏脸了) ,而且知道对

16、方知道自己已经想到上一 步 循环开始,知识开始共同化,真相大白:三个人都是脏脸,所有人都脸红了。 这就是共同知识的作用,它的 作用显得有点可怕的强大。几乎是一招无影腿,杀人不见 血。在台面上的博弈之前,私下的算计已经置对手于死 地。不过,很可能对方也预料到这一点,早也想到这一 点,同时杀来。终于,形成双死局面。 当然,现实虽然 存在类似现象,不过共同知识更大的作用在于减少交易成 本。因为某些规则人尽皆知,双方只要各自依之行事就可以了。 信息均衡: 很显然,信息的作用在博弈之中 非常重要。将博弈论还原到现实,人们不再完全理性,信 息存在不对称,博弈就需要在抢占信息高地上作出努力。 信息不对称,是

17、一个很大的障碍。信息的不对称会造成“逆 向选择”和“道德风险”,前者事前,后者事后。信息不对称 短期内对某一方会有利,但最终会破坏整个市场。于是有 两个解决策略。 信息传递:传达你的正面的信息的策 略,也就是说吸引顾客走到你的柜台面前。它的要点是保 持有效、减低成本。 信息甄别:诱导对手暴露其私下 拥有的真实信息。就是给顾客一个放大镜,保证顾客不会 走到其他柜台去。这种策略显然更加有效,不过风险也更 大:万一顾客用放大镜看出了了自己的瑕疵怎么办? 插播 3博傻理论 在资本市场中(如股票、期货市场):人们之所以完全不管某个东西的真实价值而愿意花 高价购买,是因为他们预期会有一个更大的笨蛋会花更高

18、 的价格从他们那儿把它买走。 “博傻理论”所要揭示的就 是投机行为背后的动机,投机行为的关键是判断“有没有比 自己更大的笨蛋”,只要自己不是最大的笨蛋,那么自己就 一定是赢家,只是赢多赢少的问题。如果再没有一个愿意 出更高价格的更大笨蛋来做你的“下家”,那么你就成了最大 的笨蛋。可以这样说,任何一个投机者信奉的无非是“最大 的笨蛋”理论。 何谓博傻? 博傻是指在高价位买进 股票,等行情上涨到有利可图时迅速卖出,这种操作策略 通常被市场称之为傻瓜赢傻瓜,所以只能在股市处于上升 行情中适用。从理论上讲博傻也有其合理的一面,博傻策 略是高价之上还有高价,低价之下还有低价,其游戏规则 就像接力棒,只要

19、不是接最后一棒都有利可图,做多者有 利润可赚,做空者减少损失,只有接到最后一棒者倒霉。 在艺术品市场中:预期会有人花更高的价格从你手中买走 它 博弈论中的笨蛋理论( Theory of Greater Fool ): 你之所以完全不管某件艺术品的真实价值,即使它一文不 值,也愿意花高价买下,是因为你预期会有更大的笨蛋花 更高的价格从你手中买走它。而投资成功的关键就在于能 否准确判断究竟有没有比自己更大的笨蛋出现。只要你不 是最大的笨蛋,就仅仅是赚多赚少的问题。如果再也找不 到愿意出更高价格的更大笨蛋从你手中买走这件艺术品的 话,那么,很显然你就是最大的笨蛋了。 9. 以牙还牙 是一个用于博弈论

20、的重复囚徒困境( Reiterated Prisoners Dilemma )非常有效的策略。也就是说,人家怎么对你,你 也怎么对他。说得再准确点,这个策略在开局时选择合 作,以后则模仿对手在上一期的行动。 这一策略有两个 步骤: 第一个回合选择合作 下一回合是否选合作要 看上一回对方是否合作,若对方上一回背叛,此回合我亦背叛;若对方上一回合作,此回合继续合作 以牙还牙策 略有四个特点:友善:以牙还牙者开始一定采取合作态 度,不会背叛对方 报复性:遭到对方背叛,以牙还牙者 一定会还击作出报复 宽恕:当对方停止背叛,以牙还牙 者会原谅对方,继续合作 不羡慕对手:以牙还牙者个人 永远不会得到最大利

21、益,整个策略以全体的最大利益为依 归 10. 手表定律手表定律是指一个人有一只表时,可以知道现在是几点 钟,而当他同时拥有两只表时却无法确定。两只表并不能 告诉一个人更准确的时间,反而会让看表的人失去对准确 时间的信心。你要做的就是选择其中较信赖的一只,尽力 校准它,并以此作为你的标准,听从它的指引行事。记住 尼采的话:“兄弟,如果你是幸运的,你只需有一种道德而 不要贪多,这样,你过桥更容易些。” 如果每个人都“选择你所爱,爱你所选择”,无论成败都可以心安理得。然 而,困扰很多人的是:他们被“两只表”弄得无所,心身交 瘁,不知自己该信仰哪一个,还有人在环境、他人的压力 下,违心选择了自己并不喜欢的道路,为此而郁郁终生, 即使取得了受人瞩目的成就,也体会不到成功的快乐。 手表定理在企业经营管理方手表定律面给我们一种非常直 观的启发,就是对同一个人或同一个组织的管理不能同时 采用两种不同的方法,不能同时设置两个不同的目标。甚 至每一个人不能由两个人来同时指挥,否则将使这个企业 或这个人无所适从。手表定理所指的另一层含义在于每个 人都不能同时挑选两种不同的价值观,否则,你的行为将 陷于混乱。

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1