博弈论的经典案例五篇.docx

资源描述

博弈论的经典案例五篇.docx

《博弈论的经典案例五篇.docx》由会员分享，可在线阅读，更多相关《博弈论的经典案例五篇.docx（5页珍藏版）》请在冰豆网上搜索。

博弈论的经典案例五篇.docx

博弈论的经典案例五篇

博弈论主要研究公式化了的激励结构间的相互作用，是研究具有斗争或竞争性质现象的数学理论和方法。

本站为大家整理的相关的博弈论的经典案例供大家参考选择。

博弈论的经典案例篇一

囚徒困境

学习管理学或经济学的人一定都了解一些博弈论方面的知识。

在博弈论中有一个经典案例囚徒困境，非常耐人回味。

“囚徒困境”说的是两个囚犯的故事。

这两个囚徒一起做坏事，结果被警察发现抓了起来，分别关在两个独立的不能互通信息的牢房里进行审讯。

在这种情形下，两个囚犯都可以做出自己的选择：

或者供出他的同伙（即与警察合作，从而背叛他的同伙），或者保持沉默（也就是与他的同伙合作，而不是与警察合作）。

这两个囚犯都知道，如果他俩都能保持沉默的话，就都会被释放，因为只要他们拒不承认，警方无法给他们定罪。

但警方也明白这一点，所以他们就给了这两个囚犯一点儿刺激：

如果他们中的一个人背叛，即告发他的同伙，那么他就可以被无罪释放，同时还可以得到一笔奖金。

而他的同伙就会被按照最重的罪来判决，并且为了加重惩罚，还要对他施以罚款，作为对告发者的奖赏。

当然，如果这两个囚犯互相背叛的话，两个人都会被按照最重的罪来判决，谁也不会得到奖赏。

那么，这两个囚犯该怎么办呢?

是选择互相合作还是互相背叛?

从表面上看，他们应该互相合作，保持沉默，因为这样他们俩都能得到最好的结果：

自由。

但他们不得不仔细考虑对方可能采取什么选择。

A犯不是个傻子，他马上意识到，他根本无法相信他的同伙不会向警方提供对他不利的证据，然后带着一笔丰厚的奖赏出狱而去，让他独自坐牢。

这种想法的诱惑力实在太大了。

但他也意识到，他的同伙也不是傻子，也会这样来设想他。

所以A犯的结论是，唯一理性的选择就是背叛同伙，把一切都告诉警方，因为如果他的同伙笨得只会保持沉默，那么他就会是那个带奖出狱的幸运者了。

而如果他的同伙也根据这个逻辑向警方交代了，那么，A犯反正也得服刑，起码他不必在这之上再被罚款。

所以其结果就是，这两个囚犯按照不顾一切的逻辑得到了最糟糕的报应：

坐牢。

当然，在现实世界里，信任与合作很少达到如此两难的境地。

谈判、人际关系、强制性的合同和其他许多因素左右了当事人的决定。

但囚徒的两难境地确实抓住了不信任和需要相互防范背叛这种真实的一面。

让我们看看冷战时期两个超级大国将自己锁定在一场40年的军备竞赛中，其结果对双方都毫无益处。

还有各国的贸易保护主义的永恒倾向。

但是，无论在自然界还是在人类社会，“合作”都是一种随处可见的现象。

那么，问题就出现了：

到底是何种机制促使生物体或者人类进行相互合作呢?

这个问题的答案大部分归功于美国密西根大学一位叫做罗伯特·爱克斯罗德的人。

爱克斯罗德是一个政治科学家，对合作的问题久有研究兴趣。

为了进行关于合作的研究，他组织了一场计算机竞赛。

这个竞赛的思路非常简单：

任何想参加这个计算机竞赛的人都扮演“囚徒困境”案例中一个囚犯的角色。

他们把自己的策略编入计算机程序，然后他们的程序会被成双成对地融入不同的组合。

分好组以后，参与者就开始玩“囚徒困境”的游戏。

他们每个人都要在合作与背叛之间做出选择。

但这里与“囚徒困境”案例中有个不同之处：

他们不只玩一遍这个游戏，而是一遍一遍地玩上200次。

这就是博弈论专家所谓的“重复的囚徒困境”，它更逼真地反映了具有经常而长期性的人际关系。

而且，这种重复的游戏允许程序在做出合作或背叛的抉择时参考对手程序前几次的选择。

如果两个程序只玩过一个回合，则背叛显然就是唯一理性的选择。

但如果两个程序已经交手过多次，则双方就建立了各自的历史档案，用以记录与对手的交往情况。

同时，它们各自也通过多次的交手树立了或好或差的声誉。

虽然如此，对方的程序下一步将会如何举动却仍然极难确定。

实际上，这也是该竞赛的组织者爱克斯罗德希望从这个竞赛中了解的事情之一。

一个程序总是不管对手作何种举动都采取合作的态度吗?

或者，它能总是采取背叛行动吗?

它是否应该对对手的举动回之以更为复杂的举措?

如果是，那会是怎么样的举措呢?

事实上，竞赛的第一个回合交上来的14个程序中包含了各种复杂的策略。

但使爱克斯罗德和其他人深为吃惊的是，竞赛的桂冠属于其中最简单的策略：

一报还一报（TITFORTAT）。

这是多伦多大学心理学家阿纳托·拉帕波特提交上来的策略。

一报还一报的策略是这样的：

它总是以合作开局，但从此以后就采取以其人之道还治其人之身的策略。

也就是说，一报还一报的策略实行了胡萝卜加大棒的原则。

它永远不先背叛对方，从这个意义上来说它是“善意的”。

它会在下一轮中对对手的前一次合作给予回报（哪怕以前这个对手曾经背叛过它），从这个意义上来说它是“宽容的”。

但它会采取背叛的行动来惩罚对手前一次的背叛，从这个意义上来说它又是“强硬的”。

而且，它的策略极为简单，对手程序一望便知其用意何在，从这个意义来说它又是“简单明了的”。

当然，因为只有为数不多程序参与了竞赛，一报还一报策略的胜利也许只是一种侥幸。

但是，在上交的14个程序中，有8个是“善意的”，它们永远不会首先背叛。

而且这些善意的程序都轻易就赢了6个非善意的程序。

为了决出一个结果来，爱克斯罗德又举行了第二轮竞赛，特别邀请了更多的人，看看能否从一报还一报策略那儿将桂冠夺过来。

这次有62个程序参加了竞赛，结果是一报还一报又一次夺魁。

竞赛的结论是无可争议的。

好人，或更确切地说，具备以下特点的人，将总会是赢家。

1.善意的;2.宽容的;3.强硬的;4.简单明了的。

一报还一报策略的胜利对人类和其他生物的合作行为的形成所具有的深刻含义是显而易见的。

爱克斯罗德在《合作进化》一书中指出，一报还一报策略能导致社会各个领域的合作，包括在最无指望的环境中的合作。

他最喜欢举的例子就是第一次世界大战中自发产生的“自己活，也让他人活”的原则。

当时前线战壕里的军队约束自己不开枪杀伤人，只要对方也这么做。

使这个原则能够实行的原因是，双方军队都已陷入困境数月，这给了他们相互适应的机会。

一报还一报的相互作用使得自然界即使没有智能也能产生合作关系。

这样的例子很多：

真菌从地下的石头中汲取养分，为海藻提供了食物，而海藻反过来又为真菌提供了光合作用;金蚁合欢树为一种蚂蚁提供了食物，而这种蚂蚁反过来又保护了该树;无花果树的花是黄蜂的食物，而黄蜂反过来又为无花果树传授花粉，将树种撒向四处。

更广泛地说，共同演化会使一报还一报的合作风格在这个充满背信弃义劣行的世界上蔚然成风。

假设少数采取一报还一报策略的个人在这个世界上通过突变而产生了。

那么，只要这些个体能互相遇见，足够在今后的相逢中形成利害关系，他们就会开始形成小型的合作关系。

一旦发生了这种情况，他们就能远胜于他们周围的那些背后藏刀的类型。

这样，参与合作的人数就会增多。

很快，一报还一报式的合作就会最终占上风。

而一旦建立了这种机制，相互合作的个体就能生存下去。

如果不太合作的类型想侵犯和利用他们的善意，一报还一报政策强硬的一面就会狠狠地惩罚他们，让他们无法扩散影响。

现在，对博弈论的研究是如此地广泛，以致于有些人说最新的经济学和管理科学都已经利用博弈论的理论和工具重写过了。

博弈论中有很多有趣而富于哲理的案例，一报还一报就是其中的一个。

它那种善意、宽容、强硬、简单明了的合作策略无论对个人还是对组织的行为方式都有很大的指导意义。

博弈论的经典案例篇二

在美国西部的小镇上，三个枪手准备进行一场生死较量。

枪手甲枪法精准，十发八中;枪手乙枪法不错，十发六中;枪手丙枪法拙劣，十发四中。

假如三人同时开枪，谁活下来的概率大一些?

经详细分析，枪法最劣的枪手丙活下来的概率最大。

假如这三个枪手相互之间充满仇恨，意见不可能达成一致，作为枪手甲，他的最佳策略是对枪手乙开枪，因为这个人对他的威胁最大。

这样他的第一枪不可能瞄准丙。

同样，对于枪手乙来说，他也会把甲作为第一目标，一旦把他干掉，下一轮（如果还有下一轮的话）和丙对决，他的胜算较大;相反，如果他先打丙，即使活了下来，到了下一轮与甲对决时也是凶多吉少。

而丙呢?

自然他所选的目标人物也是甲，因为不管怎么说，枪手乙还是比甲差一些（尽管比自己强），如果一定要和某个人对决下一场的话，选择枪手乙，自己获胜的概率要比对决甲多少大一点。

于是，第一阵乱枪过后，甲还能活下来的概率非常小（将近10%），乙是20%，丙是100%。

通过概率分析，不难看出丙很可能在这一轮就成为胜利者，即使某个对手幸运地活下来，在下一轮的对决中也并非十拿九稳，毕竟丙还有胜出的机会。

而三人中作为强者的甲，却面临着最大的生存风险。

从这个博弈案例中可以总结出一个道理：

强者并非一定能赢，正所谓“木秀于林，风必摧之”。

博弈论的经典案例篇三

在博弈论（GameTheory）经济学中，“智猪博弈”是一个著名的纳什均衡的例子。

假设猪圈里有一头大猪、一头小猪。

猪圈很长，一头有一踏板，另一头是饲料的出口和食槽。

猪每踩一下踏板，另一边就会有相当于10份的猪食进槽，但是踩踏板以后跑到食槽所需要付出的“劳动”，加起来要消耗相当于2份的猪食。

问题是踏板和食槽分置笼子的两端，如果有一只猪去踩踏板，另一只猪就有机会抢先吃到另一边落下的食物。

踩踏板的猪付出劳动跑到食槽的时候，坐享其成的另一头猪早已吃了不少。

“笼中猪”博弈的具体情况如下：

如果两只猪同时踩踏板，同时跑向食槽，大猪吃进7份，得益5份，小猪吃进3份，实得1份;如果大猪踩踏板后跑向食槽，这时小猪抢先，吃进4份，实得4份，大猪吃进6份，付出2份，得益4份;如果大猪等待，小猪踩踏板，大猪先吃，吃进9份，得益9份，小猪吃进1份，但是付出了2份，实得-1份;如果双方都懒得动，所得都是0。

利益分配格局决定两头猪的理性选择：

小猪踩踏板只能吃到一份，不踩踏板反而能吃上4份。

对小猪而言，无论大猪是否踩动踏板，小猪将选择“搭便车”策略，也就是舒舒服服地等在食槽边，这是最好的选择。

现在来看大猪。

由于小猪有“等待”这个优势策略，大猪只剩下了两个选择：

等待，一份也得不到;踩踏板得到4份。

所以“等待”就变成了大猪的劣势策略，当大猪知道小猪是不会去踩动踏板的，自己亲自去踩踏板总比不踩强吧，只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。

博弈论的经典案例篇四

假设警察局抓住了两个合伙犯罪的嫌疑犯，但获得的证据并不十分确切，对于两者的量刑就可能取决于两者对于犯罪事实的供认。

警察局将这两名嫌疑犯分别关押以防他们串供。

两名囚徒明白，如果他们都交代犯罪事实，则可能将各被判刑5年;如果他们都不交代，则有可能只会被以较轻的妨碍公务罪各判1年;如果一人交代，另一人不交代，交代者有可能会被立即释放，不交代者则将可能被重判8年。

对于两个囚徒总体而言，他们设想的最好的策略可能是都不交代。

但任何一个囚徒在选择不交代的策略时，都要冒很大的风险，一旦自己不交代而另一囚徒交代了，自己就将可能处于非常不利的境地。

对于囚徒A而言，不管囚徒B采取何种策略，他的最佳策略都是交代。

对于囚徒B而言也是如此。

最后两人都会选择交代。

因此，囚徒困境反映了个体理性行为与集体理性行为之间的矛盾、冲突。

囚徒困境现象在现实生活中比比皆是。

记得姜昆和唐杰忠过去说过一个公共楼道占用问题的相声。

住户在公共楼道里堆满了杂物，结果大家都极不方便，以致即将分娩的妇女都没法及时被送往医院。

但你如果不占用公共楼道，别人也会占用。

每一居住面积狭小的住户从自我利益最大化出发，都会选择占用。

但占用的结果却最终损害了大家的利益。

前几年，我国彩电市场上，生产厂家基于自我利益选择大幅降价，但由此引发的价格战使所有生产厂家都遭受重创，这也是一种囚徒困境。

博弈论的经典案例篇五

在博弈论（GameTheory）经济学中，“智猪博弈”是一个著名的纳什均衡的例子。

假设猪圈里有一头大猪、一头小猪。

猪圈的一头有猪食槽，另一头安装着控制猪食供应的按钮，按一下按钮会有10个单位的猪食进槽，但是谁按按钮就会首先付出2个单位的成本，若大猪先到槽边，大小猪吃到食物的收益比是9∶1;同时到槽边，收益比是7∶3;小猪先到槽边，收益比是6∶4。

那么，在两头猪都有智慧的前提下，最终结果是小猪选择等待。

实际上小猪选择等待，让大猪去按控制按钮，而自己选择“坐船”（或称为搭便车）的原因很简单：

在大猪选择行动的前提下，小猪也行动的话，小猪可得到1个单位的纯收益（吃到3个单位食品的同时也耗费2个单位的成本，以下纯收益计算相同），而小猪等待的话，则可以获得4个单位的纯收益，等待优于行动;在大猪选择等待的前提下，小猪如果行动的话，小猪的收入将不抵成本，纯收益为-1单位，如果小猪也选择等待的话，那么小猪的收益为零，成本也为零，总之，等待还是要优于行动。

在小企业经营中，学会如何“搭便车”是一个精明的职业经理人最为基本的素质。

在某些时候，如果能够注意等待，让其他大的企业首先开发市场，是一种明智的选择。

这时候有所不为才能有所为!

高明的管理者善于利用各种有利的条件来为自己服务。

“搭便车”实际上是提供给职业经理人面对每一项花费的另一种选择，对它的留意和研究可以给企业节省很多不必要的费用，从而使企业的管理和发展走上一个新的台阶。

这种现象在经济生活中十分常见，却很少为小企业的经理人所熟识。

展开阅读全文