关于强盗分金博弈的两种模型和应用.docx

资源描述

关于强盗分金博弈的两种模型和应用.docx

《关于强盗分金博弈的两种模型和应用.docx》由会员分享，可在线阅读，更多相关《关于强盗分金博弈的两种模型和应用.docx（5页珍藏版）》请在冰豆网上搜索。

关于强盗分金博弈的两种模型和应用.docx

关于强盗分金博弈的两种模型和应用

姓名:

黄莹班号:

学号:

模型一:

问题描述:

5名强盗，夺得100个金币

分赃规则:

他们通过抓阄确定了提出方案的顺序，五个强盗分别抓到号码一、二、三、四、五。

号码是他们的发言顺序。

强盗1提出分配方案，若5名强盗（包括1自己）半数以上（不含半数）票同意，则实施1的方案，否则杀死1，由2提方案

2的方案由现有4名强盗投票，半数以上同意则实施2的方案，否则杀死2，然后由3提方案；如此反复，依此类推。

问：

强盗1如何提出自己的分配方案可以获得最大的好处（假设每个强盗都绝顶聪明且理性。

）

这就是为迪克西特所说的轮流出招的博弈，应用其法则1：

向前展望，倒后推理。

假设剩下最后强盗4和强盗5两个人时：

强盗4无论怎么分（除非全部100个金币都给强盗5）强盗5都会不同意，从而强盗4会因为不过半数而被杀，这样强盗5可以独霸100个金币。

这里说了强盗都是绝顶聪明且理性，所以对强盗3的方案强盗4否决会把自己推向很不利的境况，而强盗5则会竭力否决，因为只要强盗3的方案被否决了，强盗5接下来可以拿到100个金币。

所以强盗3知道了强盗4和强盗5的策略，因为那是强盗4和强盗5剔除劣势策略后的唯一策略，所以强盗3会有两种分发：

①（100，0，0）即他独自享有全部金币。

因为强盗4不接受的话接下来不但会一个金币也拿不到，还可能丢掉小命，所以一定要接受，这时强盗5反对也会2票比1票通过。

但仔细想想其实4号除了无条件支持3号之外，还有一个策略：

那就是提出（0，100）的方案，让5号独吞金币，换取自己的活命。

如果这个可能成立的话（不要忘了“完全理性”的假定，既然可以得到所有钱，5号其实并不必杀死4号），那么3号前面的策略就显然失败了，4号如果一文不得，他就有可能投票反对3号，让他喂鲨鱼。

你可能要反对：

作为理性人，4号干吗要做“损人不利己”的事呢？

而且，这多少还要冒可能被扔下强的风险？

是呀，有道理。

可是，如果大家都是理性人，5号在得钱后可以不杀死4号，那么对4号来说，投票赞成和投票反对3号都是一样的，也就是说，无论他怎么选择都可以。

3号当然不应该把希望寄托在4号的随机选择上。

如果我们允许有一点点“非理性”存在，即5号还是可能在不必要的情况下杀死4号，那么4号是不该冒这个风险；可是同理，3号也不该冒没有必要的风险。

无论是哪种情况，他都应该给4号1个金币，使其得到甜头，支持自己。

这样他的方案②就是（99，1，0）。

相比之下，方案二比方案一更为保险。

因此强盗3会选择方案二。

就在强盗4，强盗5和强盗3这样分析时，绝顶聪明的强盗2也分析到了强盗4和强盗5会支持自己，而强盗3则一定会反对，所以他会选择这样分：

97个给自己，2个给强盗4，1个给强盗5。

（因为强盗5最糟糕的是一个都没有，如果你不给一个给他，他一定会反对，同时威胁接下来的强盗：

“如果一个都不给我，我一定反对！

”。

强盗4则认为：

“强盗3至少会给1个给我，如果强盗2只给1个给我，我可以反对了再拿强盗3给我的1个金币，同时也可以给强盗3看看，如果你到时不给一个金币我，我会像否决强盗2一样否决你，然后全部100个金币都给强盗5。

）

强盗3想拿99个金币已经过不了绝顶聪明的强盗2的一关，但他可以通过支持强盗1的方案而避免一个金币都没有的最糟糕结果。

这时绝顶聪明的强盗1已经有了自己的方案了：

94给自己，1个给强盗3，3个给强盗4，2个给强盗5。

这里一定要给他们比强盗2给的方案多一个，要不他们很可能反对而接受强盗2的方案，分析跟上面的类似。

这样的方案一定可以通过，因为原题假设每个强盗都绝顶聪明且理性。

他们不会否

决后导致自己更不利的结果。

虽然眼睁睁的看着强盗1拿走了大头。

如果以为这道题就以强盗1的方案结束的话就错了，因为这个方案还不是强盗1的最优策略，这里只要3票就可以通过，所以可以放弃一张支持票而拿多点金币，所以强盗1放弃了最难拉拢的强盗4，因为他要3个金币才肯支持，所以强盗1的最后方案是：

97个给自己，1个给强盗3，2个给强盗5。

最后以3比2最终通过方案！

所以此模型博弈的最后结果（97，0，1，0，2）。

模型二：

问题描述:

5名强盗，夺得100个金币

分赃规则:

他们通过抓阄确定了提出方案的顺序，五个强盗分别抓到号码一、二、三、四、五。

号码是他们的发言顺序。

强盗1提出分配方案，若5名强盗（包括1自己）半数或半数以上票同意，则实施1的方案，否则杀死1，由2提方案

2的方案由现有4名强盗投票，半数以上同意则实施2的方案，否则杀死2，然后由3提方案；如此反复，依此类推。

问：

强盗1如何提出自己的分配方案可以获得最大的好处（假设每个强盗都绝顶聪明且理性。

）

50%是问题的关键，强盗可以投自己的票。

因此如果剩下两个人，无论什么方案都会被通过，即（100，0）。

往前推一步。

现在加一个更凶猛的强盗3。

强盗1知道———强盗3知道他知道———如果强盗3的方案被否决了，游戏就会只由强盗1和强盗2来继续，而强盗1就一个金币也得不到。

所以强盗3知道，只要给强盗1一个金币，强盗1就会同意他的方案（当然，如果不给强盗1一个金币，强盗1反正什么也得不到，宁可投票让强盗3去喂鱼）。

所以强盗3的最佳策略是：

强盗1得1个，强盗2什么也得不到，强盗3得99个。

　　强盗4的情况差不多。

他只要得两票就可以了，给强盗2一个金币就可以让他投票赞同这个方案，因为在接下来强盗3的方案中强盗2什么也得不到。

强盗5也是相同的推理方法只不过他要说服他的两个同伴，于是他给每一个在强盗4方案中什么也得不到的强盗1和强盗3一个金币，自己留下98个。

　　最终强盗5的最佳方案是：

他自己得98个，给每一个在强盗4方案中什么也得不到的强盗1、强盗3一个金币。

所以此模型博弈的最后结果（98，0，1，0，1）。

给此模型做一个推广：

我们在此模型的分析中运用了逆向分析。

从逆向分析中可以看到如下几个特点

–每个提出方案的强盗都要拉拢足够多的强盗支持以避免被扔下强；

–拉拢的对象是在上一步逆向分析中得钱最少的强盗；

因此，我们需要分析到底需要每一步的方案需要多少强盗支持，以及哪些强盗在上一步分析中得钱最少。

列出逆向分析的结果如下：

（100,0）

（99,0,1）

（99,0,1,0）

（98,0,1,0,1）

很容易看出，下一步的分钱方案中，只需要把上一步得钱非0的强盗的得钱数改为0，而其它强盗则反之。

进而有非0和0的间隔分布，除了提出方案的强盗外，其它得钱非0的强盗得到1块钱。

因此有50个强盗分1000个金币的情形为（X,0,1,…,0）

可得X=976

数学表述：

假设还剩2K个强盗时，分钱方案必为

[1]（a2K,…,a2,a1）＝（1001-K,0,1,0,…,1,0）

a2K=1001-K,a2i=1（i=1）

还剩下2K+1个强盗时，由[1]分钱方案必为

[2]（a2K＋1,…,a2,a1）＝（1001－K,0,1,0,1,….,0,1）a2K+1=1001-K,a2j-1＝1（j=1）。

说明：

由于a2j＋1（j

当剩下2K+2个强盗时，由[2]分钱方案必为

[3]（a2K＋2,…,a2,a1）＝（1001-K,0,1,0,…,1,0）

a2K＋2=1000-K,a2i=1（i=1）

说明：

由于a2i（i<=K）[3]中严格优于[2]，则有2K+2个强盗中有K+1个强盗支持此方案。

可以看到[1]可推出[3]，结合最后两个强盗时方案必为（1000,0），可以递推出50个强盗时必为（976,0,…,1,0）。

强盗分金博弈在实际中的体现和应用：

在“强盗分金”中无论是哪种模型，任何“分配者”想让自己的方案获得通过的关键是，事先考虑清楚“挑战者”的分配方案是什么，并用最小的代价获取最大收益，拉拢“挑战者”分配方案中最不得意的人们。

　“强盗分金”其实是一个高度简化和抽象的模型，体现了博弈的思想。

在“强盗分金”模型中，任何“分配者”想让自己的方案获得通过的关键是事先考虑清楚“挑战者”的分配方案是什么，并用最小的代价获取最大收益，拉拢“挑战者”分配方案中最不得意的人们。

想一想历朝历代的农民起义，想一想绵延起不断的宫廷斗争，想一想我们这个时代比比皆是的结盟与背叛，想一想企业内部的明争暗斗，想一想办公室脚下使绊的政治，哪一个得胜者不是采用的类似“强盗分金”的办法？

为什么革命者总是找穷苦人，因为他们是最失意的人。

为什么恐怖分子拉登在沙特阿拉伯没有市场，在阿富汗却大受欢迎，因为阿富汗是全球化的弃儿。

为什么企业中的一把手，在搞内部人控制时，经常是抛开二号人物，而与会计和出纳们打得火热，难道不是因为公司里的小人物好收买，而二号人物却总是野心勃勃地想着取而代之。

还可以举出许许多多的例证来。

比如，国际交易中的先发优势和后发劣势。

1号看起来最有可能喂鲨鱼，但他牢牢地把握住先发优势，结果不但消除了死亡威胁，还收益最大。

这不正是全球化过程中先进国家的先发优势吗？

而5号，看起来最安全，没有死亡的威胁，甚至还能坐收渔人之利，却因不得不看别人脸色行事而只能分得一小杯羹。

不过，模型任意改变一个假设条件，最终结果都不一样。

而现实世界远比模型复杂。

首先，现实中肯定不会是人人都“绝对理性”。

回到“强盗分金”的模型中，只要3号、4号或5号中有一个人偏离了绝对聪明的假设，强盗1号无论怎么分都可能会被扔到强里去了。

所以，1号首先要考虑的就是他的强盗兄弟们的聪明和理性究竟靠得住靠不住，否则先分者倒霉。

如果某人偏好看同伙被扔进强里喂鲨鱼。

果真如此，1号自以为得意的方案岂不成了自掘坟墓！

再就是俗话所说的“人心隔肚皮”。

由于信息不对称，谎言和虚假承诺就大有用武之地，而阴谋也会像杂草一般疯长，并借机获益。

如果2号对3、4、5号大放烟幕弹，宣称对于1号所提出任何分配方案，他一定会再多加上一个金币给他们。

这样，结果又当如何？

通常，现实中人人都有自认的公平标准，因而时常会嘟嚷：

“谁动了我的奶酪？

”可以料想，一旦1号所提方案和其所想的不符，就会有人大闹。

当大家都闹起来的时候，1号能拿着97枚金币毫发无损、镇定自若地走出去吗？

最大的可能就是，强盗们会要求修改规则，然后重新分配。

想一想二战前的希特勒德国吧！

而假如由一次博弈变成重复博弈呢？

比如，大家讲清楚下次再得100枚金币时，先由2号强盗来分。

然后是3号。

这颇有点像美国总统选举，轮流主政。

说白了，其实是民主形式下的分赃制。

最可怕的是其他四人形成一个反1号的大联盟并制定出新规则：

四人平分金币，将1号扔进大强。

这就是阿Ｑ式的革命理想：

高举平均主义的旗帜，将富人扔进死亡深渊。

制度规范行为，理性战胜愚昧！

此问题体现出的多方博弈情况下的生存哲学：

1、没有永恒的朋友，只有永恒的利益。

2、在临界点之下，以决策者的身份出场，冒最大的风险，得到最大的利益。

3、在接近临界点的地方，是收益分配最接近公平的地方。

半数的人均匀地受益，另半数的人均匀地不受益。

4、越过临界点之后，以决策者的身份出场，风险极大，甚至会将老本赔进去，而收益却为零，这是最糟的情况，因为大家的收益都不高。

这是一种不稳定的状态，系统会通过自我调整向临界点靠拢。

5、永远都不可能发生所有人都有收益的情况，任何时候都有至少一半或者接近一半人无收益，除非只有1个人。

展开阅读全文