浅谈生活中的博弈论Word格式.docx

资源描述

浅谈生活中的博弈论Word格式.docx

《浅谈生活中的博弈论Word格式.docx》由会员分享，可在线阅读，更多相关《浅谈生活中的博弈论Word格式.docx（10页珍藏版）》请在冰豆网上搜索。

浅谈生活中的博弈论Word格式.docx

海萨尼〔J.Narsanyi〕、普林斯顿大学约翰·

纳什〔J.Nash〕和德国波恩大学的赖因哈德·

泽尔滕〔ReinhardSelten〕。

1996年，授予英国剑桥大学的詹姆斯·

莫里斯〔JamesA.Mirrlees〕与美国哥伦比亚大学的威廉·

维克瑞〔WilliamVickrey〕。

2001年，授予美国加州大学伯克莱分校的乔治·

阿克尔洛夫〔GeorgeA.Akerlof〕生于1940年、美国斯坦福大学的迈克尔·

斯宾塞〔A.MichaelSpence〕和美国纽约哥伦比亚大学的约瑟夫·

斯蒂格利茨〔JosephE.Stiglitz〕。

2005年，授予美国马里兰大学的托马斯·

克罗姆比·

谢林（ThomasCrombieSchelling）和耶路撒冷希伯来大学的罗伯特·

约翰·

奥曼（RobertJohnAumann〕。

2007年，授予美国明尼苏达大学的里奥尼德·

赫维茨〔LeonidHurwicz〕、美国普林斯顿大学的埃里克·

马斯金（EricS.Maskin〕以及美国芝加哥大学的罗杰·

迈尔森（RogerB.Myerson〕。

　　2012年，授予美国经济学家埃尔文·

罗斯〔AlvinE.Roth〕与罗伊德·

沙普利因〔LloydS.Shapley〕。

三博弈论的基本概念

〔1〕决策人：

在博弈中率先作出决策的一方，这一方往往依据自身的感受、经验和外表状态优先采取一种有方向性的行动。

〔2〕对抗者：

在博弈二人对局中行动滞后的那个人，与决策人要作出基本反面的决定，并且他的动作是滞后的、默认的、被动的，但最终占优。

他的策略可能依赖于决策人劣势的策略选择，占去空间特性，因此对抗是唯一占优的方式，实为领导人的阶段性终结行为。

〔3〕局中人〔players〕：

在一场竞赛或博弈中，每一个有决策权的参与者成为一个局中人。

只有两个局中人的博弈现象称为“两人博弈”，而多于两个局中人的博弈称为“多人博弈”。

〔4〕策略〔strategies〕：

一局博弈中，每个局中人都有选择实际可行的完整的行动方案，即方案不是某阶段的行动方案，而是指导整个行动的一个方案，一个局中人的一个可行的自始至终全局筹划的一个行动方案，称为这个局中人的一个策略。

如果在一个博弈中局中人都总共有有限个策略，则称为“有限博弈”，否则称为“无限博弈”。

〔5〕得失〔payoffs〕：

一局博弈结局时的结果称为得失。

每个局中人在一局博弈结束时的得失，不仅与该局中人自身所选择的策略有关，而且与全局中人所取定的一组策略有关。

所以，一局博弈结束时每个局中人的“得失”是全体局中人所取定的一组策略的函数，通常称为支付〔payoff〕函数。

〔6〕次序〔orders〕：

各博弈方的决策有先后之分，且一个博弈不同，博弈就不同。

〔7〕博弈涉及到均衡：

均衡是平衡的意思，在经济学中，均衡意即相关量处于稳定值。

在供求关系中，某一商品市场如果在某一价格下，想以此价格买此商品的人均能买到，而想卖的人均能卖出，此时我们就说，该商品的供求到达了均衡。

所谓纳什均衡，它是一稳定的博弈结果。

纳什均衡（NashEquilibrium）：

在一策略组合中，所有的参与者面临这样一种情况，当其他人不改变策略时，他此时的策略是最好的。

也就是说，此时如果他改变策略他的支付将会降低。

在纳什均衡点上，每一个理性的参与者都不会有单独改变策略的冲动。

纳什均衡点存在性证明的前提是“博弈均衡偶”概念的提出。

所谓“均衡偶”是在二人零和博弈中，当局中人A采取其最优策略a*,局中人B也采取其最优策略b*,如果局中人仍采取b*,而局中人A却采取另一种策略a，那么局中人A的支付不会超过他采取原来的策略a*的支付。

这一结果对局中人B亦是如此。

这样，“均衡偶”的明确定义为：

一对策略a*（属于策略集A）和策略b*〔属于策略集B〕称之为均衡偶，对任一策略a（属于策略集A）和策略b〔属于策略集B〕，总有：

偶对〔a,b*〕≤偶对（a*,b*）≤偶对〔a*，b〕。

对于非零和博弈也有如下定义：

一对策略a*〔属于策略集A〕和策略b*〔属于策略集B〕称为非零和博弈的均衡偶，对任一策略a（属于策略集A〕和策略b〔属于策略集B〕，总有：

对局中人A的偶对〔a,b*〕≤偶对（a*,b*）;

对局中人B的偶对〔a*，b〕≤偶对（a*,b*）。

有了上述定义，就立即得到纳什定理：

任何具有有限纯策略的二人博弈至少有一个均衡偶。

这一均衡偶就称为纳什均衡点。

纳什定理的严格证明要用到不动点理论，不动点理论是经济均衡研究的主要工具。

通俗地说，寻找均衡点的存在性等价于找到博弈的不动点。

纳什均衡点概念提供了一种非常重要的分析手段，使博弈论研究可以在一个博弈结构里寻找比较有意义的结果。

但纳什均衡点定义只局限于任何局中人不想单方面变换策略，而无视了其他局中人改变策略的可能性，因此，在很多情况下，纳什均衡点的结论缺乏说服力，研究者们形象地称之为“天真可爱的纳什均衡点”。

塞尔顿〔R·

Selten）在多个均衡中剔除一些按照一定规则不合理的均衡点，从而形成了两个均衡的精炼概念：

子博弈完全均衡和颤抖的手完美均衡。

四、博弈的基本类型

（1）合作博弈——研究人们达成合作时如何分配合作得到的收益，即收益分配问题。

（2）非合作博弈——研究人们在利益相互影响的局势中如何选决策使自己的收益最大，即策略选择问题。

（3）完全信息不完全信息博弈：

参与者对所有参与者的策略空间及策略组合下的支付有充了解称为完全信息；

反之，则称为不完全信息。

（4）静态博弈和动态博弈

静态博弈：

指参与者同时采取行动，或者尽管有先后顺序，但后行动者不知道先行动者的策略。

动态博弈：

指双方的的行动有先后顺序并且后行动者可以知道先行动者的策略。

五、经典的博弈论

1.“囚徒困境”博弈

“囚徒困境”是1950年美国兰德公司提出的博弈论模型。

两个共谋犯罪的人被关入监狱，不能互相沟通情况。

如果两个人都不揭发对方，则由于证据不确定，每个人都坐牢1年；

假设一人揭发，而另一人沉默，则揭发者因为立功而立即获释，沉默者因不合作而入狱10年；

假设互相揭发，则因证据确实，二者都判刑8年。

由于囚徒无法信任对方，因此倾向于互相揭发，而不是同守沉默。

用表格表示如下：

甲沉默

甲背叛

乙沉默

二人同时服刑一年

乙服刑10年，

甲即时获释

乙背叛

甲服刑10年，

乙即时获释

二人同时服刑8年

囚徒困境假定每个参与者〔即“囚徒”〕都是利己的，即都寻求最大自身利益，而不关心另一参与者的利益。

参与者某一策略所得利益，如果在任何情况下都比其他策略要低的话，此策略称为“严格劣势”，理性的参与者绝不会选择。

另外，没有任何其他力量干预个人决策，参与者可完全按照自己意愿选择策略。

囚徒到底应该选择哪一项策略，才能将自己个人的刑期缩至最短？

两名囚徒由于隔绝监禁，并不知道对方选择；

而即使他们能交谈，还是未必能够尽信对方不会反口。

就个人的理性选择而言，检举背叛对方所得刑期，总比沉默要来得低。

试设想困境中两名理性囚徒会如何作出选择：

假设对方沉默时，背叛会让我获释，所以会选择背叛。

假设对方背叛指控我，我也要指控对方才能得到较低的刑期，所以也是会选择背叛。

二人面对的情况一样，所以二人的理性思考都会得出相同的结论-----选择背叛。

背叛是两种策略之中的支配性策略。

因此，这场博弈中唯一可能到达的纳什均衡，就是双方参与者都背叛对方，结果二人同样服刑8年。

囚徒困境博弈的一个假设是博弈方都是完全理性。

完全理性来源于经济学中的理性人假设，即博弈方都以个体利益最大化为目标，且有准确的判断选择能力，也不会“犯错误”。

以个体利益最大为目标被称为“个体理性”，有完美的分析判断能力和不会犯选择行为的错误称为“完全理性”。

完全理性包括追求最大利益的理性意识、分析推理能力、识别判断能力、记忆能力和准确行为能力等多方面的完美性要求，其中任何一方面不完美就不属于完全理性。

可以看出，这是一个要求非常严格的假设。

即便如此，完全理性仍在一个方面没有做出规定〔至少是没有意识到或明确地规定出来〕，就是思维方式，也即是博弈方是以将问题分解的方式来思考问题呢，还是以系统的整体的方式来思考问题的。

现在我们以系统的整体的思维方式来重新分析囚徒困境博弈。

警察的目的是获得证据，以使囚徒获得应有的惩罚，囚徒的目的是“获取”最少的惩罚。

双方的这种矛盾使得囚徒有串通的倾向，为了离间两个囚徒，警察确立了模型中的规则。

对每个囚徒来说，要想到达自身的目的，而不考虑整个模型设置的目的，很显然是不行的。

囚徒该如何选择呢？

答案是背叛。

如果囚徒看出了该模型的目的，假设选择沉默，以自推人，对方也会选择沉默，必然落入警察的圈套，此所谓鹬蚌相争，渔翁得利。

当两博弈方都用系统思维来考虑这个问题时，相互配合是其最好的选择，因为在完全理性假设前提下，自己选择沉默而另一方选择背叛，这种时机是没有的，这种饶幸心理也是取不得的，剩余的只有要不都沉默，要不都背叛，所以相互配合是其最好的选择，结果一定是背叛。

如果任何博弈方不是采用系统的思维方式来思虑这个问题的，因为一方用分解的思维方式来思考囚徒困境，他会选择沉默，那么另一方不管用什么思维方式来思考这个问题，选择沉默都是最好的，因此其结果必然是都沉默。

“囚徒困境”中双方的博弈都是以自身利益为主导，但他们之间没有建立起足够的信任，导致他们无法拿自己的利益来做赌注，因此他们只能选择最为保险的做法----背叛。

而两人背叛相比于两人合作来讲，服刑期却相差了整整7年，使得两人的利益都大大降低了，故从整体来看，两人都是亏了，并没有到达自己想要的目标。

当然，正因为两人的信任不足，所以双方都不敢冒险，因为冒险的结果很有可能就让自己陷入更加困难的困境----获刑10年。

因此，“囚徒困境”的关键之处在于双方的信任的建立。

“囚徒困境”如此，生活中我们也会遇到这种情况，比方：

广告战。

广告战是指两个公司互相竞争，二公司的广告互相影响，即一公司的广告较被顾客接受则会夺取对方的部分收入。

但假设二者同时期发出质量类似的广告，收入增加很少但成本增加。

但假设不提高广告质量，生意又会被对方夺走。

因此两个公司可以有两种选择：

〔1〕互相达成协议，减少广告的开支。

〔合作〕

〔2〕增加广告开支，设法提升广告的质量，压倒对方。

〔背叛〕

假设两个公司都不信任对方，无法合作，背叛就会成为支配性策略时，两个公司将陷入广告战，而广告成本的增加损害了两个公司的收益，这也就陷入囚徒困境。

而在在现实中，要两个互相竞争的公司达成合作协议是较为困难的，多数都会陷入囚徒困境中。

“智猪博弈”〔Pigs’payoffs〕是讲假设猪圈里有一头大猪、一头小猪。

猪圈的一头有猪食槽，另一头安装着控制猪食供给的按钮，按一下按钮会有10个单位的猪食进槽，但是谁按按钮就会首先付出2个单位的成本，假设大猪先到槽边，大小猪吃到食物的收益比是9∶1；

同时到槽边，收益比是7∶3；

小猪先到槽边，收益比是6∶4。

那么，在两头猪都有智慧的前提下，最终结果是小猪选择等待。

智猪博弈"

由约翰·

纳什（JohnFNash），1950年提出。

实际上小猪选择等待，让大猪去按控制按钮，而自己选择“坐船”（或称为搭便车）的原因很简单：

在大猪选择行动的前提下，小猪选择等待的话，小猪可得到4个单位的纯收益，而小猪行动的话，则仅仅可以获得大猪吃剩的1个单位的纯收益，所以等待优于行动；

在大猪选择等待的前提下，小猪如果行动的话，小猪的收入将不抵成本，纯收益为-1单位，如果小猪也选择等待的话，那么小猪的收益为零，成本也为零，总之，等待还是要优于行动。

用博弈论中的报酬矩阵可以更清晰的刻画出小猪的选择：

小猪

行动

等待

大猪

5,1

4,4

9,-1

0,0

从矩阵中可以看出，当大猪选择行动的时候，小猪如果行动，其收益是1，而小猪等待的话，收益是4，所以小猪选择等待；

当大猪选择等待的时候，小猪如果行动的话，其收益是-1，而小猪等待的话，收益是0,所以小猪也选择等待。

综合来看，无论大猪是选择行动还是等待，小猪的选择都将是等待，即等待是小猪的占优策略。

“小猪躺着大猪跑”的现象是由于故事中的游戏规则所导致的。

规则的核心指标是：

每次落下的事物数量和踏板与投食口之间的距离。

如果改变一下核心指标，猪圈里还会出现同样的“小猪躺着大猪跑”的景象吗？

试试看。

改变方案一：

减量方案。

投食仅原来的一半分量。

结果是小猪大猪都不去踩踏板了。

小猪去踩，大猪将会把食物吃完；

大猪去踩，小猪将也会把食物吃完。

谁去踩踏板，就意味着为对方奉献食物，所以谁也不会有踩踏板的动力了。

如果目的是想让猪们去多踩踏板，这个游戏规则的设计显然是失败的。

改变方案二：

增量方案。

投食为原来的一倍分量。

结果是小猪、大猪都会去踩踏板。

谁想吃，谁就会去踩踏板。

反正对方不会一次把食物吃完。

小猪和大猪相当于生活在物质相对丰富的“共产主义”社会，所以竞争意识却不会很强。

对于游戏规则的设计者来说，这个规则的成本相当高〔每次提供双份的食物〕；

而且因为竞争不强烈，想让猪们去多踩踏板的效果并不好。

改变方案三：

减量加移位方案。

投食仅原来的一半分量，但同时将投食口移到踏板附近。

结果呢，小猪和大猪都在拼命地抢着踩踏板。

等待者不得食，而多劳者多得。

每次的收获刚好消费完。

对于游戏设计者，这是一个最好的方案。

成本不高，但收获最大。

原版的“智猪博弈”故事给了竞争中的弱者〔小猪〕以等待为最正确策略的启发。

但是对于社会而言，因为小猪未能参与竞争，小猪搭便车时的社会资源配置的并不是最正确状态。

为使资源最有效配置，规则的设计者是不愿看见有人搭便车的，政府如此，公司的老板也是如此。

而能否完全杜绝“搭便车”现象，就要看游戏规则的核心指标设置是否合适了。

比方，公司的激励制度设计，奖励力度太大，又是持股，又是期权，公司职员个个都成了百万富翁，成本高不说，职工的积极性并不一定很高。

这相当于“智猪博弈”增量方案所描述的情形。

但是如果奖励力度不大，而且见者有份〔不劳动的“小猪”也有〕，一度十分努力的大猪也不会有动力了----就象“智猪博弈”减量方案一所描述的情形。

最好的激励机制设计就象改变方案三----减量加移位的方法，奖励并非人人有份，而是直接针对个人〔如业务按比例提成〕，既节约了成本〔对公司而言〕，又消除了“搭便车”现象，能实现有效的激励。

许多人并未读过“智猪博弈”的故事，但是却在自觉地使用小猪的策略。

股市上等待庄家抬轿的散户；

等待产业市场中出现具有赢利能力新产品、继而大举仿制牟取暴利的游资；

公司里不创造效益但分享成果的人，等等。

因此，对于制订各种经济管理的游戏规则的人，必须深谙“智猪博弈”指标改变的个中道理。

尤其是对于企业、政府等的决策层来讲，资源是有限的，而如何能使得有限的资源发挥出最大的价值，这就要看企业政府的决策如何了。

决策做得好，企业职工、政府机关人员都努力，而努力就有回报，资源就能更好地利用，从而创造出更大的价值，企业、政府的效益就越高。

而相反，决策不完善，让一些不付出的人也能拿到与努力付出的人一样的回报，就会打击那些努力的人，从而降低企业政府的效益，也会造成资源的不合理利用甚至浪费。

3.博弈价格战

现在我们经常会遇到各种各样的家电价格大战，彩电大战、冰箱大战、空调大战、微波炉大战„„这些大战的受益者首先是消费者。

每当看到一种家电产品的价格大战，百姓都会“没事儿偷着乐”。

在这里，我们可以解释厂家价格大战的结局也是一个“纳什均衡”，而且价格战的结果是谁都没钱赚。

因为博弈双方的利润正好是零。

竞争的结果是稳定的，即是一个“纳什均衡”。

这个结果可能对消费者是有利的，但对厂商而言是灾难性的。

所以，价格战对厂商而言意味着自杀。

从这个案例中我们可以引伸出两个问题，一是竞争削价的结果或“纳什均衡”可能导致一个有效率的零利润结局。

二是如果不采取价格战，作为一种敌对博弈论其结果会如何呢?

每一个企业，都会考虑采取正常价格策略，还是采取高价格策略形成垄断价格，并尽力获取垄断利润、如果垄断可以形成，则博弈双方的共同利润最大。

这种情况就是垄断经营所做的，通常会抬高价格。

另一种情况是厂商用正常的价格，双方都可以获得利润：

从这一点，我们又引出一条基本准则：

“把你自己的战略建立在假定对手会按其最正确利益行动的基础上”。

事实上，完全竞争的均衡就是“纳什均衡”或“非合作博弈均衡”。

在这种状态下，每一个厂商或消费者都是按照所有的别人已定的价格来进行决策。

在这种均衡中,每一企业要使利润最大化，消费者要使效用最大化，结果导致了零利润，也就是说价格等于边际成本。

在完全竞争的情况下，非合作行为导致了社会所期望的经济效率状态。

如果厂商采取合作行动并决定转向垄断价格，那么社会的经济效率就会遭到破坏。

这就是为什么WTO和各国政府要加强反垄断的意义所在。

博弈价格战，各个公司的实力是不一样的，一些国际上知名的家电厂商，和国内厂商一样采取低价战略，同样低价的情况下，老百姓当然愿意选择国际知名的大公司的产品，因为国际知名大公司的产品有档次，质量也不会比国内的差。

虽然说厂家都会亏本，但是国际大公司资金雄厚，他亏本几年甚至十几年都亏得起，国内一些脆弱的公司亏本几个月或者一年就倒下了，一家家国内家电厂商退出后，国际大公司形成垄断，适当提高价格，不久就会把以前亏损的钱弥补回来，也许还会赚得更多。

但是当一些普通品牌家电厂商采取低价策略的时候，一些名牌家电厂商会采取提价的策略，也许一些经济能力差点的消费者会买相对廉价的普通品牌家电，但是有能力买名牌家电的人会觉得名牌家电不降价是因为质量好，所以尽管名牌家电提价后仍然获得了丰厚的利润，同时在中国这个社会，攀比非常严重，人们的思维定势是廉价没好货，在中国，少数消费者目前处于盲目消费阶段，不管多贵的东西都有人买，商家不愁卖不出去，。

所以说，商家不管是采取提价还是降价都是可取的，但是要结合当时的情况，还有就是厂家的目的到底是为了立竿见影还是在几年后的翻盘。

4.二妓争子

《旧约全书·

列王记》上记有二妓争儿，所罗门命令左右取剑，曰：

“剖儿为两，各得一半”，一妓乞求不要杀儿，自己愿意舍让，一妓则说杀就杀了，不再争执；

所罗门据此判断是非。

在古印度也有类似的故事，《贤愚经》卷十一〈檀腻羁品〉第四六载：

二母人共诤一儿，诣王相言。

时王明黠，语二母言：

‘今唯一儿，……听汝二人，各挽一手，谁能得者，即是其儿。

’非其母者，於儿无慈，尽力顿牵，不恐伤损；

所生母者，于儿慈深，随从保护，不忍拽挽。

王鉴真伪。

以上故事是一个典型的个体博弈案例。

实际上，博弈对任何个体而言都是一个决策过程.而个体作出决策很重要的一点是认识妥协，学会妥协。

看清了什么样的妥协是可以接受的，什么样的事情是必须坚持到底的。

妥协有两种不同的性质:

1）利益下限得到满足：

“半块面包总比没有面包来得好”。

2）损失下限没被突破：

“与其要回半个死孩子，还不如将孩子送给对方为好”。

以上二母争儿案例，可用博弈论解法提供一个“几乎”完美的机制：

提出问题：

妓女A和妓女B中只有一个是真母亲，但他们都宣称自己是孩子真正的母亲。

不管她们中到底是谁，英明的所罗门王都需要把孩子交给真正的母亲。

可是所罗门确实不知道谁才是真正的母亲，虽然两个女人都很清楚是怎么回事。

这需要所罗门发挥睿智，间接诱导出正确的结果。

解决问题：

所罗门可以向其中任意一个“母亲”提问孩子是不是她的（比方:

妓女A）？

如果答案是否认的，则孩子交给另一个女人〔妓女B〕，博弈结束；

如果答案是肯定的，则

所罗门王可以接着向另一个女人〔妓女B〕提问她是否反对？

如果另一个女人〔妓女B〕不反对，则孩子归妓女A，博弈结束；

否则，所罗门就要这个女人〔妓女B〕提出一个赌注〔V〕，然后向妓女A收取罚金F,并问她是否愿意出同样的赌注？

如果妓女A同意出同样的赌注，孩子归妓女A，妓女B交纳同样的罚金；

如果妓女A放弃，则孩子归妓女B，妓女A给所罗门王赌注的钱

以上机制起作用的前提是：

孩子对真母亲的价值比对假母亲的高，并且这些认识是他们之间的普遍知识〔commonknowledge〕:

即每个人都知道每个人都知道这些，如此一直无穷。

因此很容易推出：

如果妓女A是真母亲，她的策略是说孩子是她的，然后妓女B不反对，因为她〔妓女B〕反对的结果只会导致她要多交钱，因为她为了赢得后面的“拍卖”必须使自己的赌注高过妓女A愿意出的最高值——即孩子对妓女A的真正价值，妓女A为什么要出这么多的钱得到一个不值这么多的孩子呢？

如果妓女A是假母亲，她的策略是承认孩子不是她的，因为如果说孩子是她的，妓女B必然会反对，并且妓女B为了得到孩子只需出高过孩子对妓女A的价值的钱，这只会造成妓女A白白地被罚款。

问题思考：

以上机制对假母亲具有妒忌型效用函数时无效，因为她〔假母亲〕可以出更多的钱得到一个并不物有所值的东西，属于损人不利己的行为——这是这个机制“几乎”完美的命门。

对于“如果妓女A是真母亲，并坚持说孩子是她的”（她是神经病），此时仍然可用所罗门的经典判案来挑战：

妓女A必然愿意杀就杀了而无所得，而妓女B则不愿意突破损失下限。

神经病可能不愿意杀了小儿么？

如果是，说明她也不是神经病，也许假母亲也可以称为真正的母亲了。

六、博弈论的重要性

博弈论在生

展开阅读全文