纳什均衡与博弈论.docx

资源描述

纳什均衡与博弈论.docx

《纳什均衡与博弈论.docx》由会员分享，可在线阅读，更多相关《纳什均衡与博弈论.docx（15页珍藏版）》请在冰豆网上搜索。

纳什均衡与博弈论.docx

纳什均衡与博弈论

这不仅仅是一篇有关《纳什均衡与博弈论》的读书报告，同时也是有关《美丽心灵》的一篇观后感和对约翰纳什的无限礼赞。

在中国经济学界有一句名言：

棍棒打不垮经济理论。

现代经济学从亚当•斯密（按照今天的翻译应该是亚当•史密斯，但是斯密这个翻译已经深入人心，所以不做修改）奠定基础以来，更多的时候给人的感觉应该是较为抽象的规律，而不是数学知识——虽然当代诺贝尔经济学奖大部分都给数学家得了去，也算是弥补了诺贝尔奖没有数学奖项的空缺吧。

但是却又不得不承认经济学似乎和精确不容有误的数学关系依然不大，至少相对于物理这样的学科。

在博弈论成熟以前，经济学理论还是普遍规律，但是始终不能像数学那样精确。

《纳什均衡与博弈论》开篇曾提到过，很多人，包括一些学者都认为经济学是一门很愚蠢的学科，因为在它长篇累牍的理论中始终缺乏应有的精确和公理——现在也没人能预测明天哪一支股票会暴涨。

即使如此，它的规律依旧不能有误，也无法违反，这一点明朝和清朝失败的经济政策就足以说明问题，所以说棍棒打不垮经济理论。

根据约翰纳什的个人传记片、2001年奥斯卡最佳电影《美丽心灵》中的叙述，亚当斯密的经济理论足足维持了150年之久，而打破它的正是纳什建立的博弈论模型——纳什均衡。

《纳什均衡与博弈论》中提到，斯密相信政府对商业的干预——不管是支持还是限制——都会损害正常的自由企业的利益，通过消除优待和限制，明了简单的天赋自由系统会自主地建立起来。

这也正是亚当斯密的“看不见的手”（又称为无形之手）理论。

在斯密看来，只要政府不对经济进行干涉，经济社会自然而然会自发地向着一个好的方向发展。

我曾经咨询过我的两位高中时读文科的室友，在高中政治对经济学的表述中，始终坚持“经济是政治的基础，政治是经济的集中表现”，这一点和斯密的观点是背道而驰的——事实上，中国一直缺少真正意义上的经济学人才或许也是因此。

亚当斯密在他那本传世巨著《国富论》中表明了他的态度：

推崇自由资本主义和强调个人利益。

这一点和上百年后安兰德在《阿特拉斯耸耸肩》中的观点一致，但是安兰德对垄断企业似乎并不是特别反感，而斯密则十分反对自由资本主义中的垄断产业。

斯密还指出政府应该扮演的三个角色：

保卫国家不受入侵、执法保护个人免受不公平之害、提供个人无法从中牟利的公共设施和机构。

根据书上所提，当今许多的博弈论实验与亚当斯密的观点并不相悖。

值得注意的是，书中曾强调过斯密的理论对达尔文的影响，应该说“自然选择和适者生存的观点却像是从思想上继承了斯密的经济竞争观点”。

斯密所谓不需要一个有效的经济系统（在这里我觉得可能指的是不需要法律上建立的经济规划模型而非自发形成的，即“找个设计师是个坏主意”），如果不去干预，经济系统会自己建设的很好。

书中指出，达尔文在生物学上是这样描绘的：

追求自身利益（生存与繁衍）的生物个体就会逐渐地建立起一套有如经济体系一样复杂的生命体系。

达尔文引用了斯密的“劳动力分工”概念。

“我想，我们可以假设一种物种的后代在结构变异上越多样化，它们就越会成功的生存，从而蚕食其他物种的领土，因此在任何一块土地的‘综合经济系统’中，动物和植物的生活习性分化得越完全越广泛，这块土地上就会有越多的个体可以自足。

”

书中表示达尔文的生命“综合经济系统”和斯密的“政治经济学”观点相似。

事实上，这篇文章主要讲述的是博弈论而非经济学，但是因为经济学中的部分理论恰恰是博弈论成熟的基础，因而在这里特别提出一下。

当然，这些只是那个时代，我说的是，在约翰纳什提出纳什均衡以前的时代。

看过《美丽心灵》的人对约翰纳什后半生的悲惨人生绝对不会陌生，毕竟，从天才——数学家——精神病人——诺贝尔得主这样巨大的反差实在是少见的——虽然数学家中疯子真的不少。

在约翰纳什以前，最杰出的博弈论大师是冯诺依曼，有着“博弈论之父”美称的他的成就可不仅仅是博弈论而已，如果你对大学计算机基础有了解的话就知道当代的计算机存储器基础就是他建立的。

冯诺依曼是上世纪一位非常著名的天才数学家，纳什来到普林斯顿大学时他正在那儿任教，当时除了冯诺依曼外普林斯顿还有无数著名的科学家，这一点在《美丽心灵》中有表现，其中就包括大名鼎鼎的爱因斯坦，影片中有一段是纳什请求教授能让爱因斯坦看看他的论文，而这篇论文就是我们下文将提到的“讨价还价问题”。

并且当时的普林斯顿已经是全球的博弈论研究中心。

冯诺依曼和摩根斯特恩合作的《博弈论与经济行为》标志着博弈论的诞生，这本并不全面的典籍被认为是“博弈论的圣经”。

回到文章开头，我们回顾一下经济学的特点，“经济学中，基本思想被描述的很模糊，因而注定了把数学应用到该领域的尝试只能以失败而告终，因此经济学需要一种理论，使得精确且具有实际意义的度量成为可能，博弈论正是为此而生”，《纳什均衡与博弈论》中这样写道。

冯诺依曼虽然成功建立了博弈论，但是他并没有将这栋宏伟的大厦打好地基，他的理论仅仅适用于少部分理想状态。

他的理论特点在于主要研究的是二人零和博弈，意即仅有两人参与博弈或者参与博弈的人们自发组成联盟最后变成一对一的局面，一方失去的另一方就会得到，用效用来描述的话，双方的效用增量之和是零。

《纳什均衡与博弈论》中称这种问题是“鲁滨逊问题”（鲁滨逊漂流到孤岛上，后来收留星期五，两个人平分财产，他们之间的博弈再也没有第三个人参与）。

二人零和博弈中，一方赢的就是另一方输的，因此如果要保证自己“利益”最大化（博弈论中，对其有一个统一的概念，即“效用”），只要制定一个策略，保证对方输得最多就好。

对这种有点二元论味道的模式，冯诺依曼给予了完整的解决方案：

最小最大化原理。

最小最大化原理书中并没有完整的表述，学校图书馆中博弈论方面的书籍大部分都是国内数学家出版的，特点是浅入深出，没有很深的博弈论基础根本看不懂，而且研究的全部都不是二人博弈（国内科学界通病，从来不会研究早期的问题，认为已经过时了），因此根本无法找到最小最大化原理的系统介绍。

网上对最小最大化原理似乎有不同的译名，因此仅凭“最小最大化原理”我无法找到更多的有关资料，所以对于这个原理也根本没有更多的了解。

据说冯诺依曼对这条原理的证明过程是出了名的复杂，书中并未介绍，不过书中用了几个有趣的例子向我们解释最小最大化原理的基本模式。

书中列举的几个有趣的例子，比如二战时，乔治肯尼将军得知日军将向新几内亚岛派遣一支补给护航舰队，盟军要炸毁这支舰队面临两个选择：

日军可能到达新不列颠的北边或南边。

都是三天行程，但是并不是说有三天的袭击时间，因为天气影响，走北边路线会有一天阴雨，所以只有两天进攻；南边则一直晴天，三天进攻。

肯尼将军必须选择侦察机是前往南边还是北边，如果前往南边而日军走北边，则会失去一天的进攻时间（在北边原本可行进攻时间原本就只有两天）；若侦察机去北边而日军走南边的话则即使失去一天也还是有两天进攻时间，当然如果侦察机和日军方向一致的话那么就只需要考虑天气的影响了。

这样看来侦察机前往北边似乎更好，因为侦察机走北边则无论如何可以保证有两天的时间袭击，如果侦察机前往南边判断正确虽然可以保证三天，但是如果判断错误则只有一天时间进行攻击。

即使如此，盟军还是很难准确判断，因为走南边运气好的话可以保证三天袭击时间，但是如果我们从日军的角度来看呢？

假设日军走南边，那么至少是遭受到两天甚至三天的袭击，可是假设走北边，因为有天气的影响，那么可以保证最多只受到两天袭击，运气好的话甚至只有一天，得出结论走北边的结果只会比南边好或者一样但是绝对不会更差了，所以肯尼将军判断日军会走北边路线，选择派遣侦察机前往北边。

顺便告知一下结局，日军在盟军的炮轰下损失惨重。

作为博弈论中的经典案例，书中对这次战争还进行了矩阵分析。

但是要知道的是这仅仅是一个纯策略问题，而事实上很多博弈中即使是二人零和博弈纯策略也不一定就是最佳策略，最佳策略往往不是那么显而易见，商场如战场，不是那么容易对付的，这个时候又有一个名词横空出世：

混合策略。

对于混合策略和纯策略的不同，书中介绍了一个打网球的例子，我的体育很差，因此换一个例子：

下象棋时当头炮是名招，经常有人玩这一招，如果是纯策略你就是无论怎样下，反正对方当头炮我就飞马（或者走别的），反正绝对不会改变这条基本策略；而混合策略就是你和对方下很多局，每一局对方都会因为上一局的结果而改变心情，虽然开头仍是当头炮，但你意识到对方的战术会有改变，因此对每一局的当头炮你都有不同的应对，比如飞马，或者你也走当头炮，这就是混合策略——多个纯策略的混合。

书中对混合策略的解释实在是很让人火大，因为字真的很多而且乏味。

鲍勃欠爱丽丝10美元，但是鲍勃不想还，于是提议玩个游戏，他赢了则欠债减免，爱丽丝同意了。

游戏规则如下：

他和爱丽丝在图书馆见面，鲍勃先到，给爱丽丝4美元，爱丽丝先到则付6美元，两人同时到，则付5美元。

（真不知道爱丽丝怎么愿意答应的）

两人住在一起，至少是邻居，均有两种策略到达图书馆：

走路和公汽。

我们知道公汽比走路快，假设公汽十分便宜，那么我们会发现二人为了保证利益都会选择坐公汽，因为只有那样才能保证效益最大，当然这只是一个简单的纯策略问题，也根本用不上博弈论，论典型比上面那个肯尼将军的问题差远了。

但是爱丽丝绝对不会轻易答应，她意识到自己绝对拿不回那10美元的外债，于是她针对鲍勃这个游戏进行了修改。

在一个月的每一个工作日里，他们都到图书馆去一次，如果都是乘车去的，鲍勃付3美元；都走路去，鲍勃付4美元，鲍勃乘车爱丽丝走路即鲍勃先到，鲍勃付5美元；爱丽丝先到鲍勃付6美元。

这个游戏无疑会让鲍勃痛苦不堪，因为对他而言最好的策略就是二人都坐车，但是爱丽丝显然也意识到这点，如果这时她选择走路的话鲍勃就要付5美元，显然效益不及二人都走路；但是如果鲍勃走路的话爱丽丝坐车鲍勃则需付6美元，是最大的损失，然后我们就可以发现，在这种策略环境下，似乎并没有“最佳策略”。

但是我们可以发现一件事，这个游戏是重复进行的，一个月中每个工作日是20天，也就是可以进行20次，每次你都可以选择不同的策略，然后这就是我们所要提到的混合策略。

在书中经过一系列缜密的分析最终得出了对于两人而言最好的策略，不过当然，这个问题并没有想象中那么难，如果你能够静下心来进行计算或者矩阵分析的话，都是可以很快得出答案的。

这个事例告诉我们，即使在冯诺依曼看来，在二人零和博弈中，很多甚至绝大多数情况下，最佳策略都是混合策略而非纯策略。

而刚看这本书的我也十分相信，在你和别人进行这种博弈时，对方也是不会傻到让你一眼就能看出真正的最佳策略的。

效用一词，最早是由丹尼尔伯努利提出的，根据书中的内容，其主要是“对价值或者选择的一种度量”。

现在已经成为博弈论甚至经济学中衡量收益的最重要标准。

有趣的是，因为博弈论最早是用于解决经济学问题的，所以效用完全可以说等同于货币，但是当博弈论渗透到社会科学等不同学科时，这个概念就明显过于狭隘了。

当然，如果我们是在打篮球，那么效用指代的完全就是分数，这个比较单一。

可是假如是遇到一些较复杂的问题呢？

比如后来纳什在“议价问题”中提到的情况，对于热爱锻炼的男孩而言乒乓球拍明显比书本值钱，可是对于文艺青年来说答案就是相反的，那么假设这两个孩子进行博弈书本、乒乓球拍对他们的效用就是不同的。

网上对于效用的定义是这样的：

一般认为，效用是指消费者通过消费或者享受闲暇等使自己的需求、欲望等得到满足的一个度量。

这个定义具有较强的普遍性，也再也没有人愿意去简化、准确地定义效用，因为从博弈论后来的发展来看，效用的定义已经成为一个哲学沼泽，想要再去探索是不太可能的。

可是难于定义不代表不能量化，科学家的智慧在这里得到了印证。

对于这一突破，书中并没有特别详细的介绍，但是可以知道的是数学家在这里借鉴了热力学中科学家量化温度、热量的方法。

不管怎么说，对效用的量化扫清了博弈论的一大障碍，冯诺依曼为它提供了先声，然后所要的，就是约翰纳什的均衡理论打开大门。

《美丽心灵》是我心中唯一一部足以和《肖申克的救赎》相媲美的励志电影，虽然事实上这部影片并不是以励志为主题，但是这部影片确实在我沉浸于被甩掉的痛苦时大大地帮助了我。

电影的原著小说我到现在都没有看，也没有看的打算，我觉得小说和电影（不是电视剧）是截然不同的艺术体系，小说根本没法表现出电影那种陈旧的感觉（小说毕竟不能控制光线而摄像机可以），当然小说也有电影无法企及的优点，比如伟大的《阿特拉斯耸耸肩》的电影就被认为是最烂的电影之一。

虽然在我看来《美丽心灵》还算不上完美（相对于《肖申克的救赎》而言），但是已经足够好。

至少我每次看的时候都会想人家连几十年的精神病都能战胜，我还有什么不能摆脱呢？

每次想到纳什几十年对那些幻觉中的人都视若不见我都不得不佩服他的毅力。

应该说罗素克劳真的是个好演员，从开头的天才学生，到后来的执着少年，再到惠勒实验室的顶级科学家和自大狂，精神病，卑微的数学研究者，最后的受人爱戴的老师和诺贝尔经济学奖得主他都炮制得很好，但是回过神来一看，纳什这样子的一生实在是让人唏嘘不已，这部电影感动了无数人，事实上就我所知如果这部影片不成功的话国内数学界可能到现在也不会重视博弈论——虽然这门学科在国外已经被认为非常重要，甚至根据电影最后的介绍，纳什均衡已经左右了全球贸易谈判、全国劳工关系以及生物进化等领域。

据说当代很多科学家认为纳什对博弈论的贡献几乎可以和牛顿对物理学的贡献媲美，也有很多人说如果不是他的疾病，他的成就早已经超出了纳什均衡的藩篱，这个我倒不清楚，不过作为一名数学家，纳什仅凭均衡理论的确已经可以成为当代最伟大的科学家之一了，就如电影中那位部门主任（他将美国的未来交给那群年轻的数学家，每次看到这里我都会震惊这群不富有的社会精英的力量）看到他的论文时所说：

“好吧，纳什先生，凭借如此重大的突破，我确信你可以得到任何你想得到的职位（这里指的是惠勒实验室中的职位）。

”事实上在我的《纳什均衡与博弈论》中，作者很乐意将当代博弈论称为纳什博弈论，虽然他是个精神病。

就我所知纳什还对偏微分方程有研究，他还有一个符合嵌入理论也是经济学中非常重要的理论，电影中甚至解出了部分情况的黎曼假设，如果我没记错的话这个假设还没人能完整解答。

但是他最重要的成果还是为非合作博弈找到了共赢的模型，也就是纳什均衡。

纳什来到普林斯顿大学时是一个出了名性格糟糕的家伙，自以为是、不成熟、傲慢自大但是聪明过人，不过也不是没有资本，因为当时他已经完成了有关议价问题的论文（那是在卡内基工学院完成的），而且当时他也是其中仅有的两个获得卡内基奖学金的两个人之一，他对上课提不起兴趣，也不喜欢“高雅”的应酬。

电影《美丽心灵》中说他长了两个有用的脑袋和半颗有用的心真是一针见血，比如开头时别的普林斯顿新来的年轻数学家（真的不是开玩笑，的确是数学家，那些二十出头的家伙要么完成过战争武器论文，要么曾经破解过纳粹密码，都是不折不扣的精英）都在开怀地喝酒吃食物，他却在拿着玻璃杯玩弄光线效果最后还尝试用这个来解释他的同学的领带有多差！

反正就这么说吧，那个时候的纳什是个标准的数学疯子，同时也是那群精英中的精英。

出于尊敬和景仰，我上网查过纳什的背景，他最早学习的是化学工程，似乎也曾学习过物理，可是他发现整天拨弄烧瓶并不能满足他（我也觉得很无聊），所以最后他将兴趣转向了他所擅长的数学理论（真应该庆幸他做出了改变）。

根据书中记载，据说最早在卡内基工学院时他曾经完成过一篇论述“议价问题”（讨价还价问题）的论文，有趣的是这篇文章的观点虽然后来被大多数人认同可是人们还是认为它很天真——当中出现的都是类似于袖珍小刀、乒乓球拍之类的东西，很显然，出自一个少年之手。

这篇论文最大的突破在于纳什有意无意地涉足了一个比二人零和博弈更加复杂的环境：

博弈者们有着共同的利害关系——讨价还价博弈提供了一种双赢的可能，前提是双方都是理性的，能准确衡量自己的效用。

而这种最理想的状态在二人零和博弈中是不可能出现的。

不过电影导演朗霍华德似乎不是对这篇论文特别感冒，这篇博弈论中具有承上启下作用的论文在电影中只出现过一次：

当时的纳什正尝试说服上文我们提到过的部门主任能安排他与爱因斯坦见一次面，好让他介绍一下自己有关议价问题的突破，但是被拒绝了。

不过据说这个问题被用在了反托拉斯法上。

“在这种‘合作性’博弈理论中，对所有人来说都是自己做的最好，但不必以牺牲他人利益为代价。

”书中这样解释道，还举了一个有趣的例子：

公司与工会间的谈判就是典型的“讨价还价博弈”。

上文提到过的，博弈双方甚至多方可能会对不同物品有不同的估价（效用不同），“纳什展示了如何评价这些不同的估价，计算每个人在各种交换中的效用，并提供了精确的数学图解，找寻最佳成交点”。

这篇文章是纳什涉足博弈论的初试，而真正让他奠定整个博弈论世界基础的则是他在普林斯顿大学发表的论文——纳什均衡理论。

电影中一开始纳什是个十分特殊的家伙，因为不上课又从不发表论文，同学们甚至戏谑他已经退学了，事实上如他自己所说：

他正在寻找一种原创理论，他把同学们的论文都看做毫无创造力的垃圾。

对这一点即使是那一位开明的部门主任也曾经批评过他，并且委婉地表示：

对不起，但是根据你现在的记录，还不能保证你能有任何职位。

这一句话一度让他迷惘，更在宿舍里用头去撞他写满了题目的窗户，可是后来一次同学们在酒吧的娱乐中，他通过同学对女孩的议论以及亚当斯密有关个人价值对团队利益的话找到了灵感，并且花了一整个冬天的时间完成了他的原创理论论文（事实上这篇论文是有人指导的，电影中没有提到），也就是我们说的纳什均衡。

四个单身汉百无聊赖地坐在酒吧里，这个时候五个单身女郎走进酒吧，其中一位长得特别漂亮，这时四个单身汉都想去和美女搭讪并且得到美女，他们会勾心斗角，可是对于美女而言，四个单身汉同时找上来时最好的应付办法就是一个也不搭理，四个单身汉失败之余又去找另外四个女郎，然而那四个女郎不想成为替代品于是选择了拒绝——所以对于四个单身汉而言，从一开始最好的策略就是都不去追求那个美女，这样每个单身汉都能得到一个女郎。

《美丽心灵》中通过这样一幕讲述了纳什领悟“纳什均衡”的过程，均衡理论相对于冯诺依曼最大的突破在于打破了二人零和博弈的局限性，电影中甚至指出这个模型突破了维持150年之久的经济体制。

事实上，相对于单一的二人零和博弈，即使只增加一方变成三方博弈，问题也会变得复杂许多倍，这也正是冯诺依曼始终无法解决的原因，以至于那个证明起来出了名复杂的最小最大化原理也无法解决。

（我想我国古代类似于《三国演义》、《隋唐》什么的故事比《封神榜》引人入胜的原因可能就在这里吧，参与对象多而不仅仅只是阐教和截教的对抗）

可是即使复杂许多倍，也必须解决这个问题，因为生活中不可能永远都只是双方博弈的，排开三国之类小说不算，举一个有趣的例子，北京一块黄金地段的参与竞标开发商相信也是不只一两个的。

纳什证明均衡理论用到了一条很重要的拓扑学定理：

不动点定理。

网上查到的不动点定理是布劳威尔证明的，书中则指出另外一个日本数学家角谷静夫也曾证明过，二人的证明以及结果似乎是有差别的，但是纳什运用任何一人的理论都能证明出他的均衡理论。

不动点定理很复杂，说明了对于一个拓扑空间中满足一定条件的连续函数f，存在一个点x0，使得f（x0）=x0。

对其具体内容，网上是这样说的：

如果f是n+1维实心球Bn+1={x∈Rn+1|x|≤1}到自身的连续映射（n=1，2，3…），则f存在一个不动点x∈Bn+1（即满足f（x0）=x0）。

这个证明于1911年的拓扑学定理曾伤透了我的脑筋，为了具体弄懂它，我专程前往学校图书馆，没想到学校系统讲述拓扑学的书籍仅有一本而且还被人借走了。

于是我到目前为止对不动点定理的理解还是处在一个一知半解的状态，不过书中对不动点定理有一个比较通俗的概括十分有趣：

取两张一样大小的地图，将一张地图平铺在桌面，而另外一张随意揉成一个形状不要撕裂，放在第一张地图之上，不超出第一张的边界。

那么第二张纸上一定有一个地点正好就在第一张地图的对应点的正上方。

反正无论如何，纳什运用这个定理证明了他的均衡理论，电影里他完成这篇论文足足花了一个冬天的时间，对这一成果，鲍尔斯这样评价：

纳什均衡的概念可能是博弈论中唯一最基础的概念，绝对的基础。

尽管冯诺依曼对此不以为然。

冯诺依曼的博弈论在于简单的二人对立，若是超出二人则会自发组成联盟，纳什称这是合作博弈，然而纳什却将博弈论深化使之具有了更广泛的适用性，换句话说，纳什将我们带到了博弈论的另外一个更加广阔的领域：

非合作博弈。

纳什证明出，当多个独立决策的参与者进行决策时，并且他们之间不进行任何交流，他们有这样的平衡点（也许不止一个），在这个点上，所有人都认为此时的策略最好，书中指出：

也许有人不喜欢这个策略，但是如果有人改变了，那么得到的结果即最后的期望，只会更糟。

因此每个参与者都乐于将策略设定在这个点上——于是构成了稳态，即均衡。

电影中，纳什针对斯密“在竞争中，个人的雄心是为了公共的利益”以及“最好的结果来自于组里的每个人都只做对自己有利的事情”发表了自己的看法：

“没错，但不完整，最好的结果来自于组里的每个人都只做对自己以及对组有利的事情。

”

以上描述大致符合均衡论的经济学定义，我还专门找到了书中没有的数学定义：

在博弈G=﹛S1,…,Sn：

u1,…，un﹜中，如果由各个博弈方的各一个策略组成的某个策论组合（s1*,…，sn*）中，任一博弈方i的策论si*，都是对其余博弈方策略的组合（s1*,…s*i-1,s*i+1,…，sn*）的最佳对策，也即ui（s1*,…s*i-1,si*,s*i+1,…，sn*）≥ui（s1*,…s*i-1,sij*,s*i+1,…，sn*）对任意sij∈Si都成立，则称（s1*,…，sn*）为G的一个纳什均衡。

（我想说的是，我看不懂）

书中将均衡与化学平衡进行类比，化学平衡实际上是一种动态平衡，反应仍在进行，但是逆反应与其速率相等，因此本质上与没有进行一样了。

（高中化学，化学平衡仅适用于可逆反应）

对于博大精深的纳什均衡，书中并没特别详尽介绍，毕竟只是一本入门书籍，但是书中也举了一些有趣的例子来简单介绍纳什均衡，其中最有名的莫过于我曾多次见过的“囚徒困境”。

两个嫌疑犯作案后被警察抓住，分别关在不同的屋子里接受审讯。

警察知道两人有罪，但缺乏足够的证据。

警察告诉每个人：

如果两人都抵赖，各判刑一年；如果两人都坦白，各判八年；如果两人中一个坦白而另一个抵赖，坦白的放出去，抵赖的判十年。

于是，每个囚徒都面临两种选择：

坦白或抵赖。

然而，不管同伙选择什么，每个囚徒的最优选择是坦白：

如果同伙抵赖、自己坦白的话放出去，不坦白的话判一年，坦白比不坦白好；如果同伙坦白、自己坦白的话判八年，不坦白的话判十年，坦白还是比不坦白好。

结果，两个嫌疑犯都选择坦白，各判刑八年。

这个例子十分典型，我直接从网上选择了复制粘贴，需要说明的是，这并不是二人零和博弈（请注意“零和”二字）。

网上曾表示二位囚徒的最佳策略应该是都不坦白，但是因为这个策略是“帕累托优化”（就我所知，这是一种在非合作博弈中，在不减少他人效益的前提下增加某些人效益的优化过程）所无法达到的，因而没能选择。

而事实上，书中对这个有更简单也更重要的诠释：

这个最佳策略并不能满足人类的理性要求，两位囚徒是无法选择相互相信的，在他们看来自己的那个同伙随时都有可能会背叛自己。

这一点来看他们还不是那么天真，因为他们的同伙确实背叛了他们，比起《明朝那些事儿》中那个朱高煦居然相信京城的张辅会帮助自己谋反，结果最后自己的信使直接就被张辅绑了献给朱瞻基，他们还是聪明得多。

需要探索的是“均衡”二字，均衡即稳态，化学平衡中一旦达到平衡如果不能改变外在条件如压强、温度、反应物等外在客观条件的话反应也就等于停止了（动态平衡）。

这种时候博弈达到了一种十分平衡的状态，如果不是客观条件的改变，均衡态也就不能改变了，陷入稳定状态。

然而我们知道，二位囚徒先生显然没有这种觉悟，他们对自己的同伙原本就不信任，因此虽然二人都不坦白确实是最佳策略，却并不是均衡，也就是说这个并不符合“纳什均衡”的标准。

而实际上我整理这篇文章时最后惊喜的发现，真正满足了纳什均衡

展开阅读全文