博弈论中常见的一些例子.docx

资源描述

博弈论中常见的一些例子.docx

《博弈论中常见的一些例子.docx》由会员分享，可在线阅读，更多相关《博弈论中常见的一些例子.docx（18页珍藏版）》请在冰豆网上搜索。

博弈论中常见的一些例子.docx

博弈论中常见的一些例子

杨义群经济管理网、杨义群投资理财网

博弈论中常见的一些例子

　　1、（夫妻争执问题）一对新婚夫妻为晚上看什么电视节目争执不下，丈夫（记为I方）要看足球比赛节目，而妻子（记为Ⅱ方）要看戏曲节目.他们新婚燕尔，相亲相爱，所以若这方面的行动不一致，则是很伤感情的.因此，这对夫妻间的争执是一次非零和对策。

　　2、（entrydeterrence市场威慑）设某市场已被Ⅱ方（场内者）占据，现I方（场外者）正在考虑是进去争夺（记为策略I1）还是不进去争夺（记为策略I2），而Ⅱ方相应应考虑的是采取合作共享的态度（记为策略Ⅱ1）还是采取坚决斗争的态度（记为策略Ⅱ2）。

　　3、（prisoner’sdilemma囚犯困境）设有两个囚犯曾犯过大罪，现因犯小罪而被捕，正分别受警方审讯.这两个囚犯都明白：

如果两人都拒不坦白犯过大罪，那么当局只能以当前的小罪而判处1年徒刑；要是两人都坦白犯过大罪，那么当局将判处9年徒刑；如果一人坦白，而另一人拒不坦白，那么坦白者将会立即获得释放，另一个将会被判处10年徒刑。

（北京大学1999年研究生入学考试微观试题）举出一个你在现实生活中遇到的囚犯两难困境的例子。

　　4、（两寡头降价竞争）这一模型，在数学结构上，与上例完全相同。

设某一市场上仅有两个寡头，他们分别都可以选择降价与不降价两种策略。

　　5、（打假）设当局对商品采取查假行动的费用为a万元，查出假货后，罚款为b万元，且销毁的假货成本为c万元；若商人出售假货，而当局不采取查假行动，则商人可额外获利d万元，且社会的进一步损失为e万元。

　　6、（监督博弈）设税务局查税的费用为a万元，查出逃税后，罚款为b（b＞a）万元，纳税人应纳的税金为c万元。

则税务局与纳税人的该两人非零和对策模型的赢得表具体如下。

　　7、（boxedpigs智猪博弈）设猪圈里有一个按钮与两只猪，大猪与小猪，按一次按钮，就会有10份食品进入，大猪与小猪同时吃的话，将分别能吃到7份与3份，但去按一次按钮，必须耗费a份食品，而且按按钮者，由于耽误了时间，还将少吃到2份食品。

　　当1＜a＜5时，Ⅱ2（等待）是小猪的占优策略，所以大猪只能采用策略I1（去按），于是，多劳者反而少得！

这主要是小猪在此有机遇。

　　当a＞5时，“等待”既是小猪的占优策略，也是大猪的占优策略，所以变成了占优战略均衡，大家都等待，陷入困境。

　　8、（两寡头产量竞争）设某市场只有两个寡头厂商，其中厂商1与2的产量分别记为x与y，市场总产量记为Q：

＝x＋y.又设，厂商1与2的产量边际成本都恒为2，而且都没有固定成本，也即他们的成本分别为2x与2y。

再设，将这些产品全部销售出去的平均价格函数为P＝8－Q.

于是，厂商1与2的利润分别为

　　9、（北京大学1995年研究生入学考试微观试题，招生专业：

国民经济学、产业经济学、金融学、企业管理、管理科学与工程）A、B两企业利用广告进行竞争。

若A、B两企业都作广告，在未来销售中，A企业可以获得20万元利润，B企业可以获得8万元利润；若A企业作广告，B企业不作广告，A企业可以获得25万元利润，B企业可以获得2万元利润；若A企业不作广告，B企业作广告，A企业可以获得10万元利润，B企业可以获得12万元利润；若A、B两企业都不作广告，A企业可以获得30万元利润，B企业可以获得6万元利润。

　　10、（北京大学1998年研究生入学考试微观试题，2003年浙江大学博士生入学考试微观试题）家用电气市场上有两个厂商，各自都可以选择生产空调和彩电，彼此的利润如下列收益矩阵所示

　　11、可口可乐与百事可乐（参与者）的价格决策：

双方都可以保持价格不变或者提高价格（策略）；博弈的目标和得失情况体现为利润的多少（收益）；利润的大小取决于双方的策略组合（收益函数）；博弈有四种策略组合，其结局是：

（1）如果双方都不涨价，各得利润10单位；

（2）如果可口可乐不涨价，百事可乐涨价，可口可乐利润100，百事可乐利润-30；

（3）如果可口可乐涨价，百事可乐不涨价，可口可乐利润-20，百事可乐利润30；

（4）如果双方都涨价，可口可乐利润140，百事可乐利润35；

博弈的稳定状态有两个：

都不涨价或者都涨价（均衡），均衡称为博弈的解，它是由博弈规则（即参与者采取什么策略会取得什么结局，市场的需求弹性、交叉价格弹性等）决定的。

博弈论与诺曼底战役决策

　　普林斯顿大学的一道习题

　　题目：

如果给你两个师的兵力，由你来当“司令”，任务是攻克“敌人”占据的一座城市，而敌军的守备力量是三个师，规定双方的兵力只能整师调动。

　　通往城市的道路只有甲乙两条。

当你发起攻击的时候，你的兵力超过敌人，你就获胜；你的兵力比敌人的守备兵力少或者相等，你就失败，那么，你将如何制定攻城方案？

　　“司令”发牢骚躺倒不干：

“为什么给敌人三个师的兵力，而只给我两个师？

这太不公平，兵力已经吃亏，居然还要规定兵力相等则敌胜我败，连规则都不公平，完全偏袒敌人。

”为此你也许会大为不满。

来个躺倒不干。

　　其实，这次模拟“作战”，每一方取胜的概率都是50％，即谁胜谁负的可能性是一半对一半。

你这个司令能否神机妙算，指挥队伍克敌制胜，还得看你的本事。

　　为什么说取胜的概率是一半对一半呢，让我们先学一点儿“纸上谈兵”。

　　我们来分析一下：

敌人有三个师，布防在甲乙两条通道上。

由于必须整师布防，敌人有四种部署方案，即：

A、三个师都驻守甲方向；

B、两个师驻守甲方向，一个师驻守乙方向；

C、一个师驻守甲方向，两个师驻守乙方向：

D、三个师都驻守乙方向。

　　同样，你有两个师的攻城部队，可以有三种部署方案，即：

a、集中全部两个师的兵力从甲方向攻击；

b、兵分两路，一师从甲方向，另一师从乙方向，同时发起攻击；

c、集中全部两个师的兵力从乙方向攻击。

　　和以前一样，如果我们用“+，-”表示我方攻克，用“-，+”表示敌方守住，就可以画出交战双方的胜负分析表：

　　　　　　敌

　　　A　B　C　D

　　a-,+-,++,-+,-

我　b+,--,+-,++,-

　　c+,-+,--,+-,+

　　假设你采取a方案，那么如果“敌人”采取A方案，你的两个师将遇到敌军三个师的抵抗，你要败下阵来，所以是（一，十）；如果“敌人”取B方案，你的两个师遇到敌军两个师以逸待劳的抵抗，你也要败下阵来，同样是（一，+）；但是如果“敌人”取C方案，你以两个师打“敌人”一个师，你就会以优势兵力获得胜利，结果是（十，一）；同样，如果“敌人”采取D方案，你攻在敌军的薄弱点上，你就能长驱直入，轻取城池，结果也是（十，一）。

　　和以前的博弈表示略微不同的地方，是现在每个格子里面只有正负号，没有数目字。

希望这不会使你感到不安。

如果你还是喜欢有数目字，那也容易得很，每个正负号后面都加上同一个数目字就行，同一个1．同一个1944，或者同一个1998。

要紧是表达出输赢。

　　这你就知道，在上述表达中，正负号要紧，具体数目字无所谓。

诺曼底登陆模拟：

取胜概率相等

　　交战双方的胜负分析表画出来以后，从“＋，一”的分布来看，似乎双方取胜的机会都一样大。

一直看《博弈论平话》的读者，可以运用劣势策略消去法把它化简。

　　实际做这个题目的时候，如果先从我方入手，一下子是分不出优劣来的。

a和b，b和c,a和c之间，都说不上谁比谁优，谁比谁劣。

于是，我们从敌方入手，尝试站在敌军的立场，比较策略A和B。

如果我军采取策略a，敌军取A或B都会赢，结果一样。

如果我军采取策略b，敌军取A会输取B会赢，如我军采取策略c，敌军取A或B都会输。

可见，在敌军看来，策略B比策略A好：

采取策略A会赢的话（如果我军取a），采取策略B一定也会赢；采取策略A会输的话（如果我军取b或c），采取策略B却不一定会输，因为假如我军取b，敌军就赢了。

　　同样，策略C和D比较，C是优势策略，而D是劣势策略。

　　智慧的或者说理性的局中人是不会采用劣势策略的，所以当做出博弈的矩阵表示以后，如果发现劣势策略，你就可以把它划去，这就是劣势策略消去法。

　　现在，剩下上边那个三行两列的矩阵，六个格子中，（一，＋）比（十，一）多，似乎敌方的赢面比较大，其实不然。

因为到了敌方不会采用“笨蛋”策略的时候，到了敌方只剩下B和C两个较优策略的时候，我方的三个策略之中，原来不是劣势策略的b现在就变成劣势策略了。

我们也不是笨蛋，所以我们也应该把b删去。

最后，得到下边那个两行两列的矩阵博弈表示。

　　情况最终就是这样：

敌军必取B或C那样的二一布防，一路两个师，另一路一个师，而我军必集中兵力于某一路实施攻击，即a或c那样的攻击策略。

这样，你若攻在敌军的薄弱处，你就获胜，你若攻在敌人兵力较多的地方，你就失败，总之，敌我双方获胜的可能性还是一样大，“司令”先生：

不要躺倒不干，你不比对方吃亏。

　　这虽然是一个模拟的例子，却具有相当的现实意义，诺曼底战役前的情况，大体也是这个样子。

跨海作战，攻方能够调动来渡海作战的兵力，通常总是比守方可以用于守备的兵力少。

模拟作战中假设攻方兵力力两个师而守方的兵力为三个师，就是这样的背景。

另外，渡海登陆作战，通常至少在一开始的时候，攻方要承受很大的牺牲。

模拟作战中规定若攻守双方兵力相等则攻方失败，体现了这个意思。

博弈论简介

董志强１９９９－６

　　对于一些非数学专业和经济学专业的人们来说，博弈论可能是一个极为陌生的概念。

事实上，就是一些经济学专业毕业的学生，他们的博弈论知识也十分有限，我自己也是这样，略知皮毛而已（不，甚至连皮毛都未能真正了解）。

因为国内学者把博弈论运用于经济学研究不过是近几年的事，也不普遍，而且它本身的内容也博大精深。

但在国外，博弈论已成为占据主流的分析工具，如果你不懂得博弈论，那么你会被认为是没有真正懂得经济学。

博弈论的提法可能太过于学术化，容易让人们退避三舍。

其实它有一个非常通俗的名字——游戏理论（博弈论的英文名字叫做“GameTheory”，如果直译，就是“游戏理论”）。

博弈论在我国还有一个名字，叫对策论。

这些名字都很好理解，博弈字面意思就是赌博、下棋，赌博和下棋当然是游戏了，赌博和下棋的时候常常要千方百计地应付对手，自然是要讲究对策了。

　　如果我们要进行一场游戏，首先肯定要有参加游戏的人，没有人参加，游戏就不会进行下去，游戏活动的参与人有一个学术名称叫“局中人”；其次，每一个“局中人”都有自己的“行动”，或者叫做“策略”、“对策”，如果行动不是单一的，那么这个局中人所有的行动构成一个集合，称行动组合或策略组合；另外，还应该约定输家要付出什么代价，赢家可获得什么利益，这在术语上叫做“支付”（或“报酬”）。

当然，一场游戏肯定结果不是唯一的，各个参与人分散决策采取不同的行动，会造成不同的结果。

但是纳什证明出，在有限个局中人参加的有限行为对策中，至少存在一个所有参与人的最优战略的组合，这叫做“纳什均衡”。

处于纳什均衡状态下，每个人都不能通过改变策略来得到更大的收益，所以谁也不存在改变现状的动力。

　　举一个具体的例子来说明一下。

这个例子叫“囚犯困境”，是被一些教材广泛引用的例子，并且西方经济学者围绕这个例子发表过不下百篇学术论文。

它是这样的（有兴趣的读者可参见青年经济学家张维迎的《博弈论与信息经济学》，这本书几乎成了经济学研究生的必读书）：

两个嫌疑犯（A和B）作案后被警察抓住，隔离审讯；警方的政策是“坦白从宽，抗拒从严”，如果两人都坦白各判8年，如果一人坦白另一人不坦白，坦白的放出去，不坦白的判10年，如果都不坦白则因证据不足各判1年。

　　在这个例子里，局中人就是两个嫌疑犯A和B，他们每个人都有两个策略即坦白和不坦白，判刑的年数就是他们的支付。

可能出现的四种情况：

A和B均坦白或均不坦白、A坦白B不坦白或者B坦白A不坦白，是博弈的结果。

A和B均坦白是这个博弈的纳什均衡。

我们可以用下面的表来表述这个博弈，表中，第一个数字是A的支付（因为是判刑是负效用，故以负号记之），第二个数字是B的支付。

　　　　　　　　　　囚犯B

　　　　　　　　坦白　　抵赖

囚犯A　　坦白-8，-8　　0，-10

　　　　抵赖-10，0　　-1，-1

　　我们看到，假定A选择坦白的话，B最好是选择坦白，因为B坦白判8年而抵赖却要判十年；假定A选择抵赖的话，B最好还是选择坦白，因为B坦白判不被判刑而抵赖确要被判刑1年。

即是说，不管A坦白或抵赖，B的最佳选择都是坦白。

反过来，同样地，不管B是坦白还是抵赖，A的最佳选择也是坦白。

结果，两个人都选择了坦白，各判刑8年。

在（坦白、坦白）这个组合中，A和B都不能通过单方面的改变行动增加自己的收益，于是谁也没有动力游离这个组合，因此这个组合是纳什均衡。

　　张维迎指出，囚徒困境反映了个人理性和集体理性的矛盾。

如果A和B都选择抵赖，各判刑1年，显然比都选择坦白各判刑8年好得多。

当然，A和B可以在被警察抓到之前订立一个“攻守同盟”，但是这可能不会有用，因为它不构成纳什均衡，没有人有积极性遵守这个协定。

　　“囚犯困境”在经济学上有很多应用，也有力地解释了一些经济现象。

比如中东石油输出国组织（OrganizationofPetroleumExportingCountries,简称OPEC）的成立，本身要限制各石油生产国的产量，以保持石油价格，以便获取利润。

但成员国并不遵守组织的协定，每个成员国都这样想，只要他们不增加产量，我增加一点点产量对价格没什么影响，结果每个国家都增加产量，造成石油价格下跌，大家的利润都受到损失。

当然，一些产量增加较少的国家损失更多，于是也更加大量生产，造成价格进一步下降——结果，陷入一个困境：

大家都增加产量，价格下跌，大家再增加产量，价格再下跌……我们不妨考察一下历史：

　　1960年，5个产油国成立欧佩克（OPEC）。

1973年成员国扩大到13个。

当时各国还少有产量欺骗行为。

1973年，阿-以战争爆发，为了报复以色列和西方国家，OPEC突然大幅度削减石油出口，致使世界原油价格由$2.91/桶暴涨到1974年$10.77/桶。

这一意外事件让OPEC看到了组建卡特尔的诱人前景。

1978年伊朗发生革命，其石油生产一度陷于瘫痪，既而两伊战争爆发，许多石油设施受到破坏，世界石油价格进一步涨到80年代初的$40/桶。

但是，高额的利润导致各个国家的产量欺骗行为（实际产量大于限产计划），即各国不再遵守产量协定，擅自提高产量以获取更大的市场和更多的利润，从而导致石油价格下跌——当然，价格下跌也与世界其他地区如墨西哥油田、阿拉斯加油田、北海油田等石油供给增加有关。

1982年世界石油价格为$32/桶，1984年为$27/桶，1987年为$18/桶，以后基本上在$15-18/桶之间波动。

　　理论上，几乎所有的卡特尔都会遭到失败，原因就在于卡特尔的协定（类似囚犯的攻守同盟）不是一个纳什均衡，没有成员有兴趣遵守。

最近发生的一个案例再次证明了这一点。

今年4月，长虹突然宣布彩电降价，对彩电业带来了巨大震动。

随即，康价佳老总陈伟荣、TCL老总李东生、创维老总黄宏生达成默契：

建立彩电联盟。

直到4月20日下午，康佳仍表示不降价，但当晚陈伟荣突然改变主意，搞得李、黄措手不及。

4月24日，本来三方准备坐下来商讨降价后的进一步策略，结果又是陈伟荣爽约。

　　那么不可能有卡特尔合作成功了？

理论上，如果是无限期的合作，双方考虑长远利益，他们的合作是会成功的。

但只要是有限次的合作，合作就不会成功。

比如合作10次，那么再第九次博弈参与人就会采取不合作态度，因为大家都想趁最后一次机会捞一把，反正以后我也不会跟你合作了。

但是大家料到第九次会出现不合作，那么就很可能再第八次就采取不合作的态度。

第八次不合作会使大家在第七次就不合作……一直到，从第一次开始大家都不会采取合作态度。

　　当然，这只是理论上的分析。

现实中影响人们决策和态度的因素很多，所以，有些博弈的结果并不体现为纳什均衡。

在国外曾做过一个“囚犯困境”的实验，被实验者是素未谋面的一个男生和一个女生。

开始，这个男生每次都选择“坦白”，这是符合纳什均衡的。

后来实验者有意安排了一次喝咖啡的机会，使男生发现自己的对手是一个漂亮的女生。

结果以后的测验中，男生每次都选择不坦白以获取女孩的好感。

　　不过，不管怎样，博弈论都是一个强有力的分析工具。

现在，它不仅在经济学领域得到广泛应用，在军事、政治、商业征战、社会科学领域以及生物学等自然科学领域都有非常重大的影响，工程学中如控制论工程也少不了它。

我们举的例子，只是帮助大家形成博弈论的基本概念，实际上它是非常精深的。

现在与它紧密联系的经济学分支是信息经济学。

信号游戏、拍卖形式、激励机制、委托人—代理人理论和公共财政学是博弈论和信息经济学研究的重要课题。

　　应该感谢美国数学家冯?

诺依曼（VonNeumann）和摩根斯坦（Morgenstern），是他们在《博弈论和经济行为》（1944）一书中提出了博弈论的经济思想。

冯?

诺依曼在数学、计算机、经济学等领域都有奇才般的贡献，可惜英年早逝。

1950-1954年，美国数学家统计学家纳什接连发表多篇论述对策论的文章，奠定了现代博弈论学科体系的基础。

生活中的游戏——博弈无处不在

董志强１９９９－７

　　日常生活中的一切，均可从博弈论得到解释，大到近段时间北约轰炸南联盟，小到今天早上你突然咳嗽了几声。

因为生活的本质，就是在进行一场游戏。

　　可能你觉得，北约轰炸南联盟用博弈论来分析是可以的，但对自己早上咳嗽也可以用博弈论来理解觉得不可思议，因为自己就一个人，和谁进行游戏？

非也，并非只有你一人，还有一个叫做“自然（Nature）”的“人”，你在同它进行游戏。

你可以把“自然”理解为无所不能的上帝，上帝现在有两种策略，让你生病或不生病。

你咳嗽了，你就不得不根据自己咳嗽的信息判断上帝的策略，然后采取对应的策略。

上帝采取让你生病的策略，你就采取吃药的策略来对付；上帝采取不让你生病的策略，你就采取不予理睬的策略。

看，这不就是一场你和上帝进行博弈的游戏吗？

　　“自然”是研究单人博弈的重要假定。

比如一个农夫种庄稼也是同自然进行博弈的一个过程。

自然的策略可以是：

天旱、多雨、风调雨顺。

农夫对应的策略分别是：

防旱、防涝、放心地休息。

当然，自然究竟采用哪种策略并不确定，于是农夫只有根据经验判断（或根据气象预报）来确定自己的行动。

如果估计今年的旱情教重，就可早做防旱准备；如果估计水情严重，就早做防涝准备；如果估计是风调雨顺，农夫就可以悠闲地东转转西走走了。

又比如，农夫该在土地上种小麦还是水稻？

也是一个同自然进行博弈的游戏。

自然可以选择小麦买高价还是水稻卖高价，农夫则根据对自然的可能行动的猜测来确定自己的行动。

与一般的博弈不同的是，不管“自然”采取何种策略，也不管你采取何种策略，“自然”的支付（或得益）都是为0的。

　　生活中更多的游戏不是单人博弈，而是双人或多人的博弈。

比如：

商场谈判、政治斗争、夫妻吵架、恋爱结婚……都是这类博弈。

　　再给大家介绍一个有趣的博弈例子。

它出自张维迎教授的《博弈论与信息经济学》，讲的是猪圈里有一头大猪和一头小猪，猪圈的一头有一个饲料槽，另一头装有控制饲料供应的按钮。

按一下按钮就会有10个单位饲料进槽，但谁按谁就要付出2个单位的成本。

若大猪先到，大猪吃到9个单位，小猪吃到一个单位；若同时到，大猪吃7个单位，小猪吃3个单位；若小猪先到，大猪吃六个单位，小猪吃4个单位。

各种情况组合扣除成本后的支付矩阵可如下表示（没格第一个数字是大猪的得益，第二个数字是小猪的得益）：

　　　　　　　　小猪

　　　　　　按　　　等待

大猪　　按5，1　　　4，4

　　　等待9，-1　　0，0//注：

此例中，谁去按按纽则谁后到；都去按则同时到。

　　在这个例子中，我们可以发现，大猪选择按，小猪最好选择等待，大猪选择不按，小猪还是最好选择等待。

即不管大猪选择按还是不按，小猪的最佳策略都是等待。

也就是说，无论如何，小猪都只会选择等待。

这样的情况下，大猪最好选择是按，因为不按的话都饿肚子，按的话还可以有4个单位的收益。

所以纳什均衡是（大猪按，小猪等待）。

　　这个例子是一个多劳不多得的例子。

现实中这种情况是很普遍的，一些努力工作的人和不工作的人得到与付出并不相称。

改革也有类似的情况，在改革过程中利益的转移必定使一部分人先富一部分人生活水平没得到改善，前一部分人更有改革的积极性。

也就是说，改革往往由“大猪”推动，“大猪”越多，改革速度越快。

这个例子也可以反映斯密的“看不见手”教条，本来大猪是追求自身的利益，结果给小猪也带来了利益。

它也解释了“搭便车”行为，例子中的小猪是一个典型的“搭便车”者，因为它坐享大猪的成果。

　　在这里我们可以联系一下第二章提到的科斯定理，如果我们严格界定产权，是可以改变这种状况的。

　　比如，以法律的形式规定，大猪按出的饲料归大猪支配，小猪按出的饲料归小猪支配，那么大猪小猪都存在去按的动力和积极性。

　　相反，产权不清晰，比如吃大锅饭的情况下，结果是不劳有获、劳而少获，有点类似一幅漫画——卖力的驴子挨鞭子（一只驴子拉着一辆车，车上是一个农夫和另外几头驴子，农夫的鞭子落在拉车的驴子身上催它快跑；这只驴子并没有错，它遭罪只因为它比别的驴子强壮）。

于是人们工作的积极性没有了。

我想，这也是为什么我国改革开放不久，就提出了废除“大锅饭”，砸碎“三铁”（铁饭碗、铁交椅、铁工资）的原因所在了。

　　在智猪博弈中，无论大猪采取何种行动，小猪都是采取等待。

我们把小猪的“等待”称为“占优战略”（有点“以不变应万变”的意思）。

生活中这样的博弈也不少。

比如，某一天你觉得应该是你太太的生日，但又不能肯定：

如果是太太的生日的话，①你可以送一束花，太太会特别高兴，你的效用增加5个单位，②你不送花，但太太会埋怨你忘了她的生日，你的效用降低2个单位；如果不是太太的生日的话，①你可以送太太一束花，太太感到意外的惊喜，你的效用增加3个单位，②你不送花，结果生活同往常一样，可视为你的效用增加0单位。

在这个博弈里，我们看到，“自然”可以有两种策略：

确定今天是太太的生日或确定今天不是太太的生日，但不论“自然”采取何种策略，你的最好行动都是买花。

买花是你的占优战略。

博弈距阵如下（自然的得益皆为0）：

　　　　　　　　　　自然

　　　　是太太的生日　不是太太的生日

你　买花　5，0　　　　　　3，0

　不买花-2，0　　　　　　0，0

　　夫妻吵架也是一场博弈。

夫妻双方都有两种策略，强硬或软弱（或称鹰派和鸽派）。

博弈的可能结果有四种组合：

夫强硬妻强硬、夫强硬妻软弱、夫软弱妻强硬、夫软弱妻软弱。

至于哪一种是纳什均衡，必须列出其支付矩阵才可以确定。

支付矩阵不一定非要用量化确定的数字表示，也可以用支付函数表示。

经济学家们常用支付函数进行讨论。

根据生活的实际观察，夫软弱妻软弱是婚姻最稳定的一种，因为互相都不愿让对方受到伤害或感到难过，常常情愿自己让步。

动物学的研究有相同的结论，性格温顺的雄鸟和雌鸟更能和睦相处，寿命也更长。

夫强硬妻强硬是婚姻最不稳定的一种，大多数结局是负气离婚。

夫强硬妻软弱和妻强硬夫软弱是最常见的一种，许多夫妻吵架都是这样，最后终归是一方让步，不是丈夫撤退到院子里点根烟，就是妻子避让到卧室里嚎啕大哭。

　　犯罪和防止犯罪是罪犯和警察之间进行博弈的一场游戏。

警察可以加强巡逻，或者休息。

犯罪者可以采取作案、不作案两种策略。

如果罪犯知道警察休息，他的最佳选择就是作案；如果警察加强巡逻，他最好还是不作案。

对于警察，如果他知道犯罪者想作案，他的最佳选择是加强巡逻，如果犯罪者采取不作案，自己最好去休息。

当然，犯罪者和警察都不可能完全知晓对方将采取的行动，因此他们都将估计对方采取某种行动的概率，从而决定自己要采取的行动。

结果是，他们将以一定的概率随机地采取行动，这叫“混合策略”。

我们可以简单地分析一下混合策略（对数字不感兴趣的读者可

展开阅读全文