浙大博弈论考试题目.docx

资源描述

浙大博弈论考试题目.docx

《浙大博弈论考试题目.docx》由会员分享，可在线阅读，更多相关《浙大博弈论考试题目.docx（12页珍藏版）》请在冰豆网上搜索。

浙大博弈论考试题目.docx

浙大博弈论考试题目

博弈论考试

1、完全信息静态博弈

1“老师点名和学生逃课”的案例

构建如下模型：

老师

点名不点名

学生逃课a1，b1a2，b2

不逃课a3，b3a4，b4

结果：

（1）老师每次点名，学生每次不逃课

a3>a1，b3>b4，a2

（2）老师每次不点名，学生每次不逃课

a4>a2,b4>b3,a1

（3）老师有时候点名，学生有时候逃课

a1a4,b1>b2,b3

（4）老师每次不点名，学生每次逃课

a2>a4,b2>b1,a3

2市场占有者和想进入市场者

构建模型：

占有者

默认斗争

进入者进入（40，50）（-10，0）

不进入（0，300）（0，300）

没有占优战略均衡，也没有重复剔除的占优均衡。

结果：

（1）占有者默认，进入者进入时，占有者会损失部分利益

（2）占有者斗争，进入者进入，则占有者利益变0，而进入者为负，两败俱伤，因而占有者“斗争”是弱劣战略。

（3）占优者默认，进入者不进入，则占有者获得全部市场

（4）（斗争，不进入时，占有者仍获得全部市场。

综上存在两个纳什均衡，（进入，默认）和（不进入，斗争）

3应试教育和素质教育学生

应试教育素质教育

学校应试教育（0，0）（0，-1）

素质教育（-1，0）（1，1）

（1）假设学校和学生都采取应试教育为（0，0），那么若他们都转向素质教育达到最优结局（1，1），

（2）但如果单方面采取素质教育，另一方为应试教育，其支付就变为-1，比如如果学校重视应试成绩，而学生重视素质教育，学生单方面受损，为-1（3）若学校注重素质教育，而学生只注重成绩，学校的策略难以推行，支付为-1.

此博弈中存在两个纳什均衡，即（应试，应试）和（素质，素质），虽然（素质，素质）是最优纳什均衡，但一方采取素质教育存在风险：

另一方为应试时，支付变为-1；若采取应试没有变为-1的风险，那么最终结局为（应试，应试）。

4两个人合作开发一项产品假设项目开发成功每人收益为4，失败时收益为0，偷懒者的机会成本为1

参与人2

努力偷懒

参与人1努力9/163/8

偷懒3/81/4

（1）双方都努力的期望收益W=9/16*4-1=

（2）自己偷懒对方努力：

W=3/8*4=

（3）自己努力，对方偷懒：

3/8*4-1=

（4）双方偷懒：

W=1/4*4=1

所以此博弈的收益矩阵分布为：

努力偷懒

努力

偷懒1/1

由此可见，偷懒成了最优策略

5公共物品的供给问题（基础设施的建设）

建设不建设

A建设3，32，4

不建设4，21，1

当两者都建设时，是（3，3）

当A建设，B不建设时，（2，4），B的利益大，A损失了部分利益

当两者都不建设时，（1，1），是弱劣战略

当A不建设，B建设时，（4，2）B损失了部分利益

但是人们都是为了追求人类利益最大化的，最终会造成（不建设，不建设）的困境，也是典型的多劳不多得。

6中国政府于电信企业的博弈

政府采用的策略

不激励激励

电信企业维持原状6，67，5

技术改进5，98，7

无论电信企业采取何种战略，“不激励”都是政府的占优策略。

（1）有纳什均衡（维持原状，不激励）是非合作博弈

（2）电信维持原状，政府激励时，（7，5）政府损失部分利益

（3）电信改进，政府不采取时，（5，9）电信有损失

我们可以看出实际上（8，7）是最优战略，但他们都从“个体理性”出发，追求个人利益最大化，而得到了不好的结果。

2、过犹不及

（1）竞技体育运动员Bc指损失，a指收益

激进（概率为q）平和

运动员A激进a-c,a-c2a,0

平和0，2aa,a

当a>c，采用激进—激进纯战略纳什均衡

当a

同时出招，a-c<0时，W（A激进）=（a-c）*q+2a（1-q）为期望收益

W（A平和）=0*q+a（1-q）

当两者相等时，得出q=a/c当a增加时，q增加；c增加时，q下降

W（A平和）=a（1-q）=a（1-a/c）

画图，当a增加时，可得出c/2是一个临界点，当>c/2时，太过于激进，收益反而下降，所以运动员在竞争时，尽力是好的，但过度激进，比如服用兴奋剂，反而会使运动生涯过早的结束。

（2）卖假烟卖假烟者A

限量过量

卖假烟者B限量a,a0,2a

过量2a,0a-c,a-c

C指损失，a指卖假烟的收益，分析照上面，当P=a/c时为均衡点

现在山寨是很流行的，卖假烟在一定程度上不能认为是违法行为的，有时可以缓解经济压力、充面子等，当然这只限于假烟的销量控制在一定范围内，如果过量造成假烟泛滥，则会使市场变得混乱，收益反而会下降，而贩卖假烟本身也可能因此坐牢，这是危害社会和个人的事情。

（3）腾讯QQ和360之间的竞争

（退）和平相处过度竞争（进）PA

360和平相处PB0，02，0

过度竞争2，0-3，-3

E（B退）=P（A进）*0+P（A退）*0E（B进）=P（A进）*-3+P（A退）*-2

当两者相等时，得出P（A进）=P（A退）=

P（B进）=P（B退）=

两者都选择和平共处时是（0，0），然而当它们都为自己的利益而过度竞争，相互斗争时，收益反而下降，它们的用户大量减少，这是双方都受损的情况，因而过度反而是不对的。

（4）对美国“”事件的态度

官员A

鹰鸽

官员B鹰2，210，0

鸽0，105，5

最好的是自己选择鹰战略，对方选择鸽战略

鸽派立足美国自身做出反思，主张从自身寻找消除恐怖主义的途径，在国际关系中奉行多边合作，促进美国发展；但鹰派相反，更加强硬，主张先发制人消除威胁，如伊拉克战争等。

可鹰派的行为并未使自身安全，他们的盟友如英国、埃及惨遭打击，他们的过激行为反而阻碍了美国前进。

“租值消散”理论指无主的、没有归属的收入，在竞争下会消散，在边际上会下降为0，如公海没有业主，钓鱼不收费，他的边际租值为0.

中国巨额的土地红利往往会带来巨大的竞争

竞争人Aa指土地红利

合作竞争c指过度竞争带来的损失

竞争人B合作a,a0,2a分析可照上面

竞争2a,0a-c,a-c

他们都是对自身利益最大化的追求，因而选择（竞争，竞争）概率很大，当过度竞争时，往往会造成贪污腐败，土地减产，价值下跌，暗箱操作等不良问题，反而使自己的投入得不到回报

对于中国土地红利，我个人认为中国国民消费过于保守，投资理念始终停留在对国有银行的存款利息，从根本上让房产投资者土地升值。

我想正是因为它的巨大红利才会造成对土地竞争者的泛滥，供小于求，使得总收益下降，只有少部分获利，贫富差距拉大，妨碍了土地的整合和规模经济，而同时土地红利会造成资源的过度使用甚至是浪费。

3、石头、剪子、布

假设A、B两人玩“石头、剪子、布”的游戏，A是说准备出石头的人，但是这并不可信。

因此两个人所出的仍然是随机的，可作如下标准式收益矩阵。

石头

剪刀

布

石头

0，0

1，-1

-1，1

剪刀

-1，1

0，0

1，-1

布

1，-1

-1，1

0，0

既然A说会出石头，他认为B受其影响极可能出“布”，则自己最好出“剪刀”，理性个人B预料到A会这么想，因此出“石头”最有利，并且A出布的可能性很小；况且如果他真的出石头，而自己再出剪刀岂不是自投罗网，显得“很没面子”，所以出剪刀的可能性最小。

如果我是A，实际上我会出“布”，因为根据以上分析，B最可能出石头，而我出“布”的胜算最大，我认为言语在利益对立的博弈中能起作用。

例子：

抛硬币。

甲乙可自行绝对所抛出的硬币为正面还是反面，若方向相同，则甲胜；若方向相反，则乙胜。

收益矩阵如图所示：

乙

正

反

甲

正

1，-1

-1，1

反

-1，1

1，-1

如果甲说他准备出“正”，理论上乙的最优仅在是出“反”，“正”的概率各位1/2，与甲不说时相同。

但实际上，言语对参与者而言打了一场心理战，甲认为乙会受影响而出“反”，他实际上很可能出“反”，乙也会意识到这点，因此他出“正”的概率反而会比“反”大。

所以我认为言语能在利益对立的博弈中起作用。

同样正如“石头、剪子、布”的游戏，A说会出石头，同样A、B两人因为这句话而打起了心理战。

4、“万元陷阱”

“万元陷阱”是竞拍者利用人们对巨大利益追求的心理而从中获利的手段，（参与者都是自愿的），一旦参与者选择参与，多人竞争会使他们的喊价不断工作，组后则是鹬蚌相争，渔人得利。

参与者如果想要赢利，应该把握以下准则：

1确定投入的极限及预先的约定，譬如投资多少钱或是多少时间？

2要坚持到底（止损原则）3自己打定注意，不必看别人4保持良好的心态5别指望能以很低的价格买入6不要随波逐流，有自己的主见和底线。

7尽快传递“势在必得”的信号8合作，与他人共享，打倒其余的竞拍者。

具体事例：

1如现实生活中购买彩票，抽奖活动，赌马，赌球，股票等，这些都是所谓的“万元陷阱”。

这些活动利用了人们追求巨大利益的心理，他们为此都不断投入精力去做，但最终不一定会有等价的回报，他们通常有两种动机：

经济上和人际关系上。

想赢回自己的损失，有时却会导致更大的损失，而另一方面为了挽回失败的面子，证明自己。

2学校设立的期末奖项评比，也可看作是“万元陷阱”，为此学生想得奖来证明自己的能力，要付出很大的精力来学习，但是奖项是有限的、困难的，最终不一定会有所收获。

3企业的年终奖金评比，企业为了调动员工们的工作积极性，以年终奖来诱惑他们，员工们就陷入一种“万元陷阱”中，将不断投入精力去争取。

因此止损策略是十分重要的，它既要求我们不要无止境地把精力投放在某件事上，反而会得不偿失；又同时要求我们学会坚持到底，在确定极限后，不轻易更改，这样你就能获得最后的胜利，因此它教会我们有张有弛。

同时跟谁博弈比“怎么博弈”更加重要，“万元陷阱”中更理性的一方恰恰是损失更大的一方，虽然自己理性地选择，但是对象是属于“不理性”的，那么你最终反而会失利。

在选择竞争对手时，也要兼顾他与自己的比较，同样不能过于理性，有时要打定注意，坚持到底。

5、征税博弈

理解：

首先做一个关于征税博弈的收益树状图

A百姓

养鱼不养鱼

重税BB政府

（-2，10）（4,4）（0,0）（0,0）轻税

若政府事后违约，百姓即使养鱼仍收重税，那么百姓的实际收益反而下降，这是因为政府是强势的一方，没有关在笼子里，所以认为能建立有效的机制，把他们关在笼子里，才能增加百姓收入，建立和谐社会。

建一个收益矩阵甲

养鱼不养鱼

乙养鱼2，20，1

不养鱼1，05，5

此时有两个均衡点，但在都不养鱼的时候，是革命胜利的收益，但如果（不养鱼，不养鱼），可能会有损失的风险，往往会达成（养鱼，养鱼）的均衡，这样就革命失败了，没有完成把统治者关进笼子里的想法。

囚徒困境A

认罪不认罪

B认罪10年，10年0，20

不认罪20，01，1

他们都是从自我利益出发，A会想假定B认罪，他不认罪要判20年，B不认罪，他不认罪要判1年，综上认罪比不认罪要好，他们两人都这么想，结果得到一个相对较劣的结果。

在希望把统治者关进笼子里时，不同的人都从自己的利益出发，不愿直接和统治者相抗衡，想等其他人革命而暗中得利，但每个人都是这么想的，因而无法实现把统治者关进笼子里的愿望。

同时要注意是否可行，比如给猫挂铃铛的故事，老鼠们为了反抗统治者相出这么个自认为可行的方法，但这是个人利益最大化和集体利益最大化的矛盾。

如何做：

1统治者获胜的关键在于他能离间所有人之间的关系，也就是如果想推翻他，就要学会团结，认识到统治者在损害自身利益，全体集中反抗。

2猫本身是一个暴者，统治者在危害人民利益，因而可从笼子方面着手，建立有效的法律机制，人质机制，让政府守信。

3人民掌握监督权，统治者只享受有限的权力，减少腐败的可能迫使统治者关注人民的利益，对人民负责。

4关注贫富差距，统治者在征税时要区别富人和穷人的征税额度。

5健全福利保障。

6雇主与雇员的监督博弈

（1）记雇主检查的概率为P，雇员偷懒的概率为q

Y主检查=（-C+F）*q+（V-W-C）*（1-q）

Y主不检查=-W*q+（V-W）*（1-q）

当Y主检查=Y主不检查时，得出q=C/（W+F）

Y员偷=-F*P+W*（1-P）,Y员不偷=（W-H）*P+（W-H）*（1-P）

当Y员偷=Y员不偷时，P=H/（W+F）

（2）由上可知，在混合战略纳什均衡时，雇主Y检查=Y不检查

所以Y主=P*Y检查+（1-P）*Y不检查=Y不检查=V-W-q*V=V-W-CV/（W+F）

（Y主），=-1+CV/（W+F）2

当Y主，=0时，W=（VC）1/2-F

所以综上，W=（VC）1/2-F时，雇主的期望收益是最大的。

（3）与不能没收雇员的抵押金F相比，雇主检查的概率与雇员偷懒的概率q都下降了，因为当没收抵押金时，雇员偷懒所造成的经济损失增加，就不敢偷懒，而雇主也知道雇员不敢偷懒，自然检查也就松懈了。

（4）怎样建立信任机制：

他们可以通过增加工资，改善工作环境，完善员工的福利保障制度，增加年终奖金，多与下属员工进行良好的平等沟通，密切关系等。

（5）是，应禁止收取抵押金。

因为收取抵押金不利于创造和谐的工作环境，甚至影响雇主和员工之间的关系，会在一定程度上带给员工内心的恐惧与不安全感，这是不符合社会福利最大化标准的。

并且根据计算，雇主得到最大利益时，收取抵押金Y员=（VC）1/2-F-H，不收取时为Y员=（VC）1/2-H，可见雇员的工资收益也有所降低。

7合法伤害权的价值

具有合法伤害权的是处于博弈的优势方，不具有合法伤害权的处于博弈的劣势方。

权力越大，越能带来巨大的经济利益，对自己越有利。

以上述例子作一个收益矩阵：

设贪污的钱为A，检查成本为B，C为贪污后的处罚成本，设贪污的概率为P，检查的概率为Q。

贪污P不贪污1-P

Q检查（C+A-B，-C）（-B，0）

1-Q不检查（-A,A）（0,0）

Y查=（C+A-B）*P+（-P）*（-B）=-A*P

即P=B/（2A+C）

-C*Q+（1-Q）*A=0,P=A/（A+C）

当贪污的P大于B/2A时，检查时最优选择。

上述例子中，得益的都是贪污的人，打1拳代表的是官权，只要有权，不行使也能得利，如新闻中局长付德武要求他的弟弟将罪名全部承担，而弟弟迫于贪官的权力而被迫承担下来。

贪官可以利用自己的权力采用“双规”手段对付别人，使自己得利，博弈双方是权力者和无权力者，而这个权力就是迫使别人低头用的，有能力压迫别人做某事，但不一定真的耍手段，他要压迫别人，只要有这个权力即可，这就是均衡。

在这里博弈是多重的，各种利益的博弈，规则与人性的博弈，个体与规则的博弈，贪官为了追求更大的利益而运用合法伤害权，同时摒弃了规则与人性，在一种潜规则下与人达成了均衡，它的本质是为了谋利，当一方具有合法伤害别人的权力时，他会充分利用来达到使自己收益最大化的目的，而他们贿赂贪官，除了想得利，也是希望他们不迫害自己。

8ForWhomtheBellTolls

枪打出头鸟的收益矩阵，分为甲乙造反、不造反

甲

造反不造反

乙造反（-1，-1）或（1，1）（-1，-1）

不造反（1，1）（-2，-2）

从收益矩阵中可以看出（不造反，不造反）是均衡点，可造反的人若是失败，则收益为负；若是成功，躲在后面的人也会跟着得利，造反的人不论是哪种情况，都是没有好处的。

因为理性群体哦都市向往自身利益最大化，他们绝不愿未出力的人跟着得益，因而最终得到均衡点（不造反，不造反），所以说“枪打出头鸟”，哪些率先造反的人往往要做出很大牺牲。

也可以做一个猎人和鸟的收益矩阵，更清晰地表示“枪打出头鸟”。

鸟鸟

出头不出头

猎人打（0，0）（-10，-10）

不打（0，10）（5，5）

所以猎人在鸟出头的时候最好的决策就是打，猎人指的是“暴政者”，出头的鸟指“造反的人”。

躲在后面的鸟仍然要付出代价。

出头鸟为前瞻者，追随者为前瞻者，前者没有积累足够的经验，损失很大；而后者为了前者的铺垫，懂得如何规避，所以他们得到很大的利益，但不能说他们就没有损失。

躲在后面的鸟就是不造反的人，在反对压迫者时只要大多数人同时行动，很容易成功，但有人躲在后面，意味着造反的人要付出很大的代价，同时意味着造反很可能失败，那么躲在后面的人仍然要受剥削者的压迫，集体的利益受到损害，个人利益也会受到牵连。

枪打出头鸟的经典案例：

智猪博弈，是多劳不多得

小猪

行动等待

大猪行动5，14，4

等待9，-10，0

从矩阵中可以看出小猪的占优策略是等待，而大猪是行动，却分了部分利益给小猪，这是一种“搭便车”的行为。

而躲在后面的鸟会有两种情况，一种出头鸟成功，后人得益；另一种出头鸟失败了，后面的人不得不再次面对出不出头的困境，并继续深受暴政者的压迫。

9皇帝与功臣

第一种情况有纯战略纳什均衡（杀，造反），皇帝损益为0，功臣损益为0

第二种情况纯战略纳什均衡不存在谢林点，因此分析混合战略均衡，得到皇帝杀的概率为1/2，功臣造反的概率为1/2，皇帝损益-1/2，功臣损益1/2

第三种情况有纯战略的纳什均衡（不杀，不造反），皇帝损益为1，功臣损益为1.

当功臣实力越强，就越可能造反；当功臣实力为中时，皇帝与功臣期望损益最少。

明末安史之乱为第一种情况，宋朝赵匡胤“杯酒释兵权”为第三种情况，而林彪造反为第二种情况。

能传递。

因为功臣实力越弱，皇帝不杀的可能性越高。

历史上这样的例子很多，如安禄山、范蠡等，功臣可以通过告老还乡、交出自己的大权；或者“装傻充愣”，不要显得比皇帝聪明，多多巴结讨好皇帝，有时候学会犯些小错误。

皇帝传递自己是强的，可以这样做：

政治上，励精图治，开明，获取民心，得到百姓的拥戴：

严惩贪官污吏，以达到杀一儆百的目的；在军事上，集中兵权，相对削弱功臣的兵权，只给其一定的指挥权，并严格选拔优秀的军事将领，加强巩固边防，训练士兵，开发新式武器。

经济上，减免苛捐杂税，鼓励耕织，放松从商限制，鼓励通商，并可利用此建立良好的外交，并培养大批人才为己用。

这样皇帝强了，功臣就弱了，功臣认为自己造反成功的概率减小，就不敢造反了。

采取哪些有效的机制：

1民主与法制的完美结合，皇帝不能单靠暴力手段统治天下。

要有一定的机构制约皇帝的权力，皇帝应懂得“取信于民”的重要性，依法治民。

2健全福利保障制度，充分改善百姓生活，获得民心，巩固自己的地位，从制度上保证执政党的利益与人民一致。

3通过民主选举，轮流选出百姓心目中真正能力强的人当领袖，民主领导大众，人民当家作主，人人平等，建立社会主义。

10印象最深或收获最大的内容。

刚走进课堂，老师您幽默风趣的讲解深深吸引了我，我对博弈论有了初步的了解，在这门课上，我接触了一个全新的领域，从许多真实而鲜活的例子中，我感觉到博弈论与我们的生活息息相关，学会了一种新的思考方式——博弈思考，如强盗分金币、万元陷阱等，非常有趣，反常规思考，采用了逆向思考的方法，也让我在以后的社会竞争中记住要反常规出牌，要能学会预测趋势，做到知己知彼。

我从博弈论这门课中得到许多启迪：

第一点：

说真话骗人。

这是一个有趣而又发人深省的现象。

一方面揭示了信任缺失的可悲现状，一方面也提供了一种极为巧妙地方法。

在我知道你不会相信我，于是我故意说出真实的情况，你不信我，因而就达成了欺骗的目的，也就取胜了。

如老师上课所举的“曹操败走华容道”的例子，事实上在当代经济、政治等方方面面领域都是受用的。

第二点：

在博弈中，若希望得到对方的信任，关键是让其相信双方利益时一致的，就像老师上课时所讲的“公主与侍卫的选择”这个例子，只有当他们两人目标一致时，才能得到自己想要的结果。

现实社会中亦是如此，每个人首先都要为自己的利益考虑，从自身出发，若两人的利益产生冲突，则合作也就破产了，沟通的有效性往往来自于利益的一致性，就比如国家外交，公司之间的合作经营等，都是如此。

有句话曾这样说过：

“没有永远的朋友，只有永远的利益。

”这固然有些势利，但也确实如此，利益或许可以成为合作的前提，同时在合作后建立真正的信任，这对我的启发很大，在现代竞争型社会中，利益的冲突不可避免，你不能一味排斥，尽可以从善如流。

第三点：

博弈论在生活中的应用。

以前一直觉得博弈论离我的生活很远，但上了蒋老师的课后，发现生活中处处都在博弈。

就比如价格战博弈，通常我们买衣服时都会讲价，而一开始我们最好把价格压得低一些，老板觉得不合理就讨价还价，最终找到一个我们都能接受的均衡点，还譬如我的收入与支出，自己和朋友、同学之间的交往等等，我们应该从中找到最理想的方式使收益达到最高。

而在现代社会中做生意想要成功同样需要博弈，因而博弈论在生活中的应用是很广泛的。

感谢博弈论这门课为我开拓了一个全新的领域，也谢谢蒋老师您生动有趣的上课方式！

！

社科1008班

黄露

周二晚的课

展开阅读全文