浙大博弈论考试题目.docx

上传人:b****5 文档编号:11831534 上传时间:2023-04-03 格式:DOCX 页数:12 大小:28.83KB
下载 相关 举报
浙大博弈论考试题目.docx_第1页
第1页 / 共12页
浙大博弈论考试题目.docx_第2页
第2页 / 共12页
浙大博弈论考试题目.docx_第3页
第3页 / 共12页
浙大博弈论考试题目.docx_第4页
第4页 / 共12页
浙大博弈论考试题目.docx_第5页
第5页 / 共12页
点击查看更多>>
下载资源
资源描述

浙大博弈论考试题目.docx

《浙大博弈论考试题目.docx》由会员分享,可在线阅读,更多相关《浙大博弈论考试题目.docx(12页珍藏版)》请在冰豆网上搜索。

浙大博弈论考试题目.docx

浙大博弈论考试题目

博弈论考试

1、完全信息静态博弈

1“老师点名和学生逃课”的案例

构建如下模型:

老师

点名不点名

学生逃课a1,b1a2,b2

不逃课a3,b3a4,b4

结果:

(1)老师每次点名,学生每次不逃课

a3>a1,b3>b4,a2

(2)老师每次不点名,学生每次不逃课

a4>a2,b4>b3,a1

(3)老师有时候点名,学生有时候逃课

a1a4,b1>b2,b3

(4)老师每次不点名,学生每次逃课

a2>a4,b2>b1,a3

2市场占有者和想进入市场者

构建模型:

占有者

默认斗争

进入者进入(40,50)(-10,0)

不进入(0,300)(0,300)

没有占优战略均衡,也没有重复剔除的占优均衡。

结果:

(1)占有者默认,进入者进入时,占有者会损失部分利益

(2)占有者斗争,进入者进入,则占有者利益变0,而进入者为负,两败俱伤,因而占有者“斗争”是弱劣战略。

(3)占优者默认,进入者不进入,则占有者获得全部市场

(4)(斗争,不进入时,占有者仍获得全部市场。

综上存在两个纳什均衡,(进入,默认)和(不进入,斗争)

3应试教育和素质教育学生

应试教育素质教育

学校应试教育(0,0)(0,-1)

素质教育(-1,0)(1,1)

(1)假设学校和学生都采取应试教育为(0,0),那么若他们都转向素质教育达到最优结局(1,1),

(2)但如果单方面采取素质教育,另一方为应试教育,其支付就变为-1,比如如果学校重视应试成绩,而学生重视素质教育,学生单方面受损,为-1(3)若学校注重素质教育,而学生只注重成绩,学校的策略难以推行,支付为-1.

此博弈中存在两个纳什均衡,即(应试,应试)和(素质,素质),虽然(素质,素质)是最优纳什均衡,但一方采取素质教育存在风险:

另一方为应试时,支付变为-1;若采取应试没有变为-1的风险,那么最终结局为(应试,应试)。

4两个人合作开发一项产品假设项目开发成功每人收益为4,失败时收益为0,偷懒者的机会成本为1

参与人2

努力偷懒

参与人1努力9/163/8

偷懒3/81/4

(1)双方都努力的期望收益W=9/16*4-1=

(2)自己偷懒对方努力:

W=3/8*4=

(3)自己努力,对方偷懒:

3/8*4-1=

(4)双方偷懒:

W=1/4*4=1

所以此博弈的收益矩阵分布为:

努力偷懒

努力

偷懒1/1

由此可见,偷懒成了最优策略

5公共物品的供给问题(基础设施的建设)

B

建设不建设

A建设3,32,4

不建设4,21,1

当两者都建设时,是(3,3)

当A建设,B不建设时,(2,4),B的利益大,A损失了部分利益

当两者都不建设时,(1,1),是弱劣战略

当A不建设,B建设时,(4,2)B损失了部分利益

但是人们都是为了追求人类利益最大化的,最终会造成(不建设,不建设)的困境,也是典型的多劳不多得。

6中国政府于电信企业的博弈

政府采用的策略

不激励激励

电信企业维持原状6,67,5

技术改进5,98,7

无论电信企业采取何种战略,“不激励”都是政府的占优策略。

(1)有纳什均衡(维持原状,不激励)是非合作博弈

(2)电信维持原状,政府激励时,(7,5)政府损失部分利益

(3)电信改进,政府不采取时,(5,9)电信有损失

我们可以看出实际上(8,7)是最优战略,但他们都从“个体理性”出发,追求个人利益最大化,而得到了不好的结果。

2、过犹不及

(1)竞技体育运动员Bc指损失,a指收益

激进(概率为q)平和

运动员A激进a-c,a-c2a,0

平和0,2aa,a

当a>c,采用激进—激进纯战略纳什均衡

当a

同时出招,a-c<0时,W(A激进)=(a-c)*q+2a(1-q)为期望收益

W(A平和)=0*q+a(1-q)

当两者相等时,得出q=a/c当a增加时,q增加;c增加时,q下降

W(A平和)=a(1-q)=a(1-a/c)

画图,当a增加时,可得出c/2是一个临界点,当>c/2时,太过于激进,收益反而下降,所以运动员在竞争时,尽力是好的,但过度激进,比如服用兴奋剂,反而会使运动生涯过早的结束。

(2)卖假烟卖假烟者A

限量过量

卖假烟者B限量a,a0,2a

过量2a,0a-c,a-c

C指损失,a指卖假烟的收益,分析照上面,当P=a/c时为均衡点

现在山寨是很流行的,卖假烟在一定程度上不能认为是违法行为的,有时可以缓解经济压力、充面子等,当然这只限于假烟的销量控制在一定范围内,如果过量造成假烟泛滥,则会使市场变得混乱,收益反而会下降,而贩卖假烟本身也可能因此坐牢,这是危害社会和个人的事情。

 

(3)腾讯QQ和360之间的竞争

QQ

(退)和平相处过度竞争(进)PA

360和平相处PB0,02,0

过度竞争2,0-3,-3

E(B退)=P(A进)*0+P(A退)*0E(B进)=P(A进)*-3+P(A退)*-2

当两者相等时,得出P(A进)=P(A退)=

P(B进)=P(B退)=

两者都选择和平共处时是(0,0),然而当它们都为自己的利益而过度竞争,相互斗争时,收益反而下降,它们的用户大量减少,这是双方都受损的情况,因而过度反而是不对的。

(4)对美国“”事件的态度

官员A

鹰鸽

官员B鹰2,210,0

鸽0,105,5

最好的是自己选择鹰战略,对方选择鸽战略

鸽派立足美国自身做出反思,主张从自身寻找消除恐怖主义的途径,在国际关系中奉行多边合作,促进美国发展;但鹰派相反,更加强硬,主张先发制人消除威胁,如伊拉克战争等。

可鹰派的行为并未使自身安全,他们的盟友如英国、埃及惨遭打击,他们的过激行为反而阻碍了美国前进。

“租值消散”理论指无主的、没有归属的收入,在竞争下会消散,在边际上会下降为0,如公海没有业主,钓鱼不收费,他的边际租值为0.

中国巨额的土地红利往往会带来巨大的竞争

竞争人Aa指土地红利

合作竞争c指过度竞争带来的损失

竞争人B合作a,a0,2a分析可照上面

竞争2a,0a-c,a-c

他们都是对自身利益最大化的追求,因而选择(竞争,竞争)概率很大,当过度竞争时,往往会造成贪污腐败,土地减产,价值下跌,暗箱操作等不良问题,反而使自己的投入得不到回报

对于中国土地红利,我个人认为中国国民消费过于保守,投资理念始终停留在对国有银行的存款利息,从根本上让房产投资者土地升值。

我想正是因为它的巨大红利才会造成对土地竞争者的泛滥,供小于求,使得总收益下降,只有少部分获利,贫富差距拉大,妨碍了土地的整合和规模经济,而同时土地红利会造成资源的过度使用甚至是浪费。

 

3、石头、剪子、布

假设A、B两人玩“石头、剪子、布”的游戏,A是说准备出石头的人,但是这并不可信。

因此两个人所出的仍然是随机的,可作如下标准式收益矩阵。

B

石头

剪刀

A

石头

0,0

1,-1

-1,1

剪刀

-1,1

0,0

1,-1

1,-1

-1,1

0,0

既然A说会出石头,他认为B受其影响极可能出“布”,则自己最好出“剪刀”,理性个人B预料到A会这么想,因此出“石头”最有利,并且A出布的可能性很小;况且如果他真的出石头,而自己再出剪刀岂不是自投罗网,显得“很没面子”,所以出剪刀的可能性最小。

如果我是A,实际上我会出“布”,因为根据以上分析,B最可能出石头,而我出“布”的胜算最大,我认为言语在利益对立的博弈中能起作用。

例子:

抛硬币。

甲乙可自行绝对所抛出的硬币为正面还是反面,若方向相同,则甲胜;若方向相反,则乙胜。

收益矩阵如图所示:

1,-1

-1,1

-1,1

1,-1

如果甲说他准备出“正”,理论上乙的最优仅在是出“反”,“正”的概率各位1/2,与甲不说时相同。

但实际上,言语对参与者而言打了一场心理战,甲认为乙会受影响而出“反”,他实际上很可能出“反”,乙也会意识到这点,因此他出“正”的概率反而会比“反”大。

所以我认为言语能在利益对立的博弈中起作用。

同样正如“石头、剪子、布”的游戏,A说会出石头,同样A、B两人因为这句话而打起了心理战。

 

4、“万元陷阱”

“万元陷阱”是竞拍者利用人们对巨大利益追求的心理而从中获利的手段,(参与者都是自愿的),一旦参与者选择参与,多人竞争会使他们的喊价不断工作,组后则是鹬蚌相争,渔人得利。

参与者如果想要赢利,应该把握以下准则:

1确定投入的极限及预先的约定,譬如投资多少钱或是多少时间?

2要坚持到底(止损原则)3自己打定注意,不必看别人4保持良好的心态5别指望能以很低的价格买入6不要随波逐流,有自己的主见和底线。

7尽快传递“势在必得”的信号8合作,与他人共享,打倒其余的竞拍者。

具体事例:

1如现实生活中购买彩票,抽奖活动,赌马,赌球,股票等,这些都是所谓的“万元陷阱”。

这些活动利用了人们追求巨大利益的心理,他们为此都不断投入精力去做,但最终不一定会有等价的回报,他们通常有两种动机:

经济上和人际关系上。

想赢回自己的损失,有时却会导致更大的损失,而另一方面为了挽回失败的面子,证明自己。

2学校设立的期末奖项评比,也可看作是“万元陷阱”,为此学生想得奖来证明自己的能力,要付出很大的精力来学习,但是奖项是有限的、困难的,最终不一定会有所收获。

3企业的年终奖金评比,企业为了调动员工们的工作积极性,以年终奖来诱惑他们,员工们就陷入一种“万元陷阱”中,将不断投入精力去争取。

因此止损策略是十分重要的,它既要求我们不要无止境地把精力投放在某件事上,反而会得不偿失;又同时要求我们学会坚持到底,在确定极限后,不轻易更改,这样你就能获得最后的胜利,因此它教会我们有张有弛。

同时跟谁博弈比“怎么博弈”更加重要,“万元陷阱”中更理性的一方恰恰是损失更大的一方,虽然自己理性地选择,但是对象是属于“不理性”的,那么你最终反而会失利。

在选择竞争对手时,也要兼顾他与自己的比较,同样不能过于理性,有时要打定注意,坚持到底。

 

5、征税博弈

理解:

首先做一个关于征税博弈的收益树状图

A百姓

养鱼不养鱼

重税BB政府

(-2,10)(4,4)(0,0)(0,0)轻税

若政府事后违约,百姓即使养鱼仍收重税,那么百姓的实际收益反而下降,这是因为政府是强势的一方,没有关在笼子里,所以认为能建立有效的机制,把他们关在笼子里,才能增加百姓收入,建立和谐社会。

建一个收益矩阵甲

养鱼不养鱼

乙养鱼2,20,1

不养鱼1,05,5

此时有两个均衡点,但在都不养鱼的时候,是革命胜利的收益,但如果(不养鱼,不养鱼),可能会有损失的风险,往往会达成(养鱼,养鱼)的均衡,这样就革命失败了,没有完成把统治者关进笼子里的想法。

囚徒困境A

认罪不认罪

B认罪10年,10年0,20

不认罪20,01,1

他们都是从自我利益出发,A会想假定B认罪,他不认罪要判20年,B不认罪,他不认罪要判1年,综上认罪比不认罪要好,他们两人都这么想,结果得到一个相对较劣的结果。

在希望把统治者关进笼子里时,不同的人都从自己的利益出发,不愿直接和统治者相抗衡,想等其他人革命而暗中得利,但每个人都是这么想的,因而无法实现把统治者关进笼子里的愿望。

同时要注意是否可行,比如给猫挂铃铛的故事,老鼠们为了反抗统治者相出这么个自认为可行的方法,但这是个人利益最大化和集体利益最大化的矛盾。

如何做:

1统治者获胜的关键在于他能离间所有人之间的关系,也就是如果想推翻他,就要学会团结,认识到统治者在损害自身利益,全体集中反抗。

2猫本身是一个暴者,统治者在危害人民利益,因而可从笼子方面着手,建立有效的法律机制,人质机制,让政府守信。

3人民掌握监督权,统治者只享受有限的权力,减少腐败的可能迫使统治者关注人民的利益,对人民负责。

4关注贫富差距,统治者在征税时要区别富人和穷人的征税额度。

5健全福利保障。

 

6雇主与雇员的监督博弈

(1)记雇主检查的概率为P,雇员偷懒的概率为q

Y主检查=(-C+F)*q+(V-W-C)*(1-q)

Y主不检查=-W*q+(V-W)*(1-q)

当Y主检查=Y主不检查时,得出q=C/(W+F)

Y员偷=-F*P+W*(1-P),Y员不偷=(W-H)*P+(W-H)*(1-P)

当Y员偷=Y员不偷时,P=H/(W+F)

(2)由上可知,在混合战略纳什均衡时,雇主Y检查=Y不检查

所以Y主=P*Y检查+(1-P)*Y不检查=Y不检查=V-W-q*V=V-W-CV/(W+F)

(Y主),=-1+CV/(W+F)2

当Y主,=0时,W=(VC)1/2-F

所以综上,W=(VC)1/2-F时,雇主的期望收益是最大的。

(3)与不能没收雇员的抵押金F相比,雇主检查的概率与雇员偷懒的概率q都下降了,因为当没收抵押金时,雇员偷懒所造成的经济损失增加,就不敢偷懒,而雇主也知道雇员不敢偷懒,自然检查也就松懈了。

(4)怎样建立信任机制:

他们可以通过增加工资,改善工作环境,完善员工的福利保障制度,增加年终奖金,多与下属员工进行良好的平等沟通,密切关系等。

(5)是,应禁止收取抵押金。

因为收取抵押金不利于创造和谐的工作环境,甚至影响雇主和员工之间的关系,会在一定程度上带给员工内心的恐惧与不安全感,这是不符合社会福利最大化标准的。

并且根据计算,雇主得到最大利益时,收取抵押金Y员=(VC)1/2-F-H,不收取时为Y员=(VC)1/2-H,可见雇员的工资收益也有所降低。

 

7合法伤害权的价值

具有合法伤害权的是处于博弈的优势方,不具有合法伤害权的处于博弈的劣势方。

权力越大,越能带来巨大的经济利益,对自己越有利。

以上述例子作一个收益矩阵:

设贪污的钱为A,检查成本为B,C为贪污后的处罚成本,设贪污的概率为P,检查的概率为Q。

贪污P不贪污1-P

Q检查(C+A-B,-C)(-B,0)

1-Q不检查(-A,A)(0,0)

Y查=(C+A-B)*P+(-P)*(-B)=-A*P

即P=B/(2A+C)

-C*Q+(1-Q)*A=0,P=A/(A+C)

当贪污的P大于B/2A时,检查时最优选择。

上述例子中,得益的都是贪污的人,打1拳代表的是官权,只要有权,不行使也能得利,如新闻中局长付德武要求他的弟弟将罪名全部承担,而弟弟迫于贪官的权力而被迫承担下来。

贪官可以利用自己的权力采用“双规”手段对付别人,使自己得利,博弈双方是权力者和无权力者,而这个权力就是迫使别人低头用的,有能力压迫别人做某事,但不一定真的耍手段,他要压迫别人,只要有这个权力即可,这就是均衡。

在这里博弈是多重的,各种利益的博弈,规则与人性的博弈,个体与规则的博弈,贪官为了追求更大的利益而运用合法伤害权,同时摒弃了规则与人性,在一种潜规则下与人达成了均衡,它的本质是为了谋利,当一方具有合法伤害别人的权力时,他会充分利用来达到使自己收益最大化的目的,而他们贿赂贪官,除了想得利,也是希望他们不迫害自己。

 

8ForWhomtheBellTolls

枪打出头鸟的收益矩阵,分为甲乙造反、不造反

造反不造反

乙造反(-1,-1)或(1,1)(-1,-1)

不造反(1,1)(-2,-2)

从收益矩阵中可以看出(不造反,不造反)是均衡点,可造反的人若是失败,则收益为负;若是成功,躲在后面的人也会跟着得利,造反的人不论是哪种情况,都是没有好处的。

因为理性群体哦都市向往自身利益最大化,他们绝不愿未出力的人跟着得益,因而最终得到均衡点(不造反,不造反),所以说“枪打出头鸟”,哪些率先造反的人往往要做出很大牺牲。

也可以做一个猎人和鸟的收益矩阵,更清晰地表示“枪打出头鸟”。

鸟鸟

出头不出头

猎人打(0,0)(-10,-10)

不打(0,10)(5,5)

所以猎人在鸟出头的时候最好的决策就是打,猎人指的是“暴政者”,出头的鸟指“造反的人”。

躲在后面的鸟仍然要付出代价。

出头鸟为前瞻者,追随者为前瞻者,前者没有积累足够的经验,损失很大;而后者为了前者的铺垫,懂得如何规避,所以他们得到很大的利益,但不能说他们就没有损失。

躲在后面的鸟就是不造反的人,在反对压迫者时只要大多数人同时行动,很容易成功,但有人躲在后面,意味着造反的人要付出很大的代价,同时意味着造反很可能失败,那么躲在后面的人仍然要受剥削者的压迫,集体的利益受到损害,个人利益也会受到牵连。

枪打出头鸟的经典案例:

智猪博弈,是多劳不多得

小猪

行动等待

大猪行动5,14,4

等待9,-10,0

从矩阵中可以看出小猪的占优策略是等待,而大猪是行动,却分了部分利益给小猪,这是一种“搭便车”的行为。

而躲在后面的鸟会有两种情况,一种出头鸟成功,后人得益;另一种出头鸟失败了,后面的人不得不再次面对出不出头的困境,并继续深受暴政者的压迫。

 

9皇帝与功臣

第一种情况有纯战略纳什均衡(杀,造反),皇帝损益为0,功臣损益为0

第二种情况纯战略纳什均衡不存在谢林点,因此分析混合战略均衡,得到皇帝杀的概率为1/2,功臣造反的概率为1/2,皇帝损益-1/2,功臣损益1/2

第三种情况有纯战略的纳什均衡(不杀,不造反),皇帝损益为1,功臣损益为1.

当功臣实力越强,就越可能造反;当功臣实力为中时,皇帝与功臣期望损益最少。

明末安史之乱为第一种情况,宋朝赵匡胤“杯酒释兵权”为第三种情况,而林彪造反为第二种情况。

能传递。

因为功臣实力越弱,皇帝不杀的可能性越高。

历史上这样的例子很多,如安禄山、范蠡等,功臣可以通过告老还乡、交出自己的大权;或者“装傻充愣”,不要显得比皇帝聪明,多多巴结讨好皇帝,有时候学会犯些小错误。

皇帝传递自己是强的,可以这样做:

政治上,励精图治,开明,获取民心,得到百姓的拥戴:

严惩贪官污吏,以达到杀一儆百的目的;在军事上,集中兵权,相对削弱功臣的兵权,只给其一定的指挥权,并严格选拔优秀的军事将领,加强巩固边防,训练士兵,开发新式武器。

经济上,减免苛捐杂税,鼓励耕织,放松从商限制,鼓励通商,并可利用此建立良好的外交,并培养大批人才为己用。

这样皇帝强了,功臣就弱了,功臣认为自己造反成功的概率减小,就不敢造反了。

采取哪些有效的机制:

1民主与法制的完美结合,皇帝不能单靠暴力手段统治天下。

要有一定的机构制约皇帝的权力,皇帝应懂得“取信于民”的重要性,依法治民。

2健全福利保障制度,充分改善百姓生活,获得民心,巩固自己的地位,从制度上保证执政党的利益与人民一致。

3通过民主选举,轮流选出百姓心目中真正能力强的人当领袖,民主领导大众,人民当家作主,人人平等,建立社会主义。

 

10印象最深或收获最大的内容。

刚走进课堂,老师您幽默风趣的讲解深深吸引了我,我对博弈论有了初步的了解,在这门课上,我接触了一个全新的领域,从许多真实而鲜活的例子中,我感觉到博弈论与我们的生活息息相关,学会了一种新的思考方式——博弈思考,如强盗分金币、万元陷阱等,非常有趣,反常规思考,采用了逆向思考的方法,也让我在以后的社会竞争中记住要反常规出牌,要能学会预测趋势,做到知己知彼。

我从博弈论这门课中得到许多启迪:

第一点:

说真话骗人。

这是一个有趣而又发人深省的现象。

一方面揭示了信任缺失的可悲现状,一方面也提供了一种极为巧妙地方法。

在我知道你不会相信我,于是我故意说出真实的情况,你不信我,因而就达成了欺骗的目的,也就取胜了。

如老师上课所举的“曹操败走华容道”的例子,事实上在当代经济、政治等方方面面领域都是受用的。

第二点:

在博弈中,若希望得到对方的信任,关键是让其相信双方利益时一致的,就像老师上课时所讲的“公主与侍卫的选择”这个例子,只有当他们两人目标一致时,才能得到自己想要的结果。

现实社会中亦是如此,每个人首先都要为自己的利益考虑,从自身出发,若两人的利益产生冲突,则合作也就破产了,沟通的有效性往往来自于利益的一致性,就比如国家外交,公司之间的合作经营等,都是如此。

有句话曾这样说过:

“没有永远的朋友,只有永远的利益。

”这固然有些势利,但也确实如此,利益或许可以成为合作的前提,同时在合作后建立真正的信任,这对我的启发很大,在现代竞争型社会中,利益的冲突不可避免,你不能一味排斥,尽可以从善如流。

第三点:

博弈论在生活中的应用。

以前一直觉得博弈论离我的生活很远,但上了蒋老师的课后,发现生活中处处都在博弈。

就比如价格战博弈,通常我们买衣服时都会讲价,而一开始我们最好把价格压得低一些,老板觉得不合理就讨价还价,最终找到一个我们都能接受的均衡点,还譬如我的收入与支出,自己和朋友、同学之间的交往等等,我们应该从中找到最理想的方式使收益达到最高。

而在现代社会中做生意想要成功同样需要博弈,因而博弈论在生活中的应用是很广泛的。

感谢博弈论这门课为我开拓了一个全新的领域,也谢谢蒋老师您生动有趣的上课方式!

40

社科1008班

黄露

周二晚的课

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 人文社科 > 设计艺术

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1