1、博弈与决策作业任务14博弈与决策平时作业(1)一、名词解释1博弈论:是指研究多个个体或团队之间在特定条件制约下的对局中,利用相关方的策略而实施对应策略的学科。2完全信息:是指所有参与者各自选择的行动的不同组合所决定的收益对所有参与者来说是共同知识。3静态博弈:是指博弈中参与者同时采取行动,或者尽管参与者行动的采取有先后顺序,但后行动的人并不知道先采取行动的人采取的是什么行动。4动态博弈:指的是参与人的行动有先有后,而且后选择行动的一方可以看到先采取行动的人所选择的行动。5非合作博弈:如果参与者之间不可能或者根本没办法达成具有约束力的协议,不能在一个统一的框架下采取行动的话,这种博弈类型就是非合
2、作博弈。6纳什均衡:是对于每一个博弈参与者来说是这样的一个战略组合,即给定其他参与者的战略,每一个参与者的这个战略能使其期望效用最大化。7纯策略:如果在每个给定信息下,只能选择一种特定策略,而且参与者选择了这个策略之后就不会单方面改变自己的策略,这个策略就是纯策略。8纯策略纳什均衡:是指在一个纯策略组合中,如果给定其他的策略不变,在该策略组合下参与者不会单方面改变自己的策略,否则会使策略组合令人后悔或者不满意。二、请用剔除劣势策略的方法寻找以下博弈的最优策略。要求: (1)写出剔除的步骤或顺序;(2)画出相应的剔除线;(3)给出最优的博弈结果。乙坦白抵赖甲坦白-3-3-50抵赖0-5-1-1答
3、:(1)对甲而言,抵赖是劣势策略,用横线划去“抵赖”所对应的行;(2)对乙而言,抵赖是劣势策略,用竖线划去“抵赖”所对应的列;(3)余下的策略组合是(坦白,坦白),这就是该博弈的最优结果。注:步骤(1)(2)颠倒亦可百事可乐低价高价可口可乐低价3316高价6155答:(1)对可口可乐而言,高价是劣势策略,用横线划去“高价”所对应的行;(2)对百事可乐而言,高价是劣势策略,用竖线划去“高价”所对应的列;(3)余下的策略组合是(低价,低价),这就是该博弈的最优结果。注:步骤(1)(2)颠倒亦可员工乙LMR员工甲U112210C301002D203101答:(1)对员工乙而言,策略R是明显劣势策略,
4、用竖线划去“R”所对应的列;(2)对员工甲而言,在员工乙剔除R策略之后,C策略是劣势策略,用横线划去“C”所对应的行;(3)对员工乙而言,此时劣势的策略是L,用竖线划去“L”所对应的列;(4)对员工甲而言,此时劣势的策略是D,用竖线划去“D”所对应的行;(5)余下的策略组合是(U,M),这就是该博弈的最优结果。三、根据优势策略下划线法找出以下博弈的纯策略纳什均衡,并指出是否存在混合策略纳什均衡。要求: (1)划出相应优势策略的下划线;(2)给出最优的博弈结果。2号厂商XY1号厂商A410110B4717答:(1)下划线如图所示; (2)只形成一个纯策略纳什均衡,即(A,X)。(3)博弈的结果为
5、(10,4),即1号厂商获得10单位支付,2号厂商获得4单位支付。(4)按照纳什均衡存在性定理,这里不存在混合策略纳什均衡。注:括号的数字和字母顺序不能颠倒2号厂商XY1号厂商A-111-1B1-1-11答:(1)下划线如图所示; (2)没有形成一个纯策略纳什均衡。 (3)按照纳什均衡存在性定理,这里还存在一个混合策略纳什均衡。注:括号的数字和字母顺序不能颠倒2号厂商WXY1号厂商A372054B682250答:(1)下划线如图所示; (2)形成两个纯策略纳什均衡,即(A,Y)和(B,W)。(3)博弈的结果有两个:(4,5),即1号厂商获得4单位支付,2号厂商获得5单位支付;(8,6),即1号
6、厂商获得8单位支付,2号厂商获得6单位支付。(4)按照纳什均衡存在性定理,这里还存在一个混合策略纳什均衡。注:括号的数字和字母顺序不能颠倒四、在以下博弈矩阵图中找出哪一个是囚徒困境博弈,并简要解释理由。乙坏心好心甲坏心1210250好心601239100 图1-1乙坏心好心甲坏心12100110好心50039100 图1-2乙坏心好心甲坏心2010030好心3001211 图1-3答:(1)利用下划线法找出博弈的纳什均衡,如图所示。(2)囚徒困境反映的是基于个人理性的个体最佳选择并非集体最佳选择,参与者之间会选择相互“坏心”,而且对双方而言,(好心,好心)的结果一定要比(坏心,坏心)更好。(3
7、)在三个博弈中,图1-1不是囚徒困境博弈,因为参与者甲在选择“好心”(即合作)策略时才能实现均衡。图1-2所示的博弈为囚徒困境博弈,因为参与者只有在都选择“坏心”(即不合作)策略时才能实现均衡。图1-32所示的博弈也不是囚徒困境博弈,因为对乙而言,(坏心,坏心)的结果比(好心,好心)的结果有利。五、博弈分析假设你所在的公司现在的发展虽然还可以,但是未来前景不容乐观,所以老板只能对一个人加薪。如果你和你的同事之间只有一个人提出来加薪的请求,老板会考虑为提出要求的这个员工加薪,当然不会对那个没有提出来的员工加薪了。但是假如你和你的同事两个人一起提出来要加薪,那么老板就只有选择同时辞退你们俩。请给出
8、这个博弈的矩阵分析图,并解释你最优的策略。答:该博弈矩阵如下:同事要求不要求你要求被辞退被辞退无影响加薪不要求加薪无影响无影响无影响根据下划线方法,在这个博弈中,我们可以找到两个纳什均衡,即(要求,不要求)和(不要求,要求)。这个结果说明,你和同事只能一方提出加薪的要求才可以,同时选择要求加薪的行动只会带来最坏的结果都被辞退。换句话说,你要想获得福利的改进,就应该先行一步提出来加薪的要求。而假如你看到你的同事首先选择了要求加薪的策略之后,你最好不再提出来这样的要求。博弈与决策平时作业(2) 一、名词解释1不确定性:就是指经济行为者在事先不能准确地知道自己的某种决策的结果,或者说,只要经济行为主
9、体的一种决策的可能结果不止一种,就会产生不确定性。2最大期望收益法:就是在事件结果不确定的情况下,应该选择给他带来“期望收益”最大的策略。3混合策略:如果在每个给定信息下,参与者只能以某种概率选择不同地策略,就称为混合策略。4支付均等法:当一个参与者在均衡中应用一个混合策略时,他所得到的支付必须与他在混合策略中所应用的每一个纯策略的支付相同。5子博弈:如果从第一阶段以外的某个阶段开始的后续博弈阶段,也有初始信息集,具备进行博弈所需要的各种信息,能够自成一个博弈,我们就将这个博弈阶段称为原动态博弈的一个“子博弈”。6逆向归纳法:从最后一个阶段或最后一个子博弈开始逆推上去,逐步向前倒推以求解动态博
10、弈均衡,这就是逆向归纳法。7承诺:就是对愿意与你合作的人给予回报的方式。8空洞威胁:当发出威胁的博弈参与者选择威胁所宣称的行动策略时,对自己并没有好处,这就不可信了,这叫做“空洞威胁”。二、请用最大期望收益法寻找最优策略。要求: (1)写出计算步骤;(2)给出最优的策略结果。甲乙两家企业,为了市场份额的争夺,在价格定制问题上各有两种纯策略,如图2-1所示。两家企业都知道自己在各个策略组合下的收益情况,但是并不知道对方的收益。假设甲采取U的概率为0.3,乙采取R的概率为0.6。乙LR甲U1243D4421 答:(1)当乙采取R策略的可能性为0.6时,采取L策略的可能性为0.4,那么甲据此判断采取
11、自己的策略U时所获得的可能的期望收益EU(U)=0.62+0.43=2.4。甲采取自己的策略D时所获得的可能的期望收益EU(D)=0.64+0.41=2.8。很显然,甲应该选择策略D,因为EU(D) EU(U)。(2)当甲采取U策略的可能性为0.3时,采取D策略的可能性为0.7,那么乙据此判断采取自己的策略L时所获得的可能的期望收益EU(L)=0.31+0.74=3.1。乙采取自己的策略R时所获得的可能的期望收益EU(R)=0.34+0.72=2.6。很显然,乙应该选择策略L,因为EU(L) EU(R)。(3)最终该博弈的结果就是(D,L),均衡的支付为(4,4)。三、求解以下博弈的所有纳什均
12、衡。要求: (1)写出计算步骤;(2)给出所有纳什均衡策略。曹操华容道其它路关羽华容道-223-2其它路1-2-12答:(1)对该博弈矩阵利用下划线法,发现没有纯策略纳什均衡。(2)假设关羽选择华容道的概率为p,选择另外一条道的概率为1-p;也假设曹操选择华容道的概率为q,选择另外一条道的概率为1-q。根据支付均等法:对关羽而言,U华容道= U其他路,即2q+(-2)(1-q)= (-2)q+2(1-q),可以得到q=1/2。对于曹操而言,V华容道= V其他路,即(-2)p+1(1-p)=3p+(-1)(1-p),可以得到p=2/7。该博弈的混合纳什均衡为(2/7,1/2)。2号厂商XY1号厂
13、商A101041B1455答:(1)对该博弈矩阵利用下划线法,发现有两个纯策略纳什均衡(A,X)和(B,Y)。(2)假设1号厂商选择A的概率为p,选择B的概率为1-p;也假设2号厂商选择X的概率为q,选择Y的概率为1-q。根据支付均等法:对1号厂商而言,UA= UB,即10q+1(1-q)=4q+5(1-q),可以得到q=2/5。对2号厂商而言,VX= VY,即10p+1(1-p)=4p+5(1-p),可以得到p=2/5。该博弈的混合纳什均衡为(2/5,2/5)。四、请用逆向归纳法分析以下博弈的可能结果。答:(1)逆向归纳法画图如图所示。 (2)可能的均衡路径为AU,1号参与者选A,2号参与者
14、选U,结果为(20,20),双方各得到20单位的报酬。(3)CY路径上的报酬(1000,1000)远大于AU路径上的(20,20),但是并不能成为均衡。因为如果1号参与者选择了C,2号参与者选择Z就可以获得做大的报酬,并使1号只能获得0单位报酬。1号参与者并不能保证2号参与者会选择Z,而且2号即使有这种保证也是不可信的。五、寻找可信的威胁。假如有两个博弈参与者,2号威胁1号说,假如1号参与者对他使坏心,他就会对1号参与者也使坏心。那么在以下哪些博弈图中,1号会相信2号的威胁? 图2-1 图2-2图2-3答:(1)对三个博弈图利用逆向归纳法分析,如图所示。(2)只有当坏心比好心对2号参与者更有利
15、时,2号所提出的威胁才可信。(3)在图2-1和2-2中的威胁才可信。因为如果1号选择坏心的话,2号选择坏心才是最优的,所以威胁可信。(4)在图2-3中,2号所提出的威胁不可信。因为如果1号选择坏心的话,2号选择好心才是最优的,不会选择坏心的。六、博弈分析1假设你是公司的管理者,某天有位员工向你提出加薪的要求,但是你既不舍得他辞职,也暂时不想给他加薪,那么你该如何巧妙地回绝呢?答:你应该告诉他,加薪这事不属于你管,有专门的部门或其他领导负责。所以,你对此无能为力,因为你对此事没有决定权。而一旦知道自己要和这样的人力资源部门去博弈了,这位员工的立场就会发生变化,也许就会软化下来。 2(1)如果一个
16、男孩子给女孩发短信说:“亲爱的,你知道我爱你爱得很深,我愿意为你赴汤蹈火,我每天每时每刻都很想见到你,什么艰难险阻也不能阻止我向你靠近。周五下班的时候,如果不下雨,我就一定过去找你!”。(2)有一位父亲对自己很淘气的儿子说“你再不听话,我就拧掉你的耳朵!”请你分析一下这两个场景中的“承诺”和“威胁”是否值得信赖。答:(1)中的男孩对女孩的“承诺”是不可信的,因为“下雨”是一件成本很小的事,但是男孩却因此不能去做他所说的“每天每时每刻都很想见到你,什么艰难险阻也不能阻止我向你靠近”。所以,廉价的承诺是不可置信的。(2)中的父亲的“威胁”是不可置信的“空洞威胁”。因为拧掉儿子的耳朵对他并没有任何好
17、处,还会因此带来更大的负担,也影响了孩子的一生,父亲也要为此背负一辈子的心理成本和经济成本。对孩子而言,这也是一生的不良影响和沉重的心理负担,以及巨大的机会成本。显然这个威胁这对整个家庭没有任何好处。所以,这个威胁根本不可置信。博弈与决策平时作业(3) 一、名词解释1网络外部性:如果一种产品对消费者的价值会随着其他使用者数量增加而增加,这种产品就具有网络外部性。2大规模协调博弈:源于网络外部性,假如有成千上万的人在同时进行一次性博弈,那就形成了大规模协调博弈。3重复博弈:指同样结构的博弈重复许多次,其中的每次博弈称为“阶段博弈”。4无名氏定理:只要博弈参与者具有足够的耐心,那么在满足博弈参与者
18、个人理性约束的前提下,博弈参与者之间就总有多种可能达成合作均衡。5针锋相对策略:如果博弈参与者第一步采取合作,此后每一步都重复对方上一步的行动,要么是合作要么是背叛,只要是博弈没有确定的期限,由于长期利益对短期行为的制约作用,因此有一些在一次性博弈中不可行的威胁或诺言在重复博弈中会变为可信的,那么就会形成一种持续合作的态势。6冷酷策略:是指参与人在开始时选择合作,在接下来的博弈中,如果对方合作则继续合作,而如果对方一旦背叛,则永远选择背叛,永不合作。7双边博弈:在某些博弈中,每个博弈者的策略组合都相同,博弈者之间的支付或收益对称,这种博弈被称之为双边博弈。8演化稳定策略:说的是,如果均衡一旦得
19、以形成,此后偏离均衡的运动就会受到自然选择的打击。二、请分析以下重复博弈的合作与背叛问题。1图3-1和3-2的两个囚徒困境博弈会一直重复下去,而且没有确切的截止日期,请问哪个博弈的参与者更有可能出卖对方?为什么?乙好心坏心甲好心2020400坏心04055 图3-1乙好心坏心甲好心2020220坏心02255 图3-2答:图3-1所示的囚徒困境博弈的参与者更容易背叛对方。这图3-1和图3-2的两个博弈中,双方都使用好心时,各自获得20个单位的支付。一个参与人在对方好心而自己使坏心时获得的支付是不一样的,图3-1为40个单位,远大于好心时的20个单位;图3-2 为22个单位,仅稍大于好心时的20
20、个单位。所以,图3-1中的参与者更容易背叛对方。2图3-3和3-4的两个囚徒困境博弈会一直重复下去,而且没有确切的截止日期,请问哪个博弈的参与者更有可能出卖对方?为什么?乙好心坏心甲好心2020400坏心0401818 图3-3乙好心坏心甲好心2020400坏心0401515 图3-4答:图3-3所示的囚徒困境博弈的参与者更容易背叛对方。这图3-3和图3-4的两个博弈中,双方都使用好心时,各自获得20个单位的支付;一个参与人在对方好心而自己使坏心时获得的支付为40单位。在图3-3中,即使对方也使用了坏心,双方也还各自获得18个单位支付,与都好心时相差2个单位;而在图3-4中则降低为15个单位,
21、与都好心时相差了5个单位,背叛要付出比较高的代价。所以,图3-3中的参与者更容易背叛对方。三、分析以下博弈的结果及策略。要求: (1)给出可能的博弈均衡;(2)写出应采取的行动策略。1假设你是一位非常出众的男士,有一位热恋的女朋友,她各方面则比较普通。今天晚上在洋河体育场有一场足球比赛,你想去看足球比赛。而此时,在奥体中心也有一场王菲的演唱会,你的女朋友想去听演唱会。博弈矩阵如下,请:(1)分析该博弈的均衡;(2)面对着冲突,你有哪些行动可以选择?女方足球赛演唱会男方足球赛 12 00演唱会 -1-1 21答:(1)根据下划线法,如图所示,博弈均衡为(足球赛,足球赛)或者(演唱会,演唱会),即
22、二人要么都去看球赛,要么都去听演唱会。(2)你可以选择:一是主动告诉女方,愿意陪她去听演唱会;二是主动告诉她,你很想去看足球赛,希望她可以陪你去看;三是自己先发制人地买好两张足球赛的票,告诉女方你已经买了票;四是利用你自身的优势,告诉她要是不陪你去,有其他人愿意陪你去。2你和你的朋友分别经营着一家企业,你们二人可以考虑合作,也可以不合作。当然,基于产品和市场的预期不同,现在有两种情形出现,分别的博弈矩阵如图3-5和3-6所示。请你分析:(1)两种情形分别属于什么博弈?(2)给出博弈的均衡结果。乙合作不合作甲合作 1010 40不合作 04 4 4 图3-5乙合作不合作甲合作 1010 120不
23、合作 012 4 4 图3-6答:(1)图3-5属于合作博弈,是猎鹿博弈。有两个纯策略纳什均衡,即(合作,合作)和(不合作,不合作)。如果对方愿意开展合作,甲和乙的最优行动选择就是选择合作,从而各自获取10个单位的支付。(2)图3-6属于不合作博弈,是囚徒困境博弈。有一个纯策略纳什均衡,即(不合作,不合作)。由于个人理性的存在,甲乙双方只有选择不合作,从而各自获得4个单位的支付。四、请解释以下问题。1 Windows操作系统与大规模协调博弈以及网络外部性有什么关系?答:Windows操作系统的使用具有网络外部性,使用该系统的人越多,这个系统的价值就会变得越高。这样一来,使用者就要考虑使用哪种操
24、作系统的普及率更高。假如有成千上万的人在同时进行一次性博弈,那就形成了大规模协调博弈。2如果你是一个理性的人,看到周围的朋友都逐渐拥有了QQ账号,你应该怎么做?为什么?答:QQ这种即时通讯工具,具有很强的网络外部性,使用QQ的人越多,通过QQ形成的交际网络就变得越大,其网络价值就越高了。而如果你周围使用QQ进行聊天交流的人越多,你拥有的QQ账号所起的作用就越大。所以,你应该也申请一个QQ账号。3微软公司为什么在一定程度上默认盗版的泛滥?答:微软公司在一定程度上默许了盗版的泛滥,实际上就是让自己的产品在市场上逐步深入,得到了更多的使用客户,从而让新使用者首先想到的就是要配备安装微软公司的Wind
25、ows系列操作系统,从而充分发挥其产品的网络外部性。正是盗版帮助了微软公司在中国的发展,没有盗版就没有微软如今在中国市场上的垄断地位。五、博弈分析假设你是一家上市公司的董事长,可以选择如实披露财务数据或向投资者说谎也就是发布虚假的信息,投资者可以选择投资或不投资。博弈矩阵如下。请分析该博弈的均衡策略,你们公司该怎么做?为什么?投资者投资不投资上市公司如实披露 55 00虚假披露 -510 00答:如果这是一个单期博弈的话,其纳什均衡只有一个(虚假披露,不投资),即上市公司选择披露虚假财务信息,投资者选择不投资,双方的博弈支付均为0。如果是多期重复博弈的话,情况就不一样了,只要在没有明确截止期限
26、的情况下,就可以实现(如实披露,投资)这个博弈结果。但是,一旦企业披露的信息有误,有虚假的成分,那么投资者就不会再相信这个上市公司,就在接下来的博弈中选择不投资。所以,上市公司要想和投资者达成合作,就必须向外部的投资者树立一种较强的正面的声誉,不能披露任何虚假的信息,并致力于长期维护这个声誉,从而保证合作得以持续,(如实披露,投资)这个结果才会出现。博弈与决策平时作业(4) 一、名词解释1英式拍卖:也称为公开拍卖或者增价拍卖,买者自由地相继出价,且出价是逐步提高的,直到没有人愿意支付更高的价格为止。2第二价格密封拍卖:每个竞标者分别向拍卖方提交自己的报价,而且他们不知道别人的出价,出价最高的竞
27、标者将获得物品,并按所有的出价中仅次于最高出价的第二高价格支付给卖家。3私人价值拍卖:在这类拍卖中,拍品对不同竞标者的价值可能并非是独立的,每个竞标者都确切地知道该拍品对他本人的价值,但是却不能从其他竞标者的估价中得到对自己的估价任何有用的信息。4边缘政策博弈:是一种将博弈参与者和其他对手置于灾难发生的可能性逐步增大的风险中的一种战略,但是可怕的灾难结果实际上发生与否并不全在发出威胁一方的控制之中。5信号显示:具有信息优势的一方(拥有私人信息的一方)采取某种行动向信息劣势一方(不了解对方私人信息的一方)发送相关信号,来告诉对方自己的真实类型,这就是信号显示。6信号筛选:是在博弈中没有私人信息的
28、一方为了减弱非对称信息对自己的不利影响,以便能够区别不同类型的交易对象而提出的一种交易方式。7道德风险:就是从事经济活动的代理人在最大限度地增进自身效用的同时做出不利于委托人的行动。8激励相容约束:委托人提供一个合约,让代理人在努力工作时所获得的收益大于不努力工作时的收益,这就是激励相容约束。二、请分析以下问题。1小张有一件古董,他认为值 30000元。小李想买这件古董,他认为值50000元。在二人不知道协商如何进行的情况下,请你分析一下可能的结果。答:小张和小李双方可能在30000元至50000元之间的价格上成交。2在上面一个问题的基础上,小王也想买这件古董,也愿意出价50000元来买。在不知道协商如何进行的情况下,而且小李和小王不会串通起来,请你分析一下可能的结果。答:小张应该以50000元的价格卖给小李或者小王,而没有其他结果。因为他们二人都认为该件物品值50000元,那么低于50000元的出价是不稳定的。3假设有一片果园要对公众拍卖,采用英国式拍卖的方式。这片果园的真实价值大概为30万元,但是这个信息
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1