电大本科《博弈与决策》平时作业答案.docx

资源描述

电大本科《博弈与决策》平时作业答案.docx

《电大本科《博弈与决策》平时作业答案.docx》由会员分享，可在线阅读，更多相关《电大本科《博弈与决策》平时作业答案.docx（15页珍藏版）》请在冰豆网上搜索。

电大本科《博弈与决策》平时作业答案.docx

电大本科《博弈与决策》平时作业答案

《博弈与决策》平时作业

动态博弈：

指的是参与人的行动有先有后，而且后选择行动的一方可以看到先采取行动的人所选择的行动。

非合作博弈：

如果参与者之间不可能或者根本没办法达成具有约束力的协议，不能在一个统一的框架下采取行动的话，这种博弈类型就是非合作博弈。

纳什均衡：

是对于每一个博弈参与者来说是这样的一个战略组合，即给定其他参与者的战略，每一个参与者的这个战略能使其期望效用最大化。

纯策略：

如果在每个给定信息下，只能选择一种特定策略，而且参与者选择了这个策略之后就不会单方面改变自己的策略，这个策略就是纯策略。

纯策略纳什均衡：

是指在一个纯策略组合中，如果给定其他的策略不变，在该策略组合下参与者不会单方面改变自己的策略，否则会使策略组合令人后悔或者不满意。

二、请用剔除劣势策略的方法寻找以下博弈的最优策略。

要求:

（1）写出剔除的步骤或顺序；

（2）画出相应的剔除线；（3）给出最优的博弈结果。

乙

甲

答：

（1）对甲而言，抵赖是劣势策略，用横线划去“抵赖”所对应的行；

（2）对乙而言，抵赖是劣势策略，用竖线划去“抵赖”所对应的列；（3）余下的策略组合是（坦白，坦白），这就是该博弈的最优结果。

[注：

步骤

（1）

（2）颠倒亦可]

百事可乐

答：

（1）对可口可乐而言，高价是劣势策略，用横线划去“高价”所对应的行；

（2）对百事可乐而言，高价是劣势策略，用竖线划去“高价”所对应的列；（3）余下的策略组合是（低价，低价），这就是该博弈的最优结果。

[注：

步骤

（1）

（2）颠倒亦可]

员工乙

员工甲

答：

（1

（2）对员工甲而言，在员工乙剔除R策略之后，C策略是劣势策略，用横线划去“C”所对应的行；

（3）对员工乙而言，此时劣势的策略是L，用竖线划去“L”所对应的列；（4）对员工甲而言，此时劣势的策略是D，用竖线划去“D”所对应的行；（5）余下的策略组合是（U，M），这就是该博弈的最优结果。

三、根据优势策略下划线法找出以下博弈的纯策略纳什均衡，并指出是否存在混合策略纳什均衡。

要求:

（1）划出相应优势策略的下划线；

（2）给出最优的博弈结果。

2号厂商

1号厂商

答：

（1）下划线如图所示；

（2）只形成一个纯策略纳什均衡，即（A，X）。

（3）博弈的结果为（10，4），即1号厂商获得10单位支付，2号厂商获得4单位支付。

（4）按照纳什均衡存在性定理，这里不存在混合策略纳什均衡。

[注：

括号的数字和字母顺序不能颠倒]

2号厂商

1号厂商

答：

（1）下划线如图所示；

（2）没有形成一个纯策略纳什均衡。

（3）按照纳什均衡存在性定理，这里还存在一个混合策略纳什均衡。

[注：

括号的数字和字母顺序不能颠倒]

2号厂商

1号厂商

答：

（1）下划线如图所示；

（2）形成两个纯策略纳什均衡，即（A，Y）和（B，W）。

（3）博弈的结果有两个：

（4，5），即1号厂商获得4单位支付，2号厂商获得5单位支付；（8，6），即1号厂商获得8单位支付，2号厂商获得6单位支付。

（4）按照纳什均衡存在性定理，这里还存在一个混合策略纳什均衡。

[注：

括号的数字和字母顺序不能颠倒]

四、在以下博弈矩阵图中找出哪一个是囚徒困境博弈，并简要解释理由。

乙坏心甲

好心

图1-1

乙坏心甲

好心

乙

坏心甲

图1-3

好心

答：

（1）利用下划线法找出博弈的纳什均衡，如图所示。

（2）囚徒困境反映的是基于个人理性的个体最佳选择并非集体最佳选择，参与者之间会选择相互“坏心”，而且对双方而言，（好心，好心）的结果一定要比（坏心，坏心）更好。

（3）在三个博弈中，图1-1不是囚徒困境博弈，因为参与者甲在选择“好心”（即合作）策略时才能实现均衡。

图1-2所示的博弈为囚徒困境博弈，因为参与者只有在都选择“坏心”（即不合作）策略时才能实现均衡。

图1-32所示的博弈也不是囚徒困境博弈，因为对乙而言，（坏心，坏心）的结果比（好心，好心）的结果有利。

五、博弈分析

假设你所在的公司现在的发展虽然还可以，但是未来前景不容乐观，所以老板只能对一个人加薪。

如果你和你的同事之间只有一个人提出来加薪的请求，老板会考虑为提出要求的这个员工加薪，当然不会对那个没有提出来的员工加薪了。

但是假如你和你的同事两个人一起提出来要加薪，那么老板就只有选择同时辞退你们俩。

请给出这个博弈的矩阵分析图，并解释你最优的策略。

答：

该博弈矩阵如下：

同事

要求

你

不要求要求，要求）。

这个结果说明，你和同事只能一方提出加薪的要求才可以，同时选择要求加薪的行动只会带来最坏的结果——都被辞退。

换句话说，你要想获得福利的改进，就应该先行一步提出来加薪的要求。

而假如你看到你的同事首先选择了要求加薪的策略之后，你最好不再提出来这样的要求。

平时作业讲评

（2）

一、名词解释

1．不确定性：

就是指经济行为者在事先不能准确地知道自己的某种决策的结果，或者说，只要经济行为主体的一种决策的可能结果不止一种，就会产生不确定性。

2．最大期望收益法：

就是在事件结果不确定的情况下，应该选择给他带来“期望收益”最大的策略。

3．混合策略：

如果在每个给定信息下，参与者只能以某种概率选择不同地策略，就称为混合策略。

4．支付均等法：

当一个参与者在均衡中应用一个混合策略时，他所得到的支付必须与他在混合策略中所应用的每一个纯策略的支付相同。

5．子博弈：

如果从第一阶段以外的某个阶段开始的后续博弈阶段，也有初始信息集，具备进行博弈所需要的各种信息，能够自成一个博弈，我们就将这个博弈阶段称为原动态博弈的一个“子博弈”。

6．逆向归纳法：

从最后一个阶段或最后一个子博弈开始逆推上去，逐步向前倒推以求解动态博弈均衡，这就是逆向归纳法。

7．承诺：

就是对愿意与你合作的人给予回报的方式。

8．空洞威胁：

当发出威胁的博弈参与者选择威胁所宣称的行动策略时，对自己并没有好处，这就不可信了，这叫做“空洞威胁”。

二、请用最大期望收益法寻找最优策略。

要求:

（1）写出计算步骤；

（2）给出最优的策略结果。

甲乙两家企业，为了市场份额的争夺，在价格定制问题上各有两种纯策略，如图2-1所示。

两家企业都知道自己在各个策略组合下的收益情况，但是并不知道对方的收益。

假设甲采取U的概率为0.3，乙采取R的概率为0.6。

乙U

甲

答：

（1）当乙采取R策略的可能性为0.6时，采取L策略的可能性为0.4，那么甲据此判断采取自己的策略U时所获得的可能的期望收益EU（U）=0.6×2+0.4×3=2.4。

甲采取自己的策略D时所获得的可能的期望收益EU（D）=0.6×4+0.4×1=2.8。

很显然，甲应该选择策略D，因为EU（D）>EU（U）。

（2）当甲采取U策略的可能性为0.3时，采取D策略的可能性为0.7，那么乙据此判断采取自己的策略L时所获得的可能的期望收益EU（L）=0.3×1+0.7×4=3.1。

乙采取自己的策略R时所获得的可能的期望收益EU（R）=0.3×4+0.7×2=2.6。

很显然，乙应该选择策略L，因为EU（L）>EU（R）。

（3）最终该博弈的结果就是（D，L），均衡的支付为（4，4）。

三、求解以下博弈的所有纳什均衡。

要求:

（1）写出计算步骤；

（2）给出所有纳什均衡策略。

曹操

华容道

其它路

关羽

华容道

其它路

答：

（1）对该博弈矩阵利用下划线法，发现没有纯策略纳什均衡。

（2）假设关羽选择华容道的概率为p，选择另外一条道的概率为1-p；也假设曹操选择华容道的概率为q，选择另外一条道的概率为1-q。

根据支付均等法：

对关羽而言，U华容道=U其他路，即2·q+（-2）·（1-q）=（-2）·q+2·（1-q），可以得到q=1/2。

对于曹操而言，V华容道=V其他路，即（-2）·p+1·（1-p）=3·p+（-1）·（1-p），可以得到p=2/7。

该博弈的混合纳什均衡为（2/7，1/2）。

2号厂商

1号厂商

答：

（1）对该博弈矩阵利用下划线法，发现有两个纯策略纳什均衡（A，X）和（B，Y）。

（2）假设1号厂商选择A的概率为p，选择B的概率为1-p；也假设2号厂商选择X的概率为q，选择Y的概率为1-q。

根据支付均等法：

对1号厂商而言，UA=UB，即10·q+1·（1-q）=4·q+5·（1-q），可以得到q=2/5。

对2号厂商而言，VX=VY，即10·p+1·（1-p

）=4·p+5·（1-p），可以得到p=2/5。

该博弈的混合纳什均衡为（2/5，2/5）。

四、请用逆向归纳法分析以下博弈的可能结果。

（

六、博弈分析

答：

（1）逆向归纳法画图如图所示。

1．假设你是公司的管理者，某天有位员工向你提出加薪的要求，但是你既不舍得他辞职，

（2）可能的均衡路径为A—U，1号参与者选A，2号参与者选U，结果为（20，20），双也暂时不想给他加薪，那么你该如何巧妙地回绝呢？

方各得到20单位的报酬。

答：

你应该告诉他，加薪这事不属于你管，有专门的部门或其他领导负责。

所以，你对此

（3）C—Y路径上的报酬（1000，1000）远大于A—U

路径上的（20，20），但是并不能无能为力，因为你对此事没有决定权。

而一旦知道自己要和这样的人力资源部门去博弈了，这成为均衡。

因为如果1号参与者选择了C，2号参与者选择Z就可以获得做大的报酬，并使1号位员工的立场就会发生变化，也许就会软化下来。

只能获得0单位报酬。

1号参与者并不能保证2号参与者会选择Z，而且2号即使有这种保证也2．

（1）如果一个男孩子给女孩发短信说：

“亲爱的，你知道我爱你爱得很深，我愿意为你是不可信的。

赴汤蹈火，我每天每时每刻都很想见到你，什么艰难险阻也不能阻止我向你靠近。

周五下班的时候，如果不下雨，我就一定过去找你！

”。

（2）有一位父亲对自己很淘气的儿子说“你再不听五、寻找可信的威胁。

话，我就拧掉你的耳朵！

”请你分析一下这两个场景中的“承诺”和“威胁”是否值得信赖。

假如有两个博弈参与者，2号威胁1号说，假如1号参与者对他使坏心，他就会对1号参答：

（1）中的男孩对女孩的“承诺”是不可信的，因为“下雨”是一件成本很小的事，但与者也使坏心。

那么在以下哪些博弈图中，1号会相信2号的威胁？

是男孩却因此不能去做他所说的“每天每时每刻都很想见到你，什么艰难险阻也不能阻止我向你靠近”。

所以，廉价的承诺是不可置信的。

（2）中的父亲的“威胁”是不可置信的“空洞威胁”。

因为拧掉儿子的耳朵对他并没有任1号何好处，还会因此带来更大的负担，也影响了孩子的一生，父亲也要为此背负一辈子的心理成1号本和经济成本。

对孩子而言，这也是一生的不良影响和沉重的心理负担，以及巨大的机会成本。

显然这个威胁这对整个家庭没有任何好处。

所以，这个威胁根本不可置信。

2020，1平时作业讲评（3）一、名词解释

1．网络外部性：

如果一种产品对消费者的价值会随着其他使用者数量增加而增加，这种产品就具有网络外部性。

4）2．大规模协调博弈：

源于网络外部性，假如有成千上万的人在同时进行一次性博弈，那就形成2）了大规模协调博弈。

3．重复博弈：

指同样结构的博弈重复许多次，其中的每次博弈称为“阶段博弈”。

4．无名氏定理：

只要博弈参与者具有足够的耐心，那么在满足博弈参与者个人理性约束的前提

1号下，博弈参与者之间就总有多种可能达成合作均衡。

参与者5．针锋相对策略：

如果博弈参与者第一步采取合作，此后每一步都重复对方上一步的行动，

展开阅读全文