博弈论习题参考答案2.docx-资源下载

博弈论习题参考答案2.docx

1、博弈论习题参考答案2博弈论习题参考答案（第2次作业）一、选择题1.B 2.C 3.A 4.A 5.B 6.ABCD7.C 8.B 9.C 二、判断正误并说明理由1.F 上策均衡是比纳什均衡更严格的均衡概论2.T 上策均衡是比纳什均衡更严格的均衡概论3.T 博弈类型按局中人数多少分为单人博弈、双人博弈和多人博弈4.F 博弈双方偏好存在差异的条件下，一个博弈模型中可能存在2个纳什均衡，如性别战5.T 零和博弈指参与博弈各方在严格竞争下，一方收益等于另一方损失，博弈各方收益与损失之和恒为零，所以双方不存在合作可能性6.T 上策均衡是通过严格下策消去法（重复剔除下策）所得到的占优策略，只能有一个纳什均

2、衡7.F 纳什均衡是上策的集合，指在给定的别人策略情况下，博弈方总是选择利益相对较大的策略，并不保证结果是最好的。 8.F 局中人总是以自己的利益最大化选择自己的策略，并不以对方收益的变化为目标9.T 纳什均衡是上策的集合，指在给定的别人策略情况下，没有人会改变自己的策略而减低自己的收益10.F 局中人总是以自己的利益最大化选择自己的策略，并不以对方收益的变化为目标11.F 局中人总是以自己的利益最大化选择自己的策略，并不以对方收益的变化为目标12.T 虽然斯塔格伯格模型各方利润总和小于古诺模型，但是领导者的利润比古诺模型时高三、计算与分析题 1、（1）画出A、B两企业的损益矩阵。B企业做广

3、告不做广告A企业做广告20，825，2不做广告10，1230，6（2）求纯策略纳什均衡。（做广告，做广告）2、画出两企业的损益矩阵求纳什均衡。（1）画出A、B两企业的损益矩阵百事可乐原价涨价可口可乐原价10，10100，-30涨价-20，30140，35（2）求纳什均衡。两个：（原价，原价），（涨价，涨价）3、假定某博弈的报酬矩阵如下：甲乙左右上a,bc,d下e,fg,h(1)如果（上，左）是上策均衡，那么，a?, b?, g?答：ae, bd, fh, ge, bd4、答：（1）将这一市场用囚徒困境的博弈加以表示。北方航空公司合作竞争新华航空公司合作500000，5000000，900000

4、竞争900000，060000，60000（2）解释为什么均衡结果可能是两家公司都选择竞争性策略。答：若新华选择“竞争”，则北方也会选择“竞争”（600000）；若新华选择“合作”，北方仍会选择“竞争”（900000500000）。若北方选择“竞争”，新华也将选择“竞争”（600000）；若北方选择“合作”，新华仍会选择“竞争”（9000000）。由于“竞争”为双方的占优策略，故均衡结果为两家公司都选择竞争性策略。5、博弈的收益矩阵如下表：乙左右甲上a，bc，d下e，fg，h （1）如果（上，左）是占优策略均衡，则a、b、c、d、e、f、g、h之间必然满足哪些关系？答：从占优策略均衡的定义出

5、发：对甲而言，策略“上”（a,c）优于策略“下”（e,g）；对乙而言，策略“左” （b,f）优于策略“右”(d,h)。所以结论是：ae, bd, fh, cg（2）如果（上，左）是纳什均衡，则（1）中的关系式哪些必须满足？答：纳什均衡只需满足：ae, bd, （3）如果（上，左）是上策均衡，那么它是否必定是纳什均衡？为什么？答：占优策略均衡一定是纳什均衡，因为占优策略均衡的条件包含了纳什均衡的条件。（4）在什么情况下，纯策略纳什均衡不存在？答：当对每一方来说，任意一种策略组合都不满足纳什均衡时，纯战略纳什均衡就不存在。7、求纳什均衡。小猪按等大猪按5，14，4等9，-10，0纳什均衡为：大猪“

6、按”，小猪“等”，即（按，等）6、乙低价高价甲低价100，80050，50高价-20，-30900，600（1）有哪些结果是纳什均衡？答：（低价，低价），（高价，高价）（2）两厂商合作的结果是什么？答：（高价，高价）8、用反应函数法结合划线法，求出下列博弈的所有纯策略纳什均衡。参与人1参与人2甲乙丙丁A2,33,23,40,3B4,45,20,11,2C3,14,11,410,2D3,14,1-1,210,1参与人1的反应函数：R1(2)=B,若2选择甲=B,若2选择乙=A,若2选择丙=C或D,若2选择丁参与人2的反应函数：R2(1)=丙,若2选择A=甲,若2选择B=丙,若2选择C=丙,若2选

7、择D求共集，得纯策略纳什均衡为（B，甲）与（A，丙）9、求出下面博弈的纳什均衡(含纯策略和混合策略)。甲乙LRU5,00,8D2,64,5解：（1）纯策略Nash均衡：由划线法可知，该矩阵博弈没有纯策略Nash均衡。（2）混合策略Nash均衡设甲选择“U”的概率为P1，则选择“D”的概率为1-P1乙选择“L”的概率为P2，则选择“R”的概率为1-P2对甲而言，最佳策略是按一定的概率选“U”和“D”，使乙选择“L”和“R”的期望值相等即 P1*0+(1-P1)*6= P1*8+(1-P1)*5 解得 P1=1/9即（1/9,8/9）按1/9概率选“U”、8/9概率选“D”为甲的混合策略Nash均

8、衡对乙而言，最佳策略是按一定的概率选“L”和“R”，使乙选择“U”和“D”的期望值相等即 P2*5+(1-P2)*0= P2*2+(1-P2)*4 解得 P2=4/7即（4/7,3/7）按4/7概率选“L”、3/7概率选“R”为乙的混合策略Nash均衡10、根据两人博弈的损益矩阵回答问题：甲乙左右上2,30,0下0,04,2(1)写出两人各自的全部策略。答：全部策略：（上，左），（上，右），（下，左），（下，右）(2)找出该博弈的全部纯策略纳什均衡。答：由划线法可知，该矩阵博弈全部纯策略Nash均衡为（上，左）和（下，右）两个(3)求出该博弈的混合策略纳什均衡。解：设甲选择“上”的概率为P

9、1，则选择“下”的概率为1-P1乙选择“左”的概率为P2，则选择“右”的概率为1-P2对甲而言，最佳策略是按一定的概率选“上”和“下”，使乙选择“左”和“右”的期望值相等即 P1*3+(1-P1)*0= P1*0+(1-P1)*2 解得 P1=2/5即（2/5,3/5）按2/5概率选“上”、3/5概率选“下”为甲的混合策略Nash均衡对乙而言，最佳策略是按一定的概率选“左”和“右”，使乙选择“上”和“下”的期望值相等即 P2*2+(1-P2)*0= P2*0+(1-P2)*4 解得 P2=2/3即（2/3,1/3）按2/3概率选“左”、1/3概率选“右”为乙的混合策略Nash均衡11、某寡头垄

10、断市场上有两个厂商，总成本均为自身产量的20倍，市场需求函数为Q=200-P。求：（1）若两个厂商同时决定产量，产量分别是多少？（2）若两个厂商达成协议垄断市场，共同安排产量，则各自的利润情况如何？（3）用该案例解释囚徒困境。答：（1）由已知条件 Q=200-P，P=200-Q TC1=20q1，TC2=20q2 q1+q2=Q 可得1,2厂商的利润函数分别为： K1=Pq1-TC1=(200-(q1+q2)q1-20q1=180q1-q12-q1q2 K2=Pq2-TC2=(200-(q1+q2)q2-20q2=180q2-q22-q1q2令dK/dq1=0 得厂商1的反应函数为180-2

11、Q1-Q2=0，令dK/dq2=0 得厂商2的反应函数为180-Q1-2Q2=0，联解可得q1=q2=60 K1=K2=3600(2) 由已知条件 Q=200-P，P=200-Q TC=TC1+TC2=20q1+20q2 =20Q 可得1,2厂商的总利润函数为： K=PQ-TC=(200-Q)Q-20Q=180Q-Q2令dK/dQ=0 得 Q=90,q1=q2=45 K=PQ-TC=(200-Q)Q-20Q=180Q-Q2=8100 K1=K2=4050(3) 将q1=45,q2=60 和q1=60,q2=45分别代入1,2厂商的利润函数可得1,2厂商的利润为： K1（q1=45,q2=6

12、0）=Pq1-TC1=(200-(q1+q2)q1-20q1=180q1-q12-q1q2=3375 K1（q1=60,q2=45）=Pq1-TC1=(200-(q1+q2)q1-20q1=180q1-q12-q1q2=4500K2 (q1=45,q2=60)=Pq2-TC2=(200-(q1+q2)q2-20q2=180q2-q22-q1q2=4500 K1（q1=60,q2=45）=Pq1-TC1=(200-(q1+q2)q1-20q1=180q1-q12-q1q2=3375厂商2合作（q2=45）不合作（q2=60）厂商1合作（q1=45）4050，40503375，4500不合作（q1

13、=60）4500，33753600，3600根据划线法，可得厂商1.2的上策是（不合作，不合作）即（3600,3600）双方利润均低于（合作，合作）（4050,4050）显然它属于“囚徒困境”13、（市场威慑）考虑下面一个动态博弈：首先，在一个市场上潜在的进入者选择是否进入，然后市场上的已有企业（在位者）选择是否与新企业展开竞争。在位者可能有两种类型，温柔型（左图）和残酷型（右图），回答下面问题。. 左图：温柔型右图：残酷型（1）找出给定在位者的两种类型所分别对应的纳什均衡，以及子博弈精炼纳什均衡（1）温柔型在位者的纳什均衡为 (进入, 默认) 残酷型在位者的纳什均衡为 (不进入, （进入，

14、斗争）)（2）已有企业为温柔型的概率至少多少时，新企业才愿意进入？四、论述题1、解释“囚犯困境”，并举商业案例说明。（1）假设条件举例：两囚徒被指控是一宗罪案的同案犯。他们被分别关在不同的牢房无法互通信息。各囚徒都被要求坦白罪行。如果两囚徒都坦白，各将被判入狱5年；如果两人都不坦白，两囚徒可以期望被从轻发落入狱2年；如果一个囚徒坦白而另一个囚徒不坦白，坦白的这个囚徒就只需入狱1年，而不坦白的囚徒将被判入狱10年。（2）囚徒困境的策略矩阵表。每个囚徒都有两种策略：坦白或不坦白。表中的数字分别代表囚徒甲和乙的得益。囚徒乙坦白不坦白囚徒甲坦白-5， -5-1， -10不坦白-10， -1-2， -2

15、（3）分析：通过划线法可知：在囚徒困境这个模型中，纳什均衡就是双方都“坦白”。给定甲坦白的情况下，乙的最优策略是坦白；给定乙坦白的情况下，甲的最优策略也是坦白。而且这里双方都坦白不仅是纳什均衡，而且是一个上策均衡，即不论对方如何选择，个人的最优选择是坦白。其结果是双方都坦白。（4）商业案例：寡头垄断厂商经常发现它们自己处于一种囚徒的困境。当寡头厂商选择产量时，如果寡头厂商们联合起来形成卡特尔，选择垄断利润最大化产量，每个厂商都可以得到更多的利润。但卡特尔协定不是一个纳什均衡，因为给定双方遵守协议的情况下，每个厂商都想增加生产，结果是每个厂商都只得到纳什均衡产量的利润，它远小于卡特尔产量下的利润

16、。2、解释并讨论古诺的双寡头模型的纳什均衡。为什么其均衡是一种囚徒困境？见上课笔记或计算题第11题3、用“小偷与守卫的博弈”说明“激励（监管）悖论”。（1）假设条件举例：偷窃和防止偷窃是小偷和门卫之间进行博弈的一场游戏。门卫可以不睡觉，或者睡觉。小偷可以采取偷、不偷两种策略。如果小偷知道门卫睡觉，他的最佳选择就是偷；如果门卫不睡觉，他最好还是不偷。对于门卫，如果他知道小偷想偷，他的最佳选择是不睡觉，如果小偷采取不偷，自己最好去睡觉。（2）小偷与门卫的支付矩阵表（假定小偷在门卫睡觉时一定偷成功，在门卫不睡觉时偷一定会被抓住）：门卫睡觉不睡觉小偷偷1，-1-2, 0不偷0, 20, 0（3）分析：

17、通过划线法可知：这个博弈是没有纳什均衡的。门卫不睡觉，小偷不偷，双方都没有收益也没有损失；门卫不睡觉，小偷偷，门卫因为是本职工作得不到奖励，小偷被判刑丧失效用2单位；门卫睡觉，小偷不偷，门卫睡觉的很愉快得到效用2单位，小偷没有收益也没有损失；门卫睡觉，小偷偷，门卫因失职被处分而丧失效用1单位，小偷偷窃成功获得效用1单位。（4）“激励（监管）悖论”说明：现实中，我们看到，当门卫不睡觉时，偷窃分子便收敛一阵；严打的时期一过，偷窃分子又开始兴风作浪，在不能容忍小偷过分猖狂的时候，门卫不得不再次开始认真。即偷的小偷越多，那么不睡觉的门卫将会越多，偷的小偷越少，不睡觉的门卫将越少；反过来，不睡觉的门卫越多，偷的小偷就越少，不睡觉的门卫越少，偷的小偷就越多。如果偷窃集团倾巢出动，那么门卫的选择也是全部不睡觉，但门卫一旦全部不睡觉，小偷最好选择全部不偷，小偷一旦选择全部不偷，门卫最好全部选择睡觉。（5）结论：加重对小偷的处罚在长期中并不能抑制偷窃（而只能使门卫偷懒）；加重处罚失职门卫恰恰是会降低偷窃发生的概率。这种门卫和小偷的博弈所揭示的，政策目标和政策结果之间的这种意外关系，常被称为“激励的悖论”。

邮箱/手机：
温馨提示：	快捷下载时，用户名和密码都是您填写的邮箱或者手机号，方便查询和重复下载（系统自动生成）。如填写123，账号就是123，密码也是123。
特别说明：	请自助下载，系统不会自动发送文件的哦；如果您已付费，想二次下载，请登录后访问：我的下载记录
支付方式：
验证码：	换一换

账号：
密码：
验证码：	换一换
当日自动登录忘记密码？