ImageVerifierCode 换一换
格式:DOCX , 页数:14 ,大小:29.87KB ,
资源ID:19539715      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/19539715.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(策略博弈答案Word格式.docx)为本站会员(b****6)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

策略博弈答案Word格式.docx

1、 对局者选择策略有时间先后的顺序,某些对局者可能率先采取行动,这种博弈被称为序列博弈。 (7)威胁 威胁指一方对局者通过声明等方式企图阻止对方作出某种行为的现象。 (8)承诺 承诺是指对局者所采取的某种行动,这种行动使其威胁成为一种令人可信的威胁。 2为什么上策均衡是稳定的均衡? 答:博弈论中的均衡指一种稳定的结局,当这种结局出现的时候,所有的对局者都不想再改变他们所选择的策略。在上策均衡中,无论另一方作出何种选择,而对局者当前所作出的选择都是最好的,因而他一旦选择上策就不会再改变自己的选择;类似地,另一方也会将己方的策略固定在上策上,不会再发生任何改变,因而此时的均衡是一种稳定的均衡。 3说

2、明纳什均衡与上策均衡之间的区别与联系。纳什均衡是指在对手选择既定的情况下,每一个对局者的选择都是最佳选择。因此,在纳什均衡条件下,所有的对局者都不会去改变他们所选择的策略。而上策均衡是指无论对方如何选择,每一个对局者的选择都是最优选择,符合纳什均衡的定义。上策均衡是纳什均衡的一种特殊情况,但纳什均衡却不一定是上策均衡。 4举例说明什么是纳什均衡。纳什均衡和其他均衡相比有什么特点?纳什均衡,又称为非合作博弈均衡,是指在对手选择既定的情况下,每一个对局者的选择都是最佳选择,“囚徒困境”就是纳什均衡的一个例子。 纳什均衡同其他均衡相比有如下特点: (1)在其他均衡(如消费者均衡、生产者均衡等)状态中

3、,不论是生产者,还是消费者,他们都是独立地作出选择,与其他人的决策无关,因此他们都可以依靠自己的选择来改变自己的处境。而纳什均衡中,对局者虽然是自己单独地作出选择,但是最后的结局是所有对局者采取策略的共同作用的结果。因此,任何一方都无法依靠单方面的行动来改变自己的处境。 (2)在其他均衡分析中,消费者和生产者的选择在边际成本等于边际收益时达到最优,并且在均衡状态中实现了自身最大利益。而在博弈论中,消费者和生产者的选择是在对手选择既定情况下的最优选择,但并不能保证自己的最大利益。因此,纳什均衡是一种稳定的但并不是最优的结局。当这种结局出现的时候,所有的对局者从自身的利益出发,都不想再改变他们所选

4、择的策略。因此,在其他均衡中,消费者或生产者如果改变自己的选择,只会使自己的处境恶化;而在纳什均衡中,如果对局者改变自己的选择,则有可能使自己的处境得到改善。 (3)在其他均衡中,如果消费者达到了效用极大化,或者生产者达到了利润极大化,那么均衡点是唯一的,离开这个均衡点,消费者和生产者都不可能使自己的利益极大化。而在博弈论分析中,有可能存在多个均衡点,这些均衡点都是在给定对手选择条件下对局者最佳选择的结果。因此,消费者和生产者作为对局者不仅要在如何达到均衡的过程中作出选择, 而且还要在有可能出现的多个均衡中进行协商和选择。 5什么是混合策略,它与纯策略有什么不同?每一个对局者都必须寻找一种策略

5、组合使对方不可能通过改变他的策略而得到任何收益,结果是双方都不会改变策略,从而达到一种均衡状态。这种策略组合不可能是单一的策略或者纯策略,而必须把不同的策略混合一起使用,因此这种博弈也称为“混合策略”博弈,所达到的均衡也称为混合策略均衡。对局者所选择的是单一策略或纯策略,因此也称为“纯策略”博弈,所达到均衡也称为纯策略均衡。 在混合策略博弈中,任何一个对局者必须遵循以下三个原则。 (1)不能让对方事先知道自己可能采取的策略。混合策略往往也称为随机策略,不同于前面分析中确定的纯策略。在随机策略中,双方的得益也带有不确定性,只能采取预期收益的形式。 (2)必须采取随机选择的原则。随机选择就是不让自

6、己的选择带有规律性,一旦一方的选择带有规律性,对方就会根据我方决策的规律采取针对性的策略而占上风。 (3)选择策略的概率一定要使对方无机可乘。从随机选择的角度来说,这就意味着一方所选择策略的概率要使另一方选择的所有策略的预期收益相等。 6为什么一个限制了企业灵活性的策略性行动反而能够给予企业一定的优势?在市场进入与阻止市场进入的竞争中,市场垄断者为应对其市场的潜在进入者会采取的某种策略性行动,这种行动限制了企业灵活性行动,但是也同时制约了其他厂商的选择,从而有可能阻止潜在竞争者进入市场,保证自己的垄断优势。如垄断者采取降价竞争的反击策略来对付潜在进入者,那么,当垄断者大幅度降价时,市场的需求也

7、将大幅度扩大,这就需要垄断者具有足够的生产能力来应付扩大的需求。而如果垄断者仅仅依靠短期的加班加点来提高产量,其生产成本会相当高,使得其降价策略很难长期维持。因此,垄断者阻止进入的一种手段就是通过投资来形成一部分剩余的生产能力。这部分生产能力在没有其他厂商进入市场的时候是多余的,多余的生产能力总是厂商的一个包袱,它限制了厂商的其他选择。一旦在潜在进入者试图进入市场时,它就能成为反击进入者的有力武器。因此,限制企业灵活性的策略性行动反而能够给予企业一定的优势。 7假定企业a和企业b都是组合音响的制造商,它们都可以生产中档产品或高档产品,不同选择下企业获利的得益矩阵如下(利润单位:万元): (1)

8、这两个企业有没有上策? (2)该博弈有没有纳什均衡?有几个?请指出。 解:(1)a企业和b企业的上策不存在。如果a企业生产中档组合音响,b企业报酬最大是生产高档组合音响。如果a企业生产高档组合音响,b企业报酬最大却是生产中档组合音响。因此b企业没有上策。同样地,a企业也没有上策。 (2)纳什均衡指在给定竞争者的行为以后,厂商采取他能采取的最好的行为。由定义和矩阵可以看出:当确定a企业生产中档组合音响时,b企业的最优选择是生产高档组合音 响,即组合(100,80)。当确定a企业生产高档组合音响时,b企业的最优选择是生产中档组合音响,即组合(80,100)。反过来,当确定b企业生产中档组合音响时,

9、a企业的最优选择是生产高档组合音响,即组合(80,100)。当确定b企业生产高档组合音响时,a企业的最优选择是生产中档组合音响,即组合(100,80)。因此,该博弈有纳什均衡,是(80,100)和(100,80)。 8在上题的博弈中,如果假定厂商a可以先行一步决定其产品,试用博弈的扩展形式来分析该博弈中的纳什均衡。上例的博弈扩展形式如图6-1所示,该图表示的是厂商a的选择,厂商b的选择也与之类似。博弈从节点1开始,表示厂商a先行一步作出选择:生产中档或高档。如果厂商a选择中档,厂商b在节点2有两个选择:如果厂商b选择中档,获报酬50,如果厂商b的选择是高档,获报酬80。显然此时b的最优选择是生

10、产高档音响。如果厂商a的策略是生产高档,厂商b的决策在节点3,b生产中档可得收益50,生产高档获得收益40。显然此时b应生产中档。因此,厂商b作出什么选择,依赖于厂商a的决策。 图6-1 博弈扩展形式 9假定两家企业a与b之间就做广告与不做广告展开博弈,它们的报酬矩阵如下所示(利润单位:百万元): (1)这是不是一个“囚犯的困境”? (2)如果该对局只进行一次,其纳什均衡是什么? (3)如果博弈是重复的,但我们不考虑无限次的情形,假设只进行10次对局。再假定企业a采取的是“以牙还牙”的策略,并在第一次对局中不做广告,企业8也将采取“以牙还牙”的策略。对企业b,考虑两种不同的情况:在第一次做广告

11、或第一次不做广告,分别计算这两种情况下企业b的累计利润,试问企业b将如何行动?(1)这是一个“囚犯的困境”。因为,对于企业a和b如果双方都不做广告将同时获得报酬200百万元,如果同时都做则获100百万元。因此对于a和b来说都不做广告是最优的。但是对于企业a来说,无论b如何做,a做广告始终是最优的;同样地,对于b来说也是如此考虑。所以,合作对大家都有利,但保持合作对大家也是困难的,即“个人理性”和“集体理性”的矛盾,这就是“囚犯的困境”。 (2)由前面的分析可以知道,对局只有一次,其纳什均衡是都做广告即组合(100,100)。 (3)b第一次做广告: 由于第一次a不做广告,那么第一次对局的结果是

12、(0,300),即b获得报酬300百万 元,a报酬为0。对局第2次时,a采取“以牙还牙”的策略,做广告,b考虑到a将采取“以牙还牙”的策略,那么他会继续做广告,那么第2次对局的结果就是:a和b都做广告(100,100)。在以后的对局中,因为双方都会考虑到对方会采取做广告的策略,则都选择继续做广告,这种合作状态将得以继续。每次对局的结果都是(100,100)。10次对局后b企业的累计利润是:300?100?9?1200(百万元)。 b第一次不做广告: 由于第一次a不做广告,那么第一次对局的结果是(200,200),双方报酬相等。第2次对局时,由于大家都是采用“以牙还牙”的策略,那么双方都认为对方

13、会继续不做广告,则大家都不做广告。那么合作的态势得以继续保持,且每次对局的结果都是(200,200)。 那么,10次对局后b企业将获得累计报酬:200?10?2000(百万元)。显然,企业b在报酬最大化的前提下,会选择在第一次不做广告。 10假设两家企业之间博弈的报酬矩阵如下所示: (1)如果企业b首先行动,画出相应的博弈扩展形式; (2)该序列博弈的纳什均衡点是什么?(1)博弈扩展形式如图6-2所示。 图6-2 (2)纳什均衡指在给定他的竞争者的行为以后,各厂商采取他能采取的最好的行为。当确定企业b为1时,企业a的最优选择是2,即组合(100,40)。当确定企业b为2时,企业a的最优选择是1

14、,即组合(70,50)。反过来,当确定企业a为1时,企业b的最优选择是2,即组合(70,50)。当确定企业a为2时,企业b的最优选择是1,即组合(80,90)。因此,该博弈有纳什均衡点,是(70,50)。 11假设一个卡特尔面临着潜在进入者的进入,它可能采取价格战的策略,也可能采取接纳即不进行价格战的策略,相应的报酬矩阵如下表所示:【篇二:博弈论答案】s=txt假设有n个局中人参与博弈,如果某情况下无一参与者可以独自行动而增加收益(即为了自身利益的最大化,没有任何单独的一方愿意改变其策略的),则此策略组合被称为纳什均衡 ;所有局中人策略构成一个策略组合。纳什均衡,从实质上说,是一种非合作博弈状

15、态。对于扩展式博弈的策略组合s*=(s1*,si*,sn*) ,如果它是原博弈的纳什均衡;它在每一个子博弈上也都构成纳什均衡,则它是一个子博弈精炼纳什均衡。 纳什均衡和子博弈完美纳什均衡所反映的博弈都包括了一个基本假设:即博弈的结构、博弈的规则、所有局中人的策略空间和支付函数。 2、 原博弈和子博弈 子博弈是原博弈的一部分,它本身可以作为独立的博弈分析,由动态博弈第一阶段以外的某个阶段开始的后续博弈阶段构成的,有确切的初始信息集和进行博弈所需要的全部信息能够自成一个博弈的原博弈的一部分。 3、 纯策略和混合策略纳什均衡 纯策略纳什均衡:如果一个战略规定参与人在每一个给定的信息情况下只选择一种特

16、定的行动,。混合策略:如果一个战略规定参与人在给定的信息情况下以某种概率分布随机地选择不同的行动,称为混合战略,此时所达到的均衡状态称为混合战略纳什均衡。 4、完全信息博弈和完美信息博弈 完全信息博弈是指每一参与者都拥有所有其他参与者的特征、策略集及得益函数等方面的准确信息的博弈。完全信息博弈:每个参与人都了解其他参与人的类型的博弈;完美信息则指轮到行动的局中人知道先前的行动的其他局中人采取了什么策略. 5、不完全信息博弈和不完美信息博弈 不完美信息博弈是指:如果没有参与者能够获得其他参与者的行动信息,也就是说当参与者做选择的时候不知道其他参与者的选择,这被称为不完美信息博弈。我们把不能获得其

17、他参与者行动信息的博弈称为不完美信息博弈。 不完全信息博弈是指对其他参与人的特征、策略空间及收益函数信息了解的不够准确、或者不是对所有参与人的特征、策略空间及收益函数都有准确的信息,在这种情况下进行的博弈就是不完全信息博弈。 6、静态博弈和动态博弈动态博弈是指参与人的行动有先后顺序,而且行动在后者可以观察到行动在先者的选择,并据此作出相应的选择。 静态博弈指参与者同时采取行动,或者尽管参与者行动的采取有先后顺序,但后行动的人不知道先采取行动的人采取的是什么行动。 7.有限博弈和无限博弈 无限次重复博弈是指同一个博弈被无限次重复多次。在无限次重复博弈中,对于任何一个参与者的欺骗和违约行为,其他参

18、与者总会有机会给予报复。 区别:无限次重复博弈没有结束重复的确定时间。在有限次重复博弈中,存在最后一次重复正是破坏重复博弈中局中人利益和行为的相互制约关系,使重复博弈无法实现更高效率均衡的关键问题。 简答题 1、 占优均衡、重复剔除的占优均衡、纯策略纳什均衡以及混合策略纳什均衡相互之间的关系是怎样的? 占优均衡重复剔除的占优均衡纯策略纳什均衡混合策略纳什均衡 2、 简述博弈的构成要素及其特征。 要素:一般为参与者,支付与策略;参与者是指博弈中选择行动以最大化自己效用的决策主体可以是个人也可以是团体;策略指参与人选择行动的规则,即在博弈过程中什么情况下选择什么行动的预安排;支付指参与人在博弈结束

19、后从博弈中获得的效用。 3、 占优均衡、重复剔除的占优均衡和纳什均衡相互之间的关系是怎样的? 关系:占优均衡重复剔除的占优均衡纳什均衡 每一个占优战略均衡,重复剔除的占优战略均衡,一定是纳什均衡,但并非每一个纳什均衡都是占优或重复剔除的占优战略均衡。纳什均衡一定是在重复剔除劣战略过程中没有被剔掉的战略组合,但反之不成立,除非它是唯一的。 4、按照信息和顺序,博弈有哪些分类?且对应的均衡概念分别是什么?(1)按照参与人行动的先后顺序进行分类,分为静态博弈和动态博弈;静态博弈指在博弈中,参与人同时选择或非同时选择但后行动者并不知道先行动者采取了什么具体措施;动态博弈指在博弈中,参与人的行动有先后顺

20、序且后行动者能够观察到先行动者所选择的行动。 (2)按照参与人对其他参与人的了解程度进行分类,划分为完全信息博弈与不完全信息博弈;完全信息博弈指在博弈过程中,每一位参与人对其他参与人的特征,策略空间及收益函数有准确的信息;不完全信息博弈指博弈过程中对其他参与者的特征收益函数信息了解得不够准确或者不是对所有参与人的特征收益函数都有准确的信息。 (3)按照参与人之间是否合作进行分类,划分为合作博弈与非合作博弈;合作博弈参与人之间有着一个对各方具有约束力的协议,参与人在协议范围内进行博弈,反之就是非合作博弈。【篇三:博弈练习】同占有一个市场,在每个企业都不做广告时,每年各获利 润500万元,如果两家

21、都做广告,每年两家各获利100万元,如果a做广告b不做,a每年获利1000万元,b每年损失100万元,如果b做广告a不做,则b每年获利1000万元,a损失100万元。用博弈矩形图分析两家共同广告行为:最后回是什么结果? 这是经典的囚徒困境,结果当然是都做广告,即:纳什均衡 因为假设b做广告,那么a的做法显然是做广告。因为在这种情况下a 做广告的利润为:100万元,而a不做广告的利润为:损失100万元,换句话 说:假设b做广告,a有两种选择,一种是得到100万,一种是损失100万,当然选择做广告得到100万。 再假设b不做广告,那么a的做法还是做广告,因为在这种情况下a做 广告的利润为:1000

22、万元,而a不做广告的利润为500万元,换句话说,假设b不做广告,a有两种选择,一种是得到1000万,一种是得到500万,当然选择做广告得到1000万。 同理b,也是理性的,他也可以用完全相同的思路,就是说不管对方做 还是不做广告,选择做广告都是一种理性行为,尽管都不做广告比最后的结果都做广告利润更有吸引力,但这是合作的结果,并不是博弈均衡! 总结:尽管双方合作(不做广告)可以带来更多的好处,但在这种情况下a或 者b都有改变主意的意愿,因为他们都可以通过改变主意使自己的处境变得更 好,到最后只能两家都做广告,因为都做广告的时候,双方都没有任何方法余地改善自己的状况,即:纳什均衡! 总之:选择不做

23、广告是有风险的,因为不做广告更使对方更有贪婪之 心,而选择做广告,在这种情况下自己的情况是最坏的了(损失100万),文 学家伏尔泰曾一语道破天机:有时候我们所指望的最好的结果,其实就是避免最差! 世界最难的三道题. 第一:这道逻辑题是专家raymond smullyan出的,自封为“世界最难逻辑题”,说除他之外无人解答出来。 题目:有甲、乙、丙三个精灵,其中一个只说真话,另外一个只说假话。还有一个随 机地决定何时说真话,何时说假话。你可以向这三个精灵发问三条是非题,而你的任务是从他们的答案找出谁说真话,谁说假话,谁是随机答话。这个难题困难的地方是这些精灵会以“da”或“ja”回答,但你并不知道

24、它们的意思,只知道其中一个字代表“对”,另外一个字代表“错”。你应该问那三条问题呢? 第二: 50个人有50条狗,每人一条,已知其中至少有1条是病狗,现在每人可以去检查除了自己的狗以外的其余49条狗。在假设所有人都是最聪明的情况下必须遵守以下规则: 1。不能把检查结果告诉别人。2。一旦知道自己的狗是病狗必须在当天枪毙自己的狗。 3。可以根据当前的情况判断自己的狗是否是病狗。结果当天平安无事,第二天也很安静,可第三天却传来了一阵枪声,请问一共有几条病狗?标准时间是20分中之内解决问题。 第三:5个囚犯,分别按15号顺序在装有100颗绿豆的一条麻袋内抓绿豆,规定每 人至少抓一颗,数量不限。而抓得最

25、多和最少的人将被处死,而且,他们之间不能交流,但在抓豆的时候, 可以摸出剩下的豆子数。问他们中谁的存活几率最大? 限定条件: 1.他们都是很聪明的人 。2.他们的原则是先求保命。3.100颗不必都分完 。 4.若有重复的情况,则也算最大或最小,一并处死。 博弈、策略类趣题 索赔纠纷 引子:一列并不满载的火车在某处因突发状况而紧急制动。之后又缓缓开动,驶向终点。 到站后,乘客并没说什么。但不久之后,铁路公司总经理收到法院传票一群乘客因火车 紧急制动而受伤:索赔!其实可以很明显的看出他们已经彼此通气:男男女女的乘客统一口 径说他们是因车厢闷热而坐在靠窗口的位置吹风乘凉时,因刹车而被砸到座位的靠背上

26、,导 致各种伤势背部的、颈部的当然,他们都有当地医院开的病历证明。必须说明一点: 无论乘客原来是什么票,只要火车并不满座,座位自然是可以随意坐的。 如今实情是:100名乘客(正好有100个靠窗的位子)每人索赔10w,但你的事故保 险金额有且只有500w可供发放也就是说,也许只有一半人能拿到全额赔款,或者是每 人只能拿到半数赔款。但是这样肯定不能解决问题。如果你就是那个可怜的经理,你要怎么 样去解决这个问题呢? 飞行森林 一片神秘的森林,在里面任何人也无法辨识方向。它存在于一个神奇的空间,这个空间 是精确的欧几里得空间。它只有一条直线的边界,即,森林拓展为一个半平面。一个受过严 格训练的探险者,

27、他对行进方向的控制能力达到了完美的程度。这个探险者打算去森林中寻 找传说的上古时代埋藏在森林的众神宝典。一天,他从森林的边界,提升真气至极限,以 6400公里/小时的极限速度,垂直飞行进入森林1000公里,然后调转行进方向90度继续 行进,这时他的路线是严格与森林的边界平行的。非常幸运的,他终于看到了传说的遗迹, 正当他欣喜若狂的揭开被诅咒了的封印,地动山摇,只觉得好像整个空间都似裂开,他头晕 目眩,终于昏死过去.不知过了多久, 探险者悠悠醒转,可是非常不幸的,他完全迷失了 方向! 空间仍在裂变之中,地域之火正慢慢燃烧,他知道,如果不能在1小时内飞出森林, 这里就是他的葬身之地!.现在请问,是

28、否存在一个飞行策略,使他一定能够活着 飞出森林? 更难点的问题,能否证明你找到的这个策略是最佳的? 过河问题 有三对老虎,分别是虎妈妈和小老虎,三只虎妈妈和其中的一只小老虎会划船,现在只有 一条船,而且最多一次只能坐两只老虎,并且小老虎不能离开妈妈单独和其他老虎在一起,不 然就会被吃掉,现在问他们应该怎么过河? 四人过桥 有四个人,过桥时间分别要:1、2、5、10分钟,桥只可以同时过两个人,只有一把手 电,在晚上无灯的时候,四个人全部安全通过独木桥最少要多少时间? 取球游戏 如果桌面上有颗玻璃球,你和你的对手每人依次取玻璃球,要求是每人每次必须取 到个玻璃球(就是,2,3,4这四个数,你愿意取几个就取几个).请问你是先取,还是后取, 才能有把握取到最后一颗玻璃球,请解释! 还是取球的题 如果桌面上有88颗玻璃球,你和你的对手每人依次取玻璃球,要求是每人第一次必须取到个玻璃球(就是,2,3,4这四个数,取球的上限为4).以后每拿一次取球的上限+1,(就是说刚开始甲可取14个,乙可取15个,然后甲可取16个)请问你是先取,还是后取,才能有把握取到最后一颗玻璃球,请解释! 88球问题新篇 有88个玻璃球.甲乙两人轮流取玻璃球.规则是,第一个人随便取几颗,但不能都

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1