第32讲纳什均衡II混合策略意义上的分析_精品文档PPT资料.pptx
《第32讲纳什均衡II混合策略意义上的分析_精品文档PPT资料.pptx》由会员分享,可在线阅读,更多相关《第32讲纳什均衡II混合策略意义上的分析_精品文档PPT资料.pptx(44页珍藏版)》请在冰豆网上搜索。
2前述四种纳什均衡分析方法无法对如下两类博弈的博弈方的选择和博弈结果作明确前述四种纳什均衡分析方法无法对如下两类博弈的博弈方的选择和博弈结果作明确的预测,也就无法给博弈方提供明确的建议:
的预测,也就无法给博弈方提供明确的建议:
不存在纳什均衡的博弈,如猜硬币博弈。
纳什均衡不唯一的博弈,如夫妻之争博弈。
3需要引入需要引入“混合策略混合策略”和和“混合策略纳什均衡混合策略纳什均衡”概念概念4混合策略混合策略博弈博弈方以一定的概率分布在可选策略中随机选择的决策方式,在分析原来没有纳什方以一定的概率分布在可选策略中随机选择的决策方式,在分析原来没有纳什均衡的博弈时有非常重要的意义。
均衡的博弈时有非常重要的意义。
在博弈论中,通常把这种策略选择方式称为在博弈论中,通常把这种策略选择方式称为“混合策略混合策略”(MixedStrategy)。
与此)。
与此对应地,把博弈中原来意义上的策略称为对应地,把博弈中原来意义上的策略称为“纯战略纯战略”(PureStrategy)。
)。
5混合策略的较正式混合策略的较正式定义定义:
6纯策略与混合策略之间的纯策略与混合策略之间的关系关系纯策略可以看作为特殊的混合策略,即选择相应纯策略的概率为纯策略可以看作为特殊的混合策略,即选择相应纯策略的概率为1,选择其余纯策略,选择其余纯策略的概率为的概率为0的混合策略。
的混合策略。
如如“猜硬币博弈猜硬币博弈”中,纯策略中,纯策略“盖正面盖正面”可以看做为(可以看做为(1,0),纯策略),纯策略“盖反面盖反面”可以看做为(可以看做为(0,1)。
78混合策略可以看作纯策略的扩展,即如果给一个博弈的每个博弈方的纯策略空间赋混合策略可以看作纯策略的扩展,即如果给一个博弈的每个博弈方的纯策略空间赋予不同的概率分布,就形成了不同的混合策略。
予不同的概率分布,就形成了不同的混合策略。
9需要在混合策略的意义上定义纳什需要在混合策略的意义上定义纳什均衡均衡博弈方的策略从博弈方的策略从“纯策略纯策略”扩展到扩展到“混合策略混合策略”。
博弈方的策略空间从博弈方的策略空间从“纯策略空间纯策略空间”扩展到扩展到“混合策略空间混合策略空间”。
10混合策略意义上的纳什均衡,简称为混合策略意义上的纳什均衡,简称为“混合混合策略纳什均衡策略纳什均衡”。
纳什均衡的本质规定性是纳什均衡的本质规定性是“均衡策略组合满足各博弈方的策略相互是对其他博弈方策均衡策略组合满足各博弈方的策略相互是对其他博弈方策略的最佳对策略的最佳对策”。
111.确定确定“混合策略纳什均衡混合策略纳什均衡”的的方法方法期望得益最大化法;
期望得益最大化法;
期望得益等值法期望得益等值法;
反应函数法。
12以以“猜硬币博弈猜硬币博弈”为例为例13猜硬币猜硬币博弈博弈博弈的混合策略纳什均衡为博弈的混合策略纳什均衡为“盖硬币方盖硬币方”以以1/2的概率随机选择纯策略的概率随机选择纯策略“盖正面盖正面”,“猜硬币方猜硬币方”以以1/2的概率随机选择纯策略的概率随机选择纯策略“猜正面猜正面”。
14期望得益最大化期望得益最大化法法1516171819期望得益等值法期望得益等值法20212223242526期望得益等值期望得益等值法法博弈的混合策略纳什均衡为博弈的混合策略纳什均衡为“盖硬币方盖硬币方”以以1/2的概率随机选择纯策略的概率随机选择纯策略“盖正面盖正面”,“猜硬币方猜硬币方”以以1/2的概率随机选择纯策略的概率随机选择纯策略“猜正面猜正面”。
这与利用。
这与利用“期望得益最大化期望得益最大化法法”获得的结果完全一致获得的结果完全一致。
27“期望得益等值法期望得益等值法”的思路的思路总结总结令各个博弈方随机选择纯策略的概率分布,满足使对方或其他博弈方采用不同纯策令各个博弈方随机选择纯策略的概率分布,满足使对方或其他博弈方采用不同纯策略的期望得益相同,从而计算出各个博弈方随机选择各纯策略的概率略的期望得益相同,从而计算出各个博弈方随机选择各纯策略的概率。
28反应函数法反应函数法29反应函数反应函数法法将博弈方的策略空间扩展到混合策略,将纳什均衡扩展到包括混合策略纳什均衡以将博弈方的策略空间扩展到混合策略,将纳什均衡扩展到包括混合策略纳什均衡以后,求纯策略纳什均衡的反应函数法也可以扩展到求混合策略纳什均衡。
后,求纯策略纳什均衡的反应函数法也可以扩展到求混合策略纳什均衡。
303132333435363738混合策略反应函数法混合策略反应函数法反应函数是一博弈方对另一博弈方每种可能的决策内容的最佳反应决策组成的函数反应函数是一博弈方对另一博弈方每种可能的决策内容的最佳反应决策组成的函数在纯策略的范畴中,反应函数是个博弈方选择的纯策略对其他博弈方纯策略的反应在纯策略的范畴中,反应函数是个博弈方选择的纯策略对其他博弈方纯策略的反应在混合策略的范畴内,博弈方的决策内容为选择概率分布,反应函数就是以方对另在混合策略的范畴内,博弈方的决策内容为选择概率分布,反应函数就是以方对另一方的概率分布的反应,同样也是一定的概率分布一方的概率分布的反应,同样也是一定的概率分布39确定确定“混合策略纳什均衡混合策略纳什均衡”的方法的方法期望得益最大化法;
402.纳什均衡的存在性纳什均衡的存在性41纳什纳什定理定理42用通俗的语言,纳什定理就是说用通俗的语言,纳什定理就是说“每一个有限博弈都至每一个有限博弈都至少有一个混合策略纳什均衡少有一个混合策略纳什均衡”该定理说明了纳什均衡该定理说明了纳什均衡的普遍存在性,这也就意味着纳什均衡分析在我们遇的普遍存在性,这也就意味着纳什均衡分析在我们遇到的大多数博弈问题中,都是一种基本的分析方法到的大多数博弈问题中,都是一种基本的分析方法43纳什均衡的普遍存在性,意味着纳什均衡分析在我们所遇到的大多数博弈问题中,都是一种基本的分析方法。
正是因为有普遍存在性,纳什均衡是博弈结果的“一致预测性”的性质才有意义,纳什均衡才会成为分析博弈和预测博弈结果的中心概念和基本出发点。
44