决策理论与方法物流Word格式文档下载.docx
《决策理论与方法物流Word格式文档下载.docx》由会员分享,可在线阅读,更多相关《决策理论与方法物流Word格式文档下载.docx(4页珍藏版)》请在冰豆网上搜索。
纳什均衡有强弱之分,以上是弱纳什均衡,也是最常用的纳什均衡概念,强纳什均衡是指每个博弈方对于对手的策略有唯一的最佳反应,即为严格纳什均衡,当且仅当对所有i,所有其他,均有:
三、两人有限零和博弈
(一)两人有限零和博弈模型两人有限零和博弈是指只有两个局中人,每个局中人都有有限个可选择的策略,而且在任一局势中两个局中人得失之和总是等于零。
第二节完全信息静态博弈如果我们用和表示两人有限零和博弈的两个局中人,并设他们的策略集分别为,。
局中人的支付矩阵可记作:
根据局中人的支付矩阵A,结合博弈的一般式表述,我们可将这种博弈记作。
(二)最优纯策略与纳什均衡定义7.3对于博弈,如果则称分别为局中人和的最优纯策略,称局势()为博弈G的鞍点,v称博弈的博弈值。
不难验证鞍点()是博弈的纳什均衡,鞍点又称纯策略纳什均衡。
两人有限零和博弈存在的鞍点的充要条件是支付矩阵中存在一个元素,使对于一切,,总有:
第二节完全信息静态博弈(三)最优混合策略与纳什均衡局中人只能以一定的概率在其策略集中随机选择每个策略,这种在纯策略空间上的概率分布为混合策略。
设博弈,,,令分别为局中人和在各自的策略集和中选择策略和的概率,则称分别为局中人和的一个混合策略。
称为局中人的期望获得,为的期望获得,而()为博弈的混合局势。
又记分别为局中人和的混合策略集合。
定义7.4如果则称为局中人和的最优混合策略,称()为G的最优混合局势,称为博弈方的期望所得。
最优混合局势构成了混合意义上的纳什均衡,任何一方,单独背离这个局势,则它的期望所得将不会优于最优混合局势下的所得。
第二节完全信息静态博弈(四)最优混合策略的求解方法博弈有混合意义下的解的充要条件是:
存在满足下列两个不等式组:
(1)
(2)为了求解上述不等式组,可将它们变为线性规划而求出博弈G的最优混合策略。
不妨设(否则令,则一定可大于零)。
令,则不等式组
(1)等价于下面的线形规划:
(3)同理,令,问题
(2)就变为线形规划(4):
(4)第二节完全信息静态博弈四、应用举例图7-4市场进入阻挠博弈例7-3市场进入阻扰博弈。
一种市场上存在一个垄断企业,另一个企业希望进入这一市场,垄断者为了保持自己的地位需要对进入者进行阻挠。
这种博弈中,进入者有两种策略可以选择:
“进入”与“不进入”;
垄断者也有两种策略:
“容忍”与“反击”。
他们的支付函数用以下双变量矩阵表示(见图7-4)。
例7-4产量决策的古诺模型。
古诺模型是博弈论中最经典的例子。
古诺首先提出了这一模型。
由于他采用了分析企业各自的最优反应函数从而形成均衡的思路,与纳什均衡非常相似,因此纳什均衡也称古诺一纳什均衡。
它描述的是所谓厂商进行数量竞争的形势,以下是最常见的一种较为简化的版本。
生产同质产品的两个企业同时选择各自的产量,市场需求决定价格。
单位成本均为常数c。
求解其中的纳什均衡。
例7-5公共地悲剧模型。
假设有n个人共同拥有的一个公共牧场,每个人要决定自己放牧羊的数目,总的羊数因此为。
购买和照看1只羊的成本为常数c。
设每只羊的价值为,随着羊的增加,草地会越来越拥挤,食物也会更紧张,因此会造成羊的价值下降,另一方面,羊的供给增加也会造成羊的价值下降,求此博弈中的纳什均衡。
第三节完全信息动态博弈一、博弈的扩展式表述在动态博弈中,参与人的行动有先后顺序,且后行动者在自己行动之前能观测到先行动者的行动且对各博弈方的策略空间及支付有充分的了解,我们称这种博弈为完全信息动态博弈。
动态博弈有不同与静态博弈的特征,习惯于用扩展式来描述和分析动态博弈。
博弈的扩展式表述包括以下要素:
(1)参与人集合;
(2)行动次序,即参与人参与行动的次序;
(3)收益,即参与人所采取行动的函数;
(4)行动,即轮到次序的参与人的选择;
(5)信息集,它表示参与人在每次行动时所知道的信息;
(6)每一个外生事件的概率分布。
二、多阶段可观察行动博弈与子博弈完美纳什均衡多阶段可观察行动博弈,这种博弈有着多个“阶段”,通常记为k,行动的历史通常记为,从而
(1)在每一个阶段k,每一个参与人都知道所有行为情况,包括自然的行为以及过去各阶段所有参与人的行为;
(2)在任一给定阶段中,每一个参与人最多只能行动一次;
(3)阶段k的信息集不会提供有关这一阶段的任何信息。
由于这种博弈存在多个阶段,它与只有一个阶段的完全信息博弈有着本质的区别,因此如果我们仍用纳什均衡思想分析这种博弈问题就难免存在局限性。
泽尔滕(Selten,1965)提出了子博弈完美纳什均衡的思想。
泽尔滕子博弈完美纳什均衡是指在一个多阶段可观察的博弈中,由各博弈方的策略构成的一个策略组合,这个策略组合满足在整个动态博弈及它的所有子博弈中都构成纳什均衡。
第三节完全信息动态博弈三、完美信息博弈与逆向归纳法在多阶段可观察行动博弈中,如果我们对条件
(2)稍加限制,即在任一给定阶段中,每一个参与人最多只能行动一次而且只有一个参与人采取行动,就得到完美信息博弈。
由于多阶段可观察行动博弈中,引入了子博弈完美纳什均衡的概念,借助这种概念的思想,多阶段可观察行动博弈通常采用逆向归纳法。
“逆向归纳法”这一思路是通过逆向归纳的方法,先解决参与人在面临任何可能情况下的最终行为策略,然后逐步向前推导计算前一步最优选择。
逆向归纳法可以在任何完美信息下的多阶段博弈中应用,这一方法从最终阶段k在每一历史情况下最优选择开始,即在给定历史情况条件下,通过最大化参与人在面临历史情况条件的收益确定其最优行动,从而向前推算到阶段k-1,并确定这一阶段中采取行动的参与人的最优行为,只要给定阶段中采取行动的参与人在历史情况下将采取我们之前推导出来的最优行动即可。
用这一方法不断地向前推算下去,直至初始阶段,这样我们就可以建立一个策略组合。
第四节不完全信息静态博弈一、概念如果在一个博弈中,某些参与人不知道其他参与人的收益,我们就说这个博弈是不完全信息博弈。
海萨尼(Harsanyi,1967―1968)首先给出了一种模拟和处理这一类不完全信息博弈的方法,即引入一个虚拟参与人――“自然”,“自然”首先选择参与人1的类型(这里是他的成本)。
在这个转换博弈中,参与人2关于参与人1成本的不完全信息就变成了关于“自然”的行动的不完全信息,从而这个转换博弈可以用标准的技术来分析。
从不完全信息博弈到不完美信息博弈的转换如图7-3所示,这个图是首先由海萨尼给出的。
N代表“自然”,“自然”选择参与人1的类型。
这里有一个标准假设,即所有参与人对自然行动的概率分布具有一致的判断。
一旦采用这一假设,我们就得到一个标准博弈,从而可以使用纳什均衡的概念。
海萨尼的贝叶斯均衡(或贝叶斯纳什均衡)正是指不完美信息博弈的纳什均衡。
二、策略和类型参与人的“类型”――他的私人信息――就是他的成本。
在通常情况下,一个参与人的类型可能包括与其决策相关的任何私人信息。
参与人的收益函数就相当于它的类型。
如果参与人的类型过于复杂,模型就可能很难处理,在实际运用中,通常假定参与人关于对手的判断完全由他自己的收益函数决定。
海萨尼考虑了更一般的情形。
假定参与人的类型取自某一客观概率分布,这里属于某一空间。
简单起见,假定存在有限个元素。
只能被参与人i观察到。
令代表给定是参与人i关于其他参与人类型的条件概率。
假定对于每一个,边际分布是严格正的。
第四节不完全信息静态博弈我们通常把博弈的外生因素如策略空间、收益函数、可能类型、先验分布等视为共同知识。
一般来说,这些策略空间都比较抽象,有些还包括如扩展式博弈中的相机行动策略。
但在这里,为简单起见,我们假定策略空间Si是参与人i的(非相机)行动集。
可以用代表类型为的参与人i的策略选择(可能是混合策略)。
如果参与人i知道其他参与人的策略是其相应类型的函数,参与人1就可以用条件概率来计算对应于每一个选择的期望效用从而找出最优反应策略。
三、贝叶斯均衡定义7.4在一个不完全信息博弈中,如果每一参与人i的类型有限;
且参与人类型的先验分布为p,相应纯策略空间为,则该博弈的一个贝叶斯均衡是其“展开博弈”的一个纳什均衡,在这个“展开博弈”中,每一个参与人i的纯策略空间是由从到的映射构成的集合。
给定策略组合,和,令代表当参与人i选择而其他人选择,且令代表策略组合在的值。
那么策略组合是一个(纯策略)贝叶斯均衡,如果对于每一个参与人i均有第四节不完全信息静态博弈四、贝叶斯均衡的举例例7-8不完全信息下的古诺模型。
考虑双寡头垄断古诺模型(产量竞争)。
假定企业的利润,这里是线性需求函数的截距与企业i的不变单位成本之差,是企业i选择的产量。
企业1的类型是共同知识(即企业2完全知道关于企业1的信息,或者说企业1只有一种可能类型)。
但企业2拥有关于其单位成本的私人信息。
企业1认为的概率是,的概率也是,而且企业1的判断是共同知识。
这样,企业2有两种可能类型,我们分别将其成为“低成本型”()和“高成本型”()。
两个企业同时选择产量。
下面来看这个博弈的纯策略均衡。
即企业1的产量为,企业2在时产量为,在时的产量为。
企业2的均衡产量必须满足企业1不知道企业2是那种类型,因此他的收益只能是对企业2的类型取期望:
将和代入中,我们得到贝叶斯均衡解为(,,)(事实上,这也是惟一的均衡)。
第五节不完全信息动态博弈一、不完全信息动态博弈问题信号博弈的基本特征是博弈方分为信号发出方和信号接受方两类,先行为的信号发出方的行为对后行为的信号接受方来说具有传递信息的作用。
信号博弈其实是一类具有信息传递机制的动态贝叶斯博弈的总称。
许多博弈或信息经济学问题都可以归结为信号博弈。
一个信号博弈可表示为:
1博弈方0以概率为信号发出方S选择类型;
2发出方S选择行为;
3接收方R看到后选择行为;
4双方得益和都取决于和。
完美贝叶斯均衡的条件是:
(1)接收方R在观察到发出方的信号后,必须有关于发出方的类型判断,即发出方选择行为时,发出方S是类型的后验概率:
(2)对于发出方给出的信号和对发出方类型判断即后验概率,接收方R选择的行动必须是接收方收益最大,即(3)给定R的策略时,S的选择必须使S的得益最大,即是最大化问题的解。
满足上述要求的双方策略和接收方判断构成信号博弈的完美贝叶斯均衡。
第五节不完全信息动态博弈二、类型和海萨尼转换静态贝叶斯博弈中处理不完全信息的方法是将博弈方得益的不同可能理解为博弈方有不同的类型,并引进一个为博弈方选择类型的虚拟博弈方,从而把不完全信息博弈转化成完全但不完美信息动态博弈,这样的处理方法称为海萨尼转换。
这种处理方法同样适用于动态贝叶斯博弈,二者的差别是动态贝叶斯博弈转化的不是两阶段有同时选择的不完美信息动态博弈,而是更一般的不完美信息动态博弈。
既然通过海萨尼转换可以很容易地将动态贝叶斯博弈转化为完全但不完美信息动态博奔,那么动态贝叶斯博弈分析就可以主要利用贝叶斯均衡、合并均衡和分开均衡等概念和相应的分析方法。
三、完美贝叶斯均衡完美贝叶斯均衡要求:
(1)在每个信息集上,局中人必须有一个定义在属于该信息集的所有节点上的概率分布,这就是局中人的信念,信息集包含了局中人类型的信息,这一信念也相当于在该信息集上对其他局中人类型的概率判断;
(2)给定该信息集上的信念和其他局中人的后续策略,局中人的后续策略必须是最优的;
(3)局中人根据贝叶斯法则和均衡策略修正后验信念。
定义7.5完美贝叶斯均衡是一种策略组合与一种后验概率组合,满足:
对于所有的局中人i,在每个信息集h,;
由先验概率、所观测的和最优策略通过贝叶斯法则形成。
第五节不完全信息动态博弈四、举例
(一)2×
2声明博弈2×
2声明博弈中声明能有效传递信息的几个必要条件:
1不同类型的声明方必须偏好行为方的不同行为。
2对应声明方的不同类型,行为方必须偏好不同的行为。
3行为方的偏好必须与声明方的偏好具有一致性。
(二)离散型声明博弈模型
(1)自然抽取声明方的类型,抽取的方法是从类型集合中以概率分布随机抽取,其中。
(2)声明方了解到自己的以后,从中选择,作为自己声明的类型。
当然可以与相同说真话,也可以与不同说假话。
(3)行为方在听到声明力的声明后,在可选择的行为集合中选择行为。
(4)声明方的得益为,行为方的得益为。
第四节DEA方法2.生产可能集生产可能集定义为所有可能的生产活动构成的集合,记作。
由于()是决策单元j的生产活动,于是有在模型中,生产可能集应该满足下面的四条公理。
公理5.1(凸性)对于任意,以及任意,均有即是说,如果,分别以,()加权和作为投入量,则,以同样的加权和作为产出量。
公理5.2(锥性)对于任意,任意数,均有即是说,如果以x的倍作为投入量,则产出量y是的同样倍数。
公理5.3(无效性)对于任意,
(1)若有,则均有;
(2)若有,则均有。
即是说,在原生产活动中,单方面的增加投入量或者减少产出量,生产活动总是可能的。
公理5.4(最小性)生产可能集T是满足公理1~4的所有集合的交集。
由n个决策单元()的生产活动所描述的生产可能集,满足公理1~4是唯一确定的。
这个生产可能集可以表示为(5-30)第四节DEA方法
(二)DEA有效性的经济意义用线性规划模型()评价决策单元的DEA有效性,模型()由于,即()满足条件为了清楚起见,考虑不含松弛变量的线性规划模型()(5-31)第四节DEA方法线性规划模型()表示,在生产可能集内,当产出保持不变的情况下,尽量将投入量按同一比例减少,如果投入量不能按同一比例减少,即模型()最优值,在单投入和单产出的情况下,决策单元同时技术有效和规模有效。
如果投入量能按同一比例减少,模型()最优值,决策单元不是技术有效和规模有效。
设模型()的最优解为。
(1)决策单元为DEA有效,其经济意义是决策单元的生产活动()同时为技术有效和规模有效。
2,但至少有某个,或者至少有某个