ImageVerifierCode 换一换
格式:PPT , 页数:49 ,大小:361KB ,
资源ID:2650899      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/2650899.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(第9讲合作博弈论.ppt)为本站会员(b****2)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

第9讲合作博弈论.ppt

1、第第9讲讲 合作博弈合作博弈 一般来说,博弈论可以分为合作博弈(cooperative games)与非合作博弈(non-cooperative games),现代大多经济学家谈到的博弈论往往指的是非合作博弈论,很少提到合作博弈论,甚至很多博弈论教材也未曾提到合作博弈。实际上,合作博弈的出现和研究比非合作博弈要早,早在1881年,Edgeworth在他的数学心理学一书中就已经体现了合作博弈的思想。合作博弈的运用研究主要涉及企业、城市、区域经济以及国家之间的合作等多个方面问题。参考教材参考教材:范如国:范如国:博弈论博弈论,武汉大学出版社,武汉大学出版社,2011 虽然这些分析所针对的合作问题类

2、型不同,研究重点或在于阐明合作的内在逻辑,或在于揭示合作的动因,但是研究结果则有助于加强企业的相互联系、完善城市的合作模式、推动区域经济合作实践、促进国家之间的经济交往。这里,我们首先介绍静态合作的基本概念,然后再介绍各种静态合作博弈的不同解法,包括核心(core)与稳定集(stable sets)、夏普利值(Shapley value)、谈判集(negotiation sets)、内 核(kernel)与 核 仁(nucleolus),最后再举出静态合作在现实的经济方面的各种解法的应用例子。导论导论先回忆一下囚徒困境的例子:在囚徒困境中,还有另外一个策略组合,该组合为参与人带来的支付是。由到

3、,每个参与人的支付都增加了,即得到一个帕累托改进。坦白抵抗坦白-8,-80,-10抵抗-10,0-1,-1 构不成一个均衡是基于参与人的个人理性。在参与人选择抵抗的情况下,每个参与人都有动机偏离这个组合,通过投机行为谋取超额收益1。如果两个参与人在博弈之前,签署了一个协议:两个人都承诺选择抵抗,为保证承诺的实现,参与人双方向第三方支付价值大于1的保证金;如果谁违背了这个协议,则放弃保证金。有了这样一个协议,就称为一个均衡,每个人的收益都得到改善。上述分析表明,通过一个有约束力的协议,原来不能实现通过一个有约束力的协议,原来不能实现的合作方案现在可以实现。这就是合作博弈与非合作博弈的区的合作方案

4、现在可以实现。这就是合作博弈与非合作博弈的区别。别。二者的主要区别在于人们的行为相互作用时,当事人是否达成一个具有约束力的协议。如果有,就是合作博弈;反之,则是非合作博弈。因此,博弈可以划分为合作博弈与非合作博弈。第一节第一节 合作博弈的基本概念合作博弈的基本概念 合作博弈是指参与者能够联合达成一个具有约束力且可强制执行的协议的博弈类型。合作博弈强调的是集体理性,强调效率、公正、公平。合作博弈最重要的两个概念是联盟和分配联盟和分配。每个参与者从联盟中分配的收益正好是各种联盟形式的最大总收益。每个参与者从联盟中分配到的收益不小于单独经营所得收益。合作博弈的基本形式是联盟博弈联盟博弈,它隐含的假设

5、是存在一个在参与者之间可以自由流动的交换媒介(如货币),每个参与者的效用与它是线性相关的。这些博弈被称为“单边支付”博弈,或可转移效用(Transferable Utility,TU)博弈。合作博弈的结果必须是一个帕累托改进,博弈双方的利益都有所增加,或者至少是一方的利益增加,而另一方的利益不受损害。合作博弈研究人们达成合作时如何分配合作得到的收益,即收益分配问题。合作博弈采取的是一种合作的方式,合作之所以能够增进双方的利益,就是因为合作博弈能够产生一种合作剩余。至于合作剩余在博弈各方之间如何分配,取决于博弈各方的力量对比和制度设计。因此,合作剩余的分配既是合作的结果,又是达成合作的条件。合作

6、博弈的核心问题是参与人如何结盟以及核心问题是参与人如何结盟以及如何重新分配结盟的得益如何重新分配结盟的得益。下面首先分析联盟的概念,与联盟相关联的是特征函数。在1950年到1953年间,纳什发表了四篇有关博弈论的重要文献(纳什,1950a,1950b,1951,1953),文献中很清楚地对合作博弈与非合作博弈进行了界定,他所用的界定条件就是博弈者之间是否具有约束力的协议。他认为如果一个博弈当中的博弈者能够作出具有约束力的协议,那么此博弈便是一个合作博弈,反之,则称为一个非合作博弈。根据纳什的这一界定条件,由于合作博弈中存在具有约束力的协议,因此,每位博弈者都能够按自己的利益与其他部分的博弈者组

7、成一个小集团,彼此合作以谋求更大的总支付。我们称这些小集团为联盟(coalition),而由所有博弈者组成的联盟则称为总总联联盟盟(grand coalition)。因此,对有n个局中人参与的博弈,即 ,我们称集合 N 的任何一个子集 S 为一个联盟。定定义义1.1 设博弈的局中人集合为 ,则对于任意 ,我们称 为 的一个联盟(coalition)。这里,允许取 和 两种特殊情况,我们把 称为一个大联盟。若 ,则 中联盟个数为 。正式的合作博弈的定义是以特特征征函函数数(characteristic function form)的 形式给出的,简称博弈的特征性,也称联盟型。定定义义1.2 给定

8、一个有限的参与人集合 ,合作博弈的特征型是有序数对 ,其中特征函数 是从 到实数集 的映射,即 ,且 。是 中的联盟 和 博弈时S的最大效用,称为联盟S的特征函数特征函数(characteristic function),表示联盟中参与人相互合作所能获得的得益(支付)。之所以称为特征函数,是因为这个合作博弈的性质基本由之所以称为特征函数,是因为这个合作博弈的性质基本由 决定。由此可见决定。由此可见 对合作博弈的重要性对合作博弈的重要性。特征函数是研究联盟博弈的基础,确定特征函数的过程实际上就是一个建立合作博弈的过程。在合作博弈中,支付可能是收益,也可能是成本(负效应)。如果这总得益是可以被瓜分

9、的,我们则称它为可转移的(transferable);反之,则称为不可转移的(non-transferable)。合作对策的分类主要是根据特征函数的性质。合作对策的分类主要是根据特征函数的性质。下面根据特征函数的性质介绍几类特殊的合作对策。1.如果 仅与 的个数有关,则 称作对称博弈。2如果 ,则 称作常和博弈。3如果 ,则 称作简单博弈。例如在投票博弈中,每个参与人的权重 ,如果 ,则 称作凸博弈。定定义义1.3 一个支付可转移的联盟型博弈是由一个有限的博弈者集合 和一个定义在集合 的函数 所组成的,而这函数 对集合 当中的每一个可能的非空子集 都会进行赋值,其值为一个实数,我们用 来表示合

10、作博弈,而函数为每一个集合所赋的值则称为S的联盟值。函数 对集合 当中的每一个可能的非空子集 都会进行赋值,其值为一个实数,我们用 来表示一个合作博弈,而函数为每一个集合所赋的值则称为S的联盟值。为了确保每位博弈者都愿意组成总联盟,合作博弈论一般要求支付可转移的联盟型博弈为有结合力的有结合力的:定定义义1.4 一个支付可以转移的联盟型博弈 是有结合力的,当且仅当,对于集合 的每个分割物,即 ,且 ,以下的关系式都成立:根据上述定义,我们可以得知,在一个具有结合力的支付可转移的联盟型博弈中,如果我们把总联盟 分成 个不相交的小联盟,那么,这 个小联盟的得益的总数是绝不会大于总联盟的得益。由于这些

11、博弈中的支付都是可转移的,因此,总联盟型的情况必定是帕累托最优的。在很多情况下,为了使得每位博弈者有更大的意欲组成总联盟,合作博弈论更会要求博弈具有可超加性或是超可加的:定定义义1.5 在一个支付可转移的联盟型博弈 中,如果对于任意的 ,且 ,有 ,那么,我们称该合作博弈 是超超可可加加的的;如果对于任意的 ,且 ,有 ,那么,我们称该合作博弈 是次次可可加加的的;如果对于任意的 ,且 ,有 ,那么,我们称该合作博弈 是可加的可加的。定义定义1.6 在合作博弈 中,若对于任意的 ,满足以下条件:则称特征函数 具有凸性,相对应的博弈称为凸博弈凸博弈。从上述定义中可以看出,参参与与人人对对某某个个

12、联联盟盟的的边边际际贡贡献献随随着着联联盟盟规规模模的的扩扩大大而而增增加加。也就是说,在凸博弈中,合作是规模报酬递增的。显然,特征函数满足凸性的一定满足超可加性。特征函数的凸性表示联盟越大,新成员的实际贡献就越大。上式说明,特征函数只有满足超可加性,才有形成新联盟的必要性。否则,如果一个合作博弈的特征函数不满足超可加性,那么,其成员没有动机形成联盟,已经形成的联盟将面临解散的威胁。上式定义的逆命题也是正确的,即:是一个集合,是定义在 上的一个非负实值函数。满足:,如果 则存在一个 上的合作博弈,使 成为该合作博弈的特征函数。对于合作博弈 ,特征函数 满足超加性,自然有:根据上述不等式,特征函

13、数 分成两种类型:类型类型1 1,满足 。即大联盟的效用是每个参与人的效用之和。这说明通过联盟并没有创造新的合作剩余,联盟没有价值,这种联盟也不可能维持。这种对策称为非实质性对策,没有研究价值,不是本章研究的范畴。对于非实质性对策,有 ,如果。类型类型2 2,满足 。即大联盟的效用大于每个参与人的效用之和。这说明通过联盟创造了新的合作剩余,联盟有意义,这种联盟能否维持,取决于如何分配合作剩余,使每个参与人的支付都有改善。这种对策称为实质性对策。定定义义1.7 一个合作博弈 ,若特征函数满足下面的两个条件:则称该博弈为 标准化博弈。标准化博弈主要是为了简化证明过程而假设的,他们要求单个参与人不会

14、产生任何得益,而大联盟所产生的得益标准化为1。例例.假设有五个人A、B、C、D、E,决定合资建厂。每个人或是以人力资本投资,或是以资金投资。经过认真的可行性研究,建成后的合资公司年利润为100单位(单位:10000美元)。现在的问题是如何将这100单位的利润在五个人中合理地分摊?对于这个问题,从表面上来看将总利润进行平均分配(即每人20单位)似乎是一个合理的分配方案。但通过进一步的分析表明,如果D和和E单独单独组建联盟进行合作建厂,其年利润为45单位,大于D和E在大联盟(即五个人合作建厂)所分配到的40单位。同样,A、B、C发现发现,如果他们三人单独建厂,只能实现年利润25单位。这样,A、B、

15、C自然希望D和E留在大联盟中。因此,他们决定分给D和E 46单位,而把剩下的54单位在A、B、C三人中平衡。显然,这样还是不行,因为C、D、E发现他们三人单独建厂的年利润为70单位,大于在大联盟中得到的64单位(46+18),而A、B没有足够的资金自行建厂。因此,A和B不得不分给C、D、E 71单位,而把剩下的29单位在A和B中平分。如果C、D、E将71单位利润平分的话,又会产生另一个问题。由于B、D、E三人合作建厂的年利润为65单位,就使得刚才那个分配又变得不可行。那么,它们该怎么办呢?为了简单起见,我们将此博弈的特征函数形式列在表1中。该表列出了每个可能的联盟可能获得的总利润。101,52

16、01,2,4353,4,570202,3151,2,5401,2,3,460302,4251,3,4401,2,3,565452,5301,3,5451,2,4,5755103,4301,4,5551,3,4,5801,203,5352,3,4502,3,4,5901,354,5452,3,5551,2,3,4,51001,4151,2,3252,4,5650表表1:各合作方案下联盟获得的总利润各合作方案下联盟获得的总利润 通过观察表1,我们就会发现,当任意两个联盟的交集为空集的时候,这两个联盟中的所有参与人组成的新联盟的总利润总是不小于原先的两个联盟的利润之和。因此,这种博弈就是前面我们所讨论的超可加博弈。第二节第二节 核心与稳定集核心与稳定集 下面,我们将首先介绍个体理性和整体理性,然后再分别介绍合作博弈的两个解法概念-核心和稳定集核心和稳定集。一、个体理性和整体理性一、个体理性和整体理性 当一个博弈具有超可加性,那么便只有组成总联盟才能最优化所有博弈者的总得益。在一个支付可转移的联盟型博弈中,我们可以用一个支付向量 来代表瓜分这总得益的方案,而这向量当中的 则是博弈者 组成联盟后

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1