1、什么是博弈论?n在在人人世世间间,人人与与人人之之间间的的对对抗抗和和较较量量是是一一个个不不容容回回避避的的话话题题,只只有有直直面面这这个个话话题题,个个人才更有可能获得成功的机会;人才更有可能获得成功的机会;n人人们们试试图图获获得得成成功功,就就有有必必要要研研究究对对抗抗局局势势中如何策略性地选择自己的行动;中如何策略性地选择自己的行动;n专专门门研研究究互互动动局局势势下下人人们们的的策策略略行行为为的的学学问问叫叫“博弈论博弈论(game theory)”理性人在最大化自己的偏好时,需要相互合作,而合作中又有冲突人类为达到合作和解决冲突所发明的重要制度之一人类为达到合作和解决冲突
2、所发明的重要制度之一n 价格制度价格制度n 市场参与者的数量足够多,从而市场是竞争性的市场参与者的数量足够多,从而市场是竞争性的n 参与者之间不存在信息不对称问题参与者之间不存在信息不对称问题传统的新古典经济学就是以价格为研究对象的,故传统的新古典经济学就是以价格为研究对象的,故又称为价格理论。其基本假设:又称为价格理论。其基本假设:传统经济学的假设及其局限性n 一一般般均均衡衡理理论论是是整整个个经经济济学学的的理理论论基基石石和和道道义义基基础础,市市场场机机制制是是完完美美的的,帕帕累累托托最优最优成立,平等与效率可以兼顾。成立,平等与效率可以兼顾。n 个个人人决决策策是是在在给给定定一
3、一个个价价格格参参数数和和收收入入的的条条件件下下最最大大化化自自己己的的效效用用,个个人人的的效效用用与与其其他他人人无无涉涉,所所有有其其他他人人的的行行为为都都被被总总结结在在“价价格格”参数之中参数之中n 基本假设:完全竞争,完美信息基本假设:完全竞争,完美信息然而在以下情况,上述结论不成立:n非完全竞争:非完全竞争:垄断越来越普遍垄断越来越普遍n外部性:外部性:市场不可能把所有的成本收益都计算在内市场不可能把所有的成本收益都计算在内n公共产品:公共产品:市场无法解决市场无法解决“搭便车搭便车”问题问题n逆向选择问题:逆向选择问题:柠檬市场,二手车市场柠檬市场,二手车市场n道德风险问题
4、:道德风险问题:为什么市场的交易费用比较高?为什么市场的交易费用比较高?传统经济学假设的局限性:传统经济学假设的局限性:n 交易主体的数量其实很有限;交易主体的数量其实很有限;n 信息是不对称的;信息是不对称的;百年来,经济学的主要发展围绕以上五方面展开百年来,经济学的主要发展围绕以上五方面展开研究,建立起研究,建立起r 垄断竞争理论垄断竞争理论r 产业组织理论产业组织理论r 企业理论企业理论r 信息经济学信息经济学r 新制度经济学新制度经济学r 不确定下的决策(投资理论)不确定下的决策(投资理论)n 博弈论逐渐成为经济学的基石 博弈论对经济学的影响r博弈论改写经济学,从放宽新古典的完全竞争和
5、完全信息两个条博弈论改写经济学,从放宽新古典的完全竞争和完全信息两个条件展开件展开r国外经济学教科书改写,加入大量博弈论内容国外经济学教科书改写,加入大量博弈论内容r博弈论进入主流经济学,反映了:博弈论进入主流经济学,反映了:r经济学的研究对象越来越转向个体放弃了有些没有微观基础的假设经济学的研究对象越来越转向个体放弃了有些没有微观基础的假设r经济学的研究对象越来越转向人与人之间行为的相互影响和作用经济学的研究对象越来越转向人与人之间行为的相互影响和作用r经济学越来越重视对信息的研究经济学越来越重视对信息的研究r传统微观经济学的工具是数学传统微观经济学的工具是数学(微积分、线性代数、统计学微积
6、分、线性代数、统计学),而,而博弈论是一种新的数学。以前只有陆军,现在有了空军,其差异博弈论是一种新的数学。以前只有陆军,现在有了空军,其差异不可以公里计。不可以公里计。二、博弈论的发展概述n 博博弈弈是是决决策策主主体体在在互互相相对对抗抗中中,对对抗抗双双方方(或或多多方方)互互相相依依存存的的一一系系列列策策略略和行动的过程集合。和行动的过程集合。n 博博弈弈论论:专专门门研研究究博博弈弈如如何何出出现现均均衡衡的规律的学问。的规律的学问。-博弈论的基本内容博弈论的基本内容非合作博弈非合作博弈合作博弈合作博弈 博弈论的分类及相应的均衡 博弈三要素:博弈三要素:u 参与人(参与人(play
7、erplayer)u 行动(行动(actionaction)或)或策略(策略(strategystrategy)u 支付(支付(payoffpayoff)-其的起点是参与人其的起点是参与人的战略集合和对有关的战略集合和对有关结局的偏好结局的偏好-其起点是一组潜在其起点是一组潜在的约束性协议和参与的约束性协议和参与人对它们的偏好人对它们的偏好信息、战略、结果信息、战略、结果 博弈行动顺行动顺序序信息信息静静 态态动动 态态完全信息完全信息纳什均衡纳什均衡(纳什纳什)子博弈精练纳什均衡子博弈精练纳什均衡(泽尔腾泽尔腾)不完全信息不完全信息贝叶斯纳什均衡贝叶斯纳什均衡(海萨尼海萨尼)精练叶贝斯纳什均
8、衡精练叶贝斯纳什均衡(泽尔腾等泽尔腾等)动态博弈动态博弈静态博弈静态博弈参与人的参与人的行动顺序行动顺序参与人对其他参与人对其他参与人的了解参与人的了解不完全信不完全信息博弈息博弈完全信息完全信息博弈博弈博弈的分类 合作博弈合作博弈非合作博弈非合作博弈根据参与人是否合作根据参与人是否合作零和博弈零和博弈常和博弈常和博弈变和博弈变和博弈根据博弈结果根据博弈结果根据行动的先后次序根据行动的先后次序静态博弈静态博弈动态博弈动态博弈完全信息博弈完全信息博弈根据参与人对其他参与人的根据参与人对其他参与人的各种特征信息的获得差异各种特征信息的获得差异不完全信息博弈不完全信息博弈两人博弈两人博弈多人博弈多人
9、博弈根据参与人的多少根据参与人的多少-博弈论的产生与发展r 1838 1838年,奥古斯特年,奥古斯特.古诺提出古诺模型;古诺提出古诺模型;r 在在2020世世纪纪初初,泽泽美美劳劳(Zermelo)(Zermelo)、鲍鲍莱莱尔尔(Borel)(Borel)和和约约翰翰.冯冯.诺诺伊伊曼曼等等数数学学家家就就已已经经开开始研究博弈的数理基础。始研究博弈的数理基础。r 约约翰翰.冯冯.诺诺伊伊曼曼和和奥奥斯斯卡卡.摩摩根根斯斯坦坦的的题题为为博博弈弈论论与与经经济济行行为为(1944(1944年年)的的经经典典巨巨著著奠定了在经济学中应用博弈论的基础。奠定了在经济学中应用博弈论的基础。一、一、
10、完全信息静态博弈完全信息静态博弈 定定义义:博博弈弈各各方方同同时时决决策策且且彼彼此此对对各各种种策策略略组组合合情情况况下下所所有有参参与与人人相相应应的的得得益益都都完完全全了了解。解。表表达达:在在博博弈弈论论中中,一一个个博博弈弈可可以以用用两两种种不同的方式来表达:不同的方式来表达:-策略式表述:适合于静态博弈(矩阵式)策略式表述:适合于静态博弈(矩阵式)-扩展式表述:适合于讨论动态博弈(树状结构)扩展式表述:适合于讨论动态博弈(树状结构)博弈论模型博弈论模型 一个博弈需要有五方面内容组成:一个博弈需要有五方面内容组成:参与人参与人策略策略支付支付信息信息均衡均衡博弈要素博弈要素均
11、衡均衡 博弈的参与人集合:博弈的参与人集合:ii,=(1,2,=(1,2,,n)n);每个参与人的战略空间:每个参与人的战略空间:S Si i(i i1,2,3,n1,2,3,n););每个参与人的得益函数:每个参与人的得益函数:u ui i(s(s1 1,s,sn n),(,(i i1,2,3,1,2,3,,n n)用用G GS S1 1,S Sn n;u u1 1,,u un n代表博弈的战略式表述代表博弈的战略式表述.博弈的策略式表述博弈的策略式表述囚徒困境囚徒困境 囚徒囚徒B囚徒囚徒A 坦白坦白 抵赖抵赖坦白坦白抵赖抵赖8,80,1010,01,1n 每个参与人的得益函数:每个参与人的
12、得益函数:n 博弈的参与人集合:博弈的参与人集合:=(A=(A,B)B);n 每个参与人的战略空间:每个参与人的战略空间:S SA A=(坦白,抵赖坦白,抵赖)S SB B=(坦白,抵赖坦白,抵赖)u uA A(坦白,坦白坦白,坦白)=u)=uB B(坦白,坦白坦白,坦白)=-8)=-8u uA A(抵赖,抵赖抵赖,抵赖)=u)=uB B(抵赖,抵赖抵赖,抵赖)=-1)=-1u uA A(坦白,抵赖坦白,抵赖)=u)=uB B(坦白,抵赖坦白,抵赖)=0)=0u uA A(抵赖,坦白抵赖,坦白)=u)=uB B(抵赖,坦白抵赖,坦白)=-10)=-10 占占优优策策略略:一一些些特特殊殊的的博
13、博弈弈中中,一一个个参参与与人人的的最最优优策策略略可可以以不不依依赖赖于于其其他他参参与与人人的的策策略略选选择择,就就是是说说,不不论论其其他他参参与与人人选选择择什什么么策策略略,他他的的最最优优策策略略是是唯唯一一的的,这这样样的的最最优优策策略略被称为被称为“占优策略占优策略”。劣劣策策略略:如如果果一一个个博博弈弈中中,某某个个参参与与人人有有占占优优策策略略,那那么么该参与人的其他可选择策略就被称为该参与人的其他可选择策略就被称为“劣策略劣策略”。二、占优策略均衡二、占优策略均衡n 在在这这个个例例子子里里,无无论论对对方方如如何何选选择择,每每个个人人的的最最优优选选择择:坦白
14、;坦白;n 可以预测,结果将是(坦白,坦白)可以预测,结果将是(坦白,坦白)占占优优均均衡衡:由由所所有有参参与与人人的的占占优优策策略略构构成成的的战战略略组合。组合。占占优优战战略略均均衡衡的的出出现现只只要要求求由由所所有有参参与与人人都都是是理理性性的的,但但不不要要求求每每个个参参与与人人知知道道其其他他参参与与人人是是否否理理性。性。“囚囚囚囚徒徒徒徒困困困困境境境境”博博博博弈弈弈弈有有有有占占占占优优优优均均均均衡衡衡衡,所所所所以以以以其其其其结结结结果果果果很很很很容容容容易预测。易预测。易预测。易预测。占优策略均衡占优策略均衡“囚徒困境囚徒困境”的一般表示的一般表示 参与
15、人参与人B参与人参与人A 合作合作 不合作不合作合作合作不合作不合作T,TS,RR,SP,P 满足:满足:满足:满足:n R RT TP PS S;n S SR RT TT T三、用法律解决三、用法律解决“囚徒困境囚徒困境”满足:满足:XRT 参与人参与人B参与人参与人A 合作合作 不合作不合作合作合作不合作不合作T,TS,RXRX,SP,P四、重复剔除的占优均衡四、重复剔除的占优均衡找找出出某某个个参参与与人人的的严严格格劣劣策策略略(假假定定其其存存在在),把把这这个个劣劣策策略剔除掉;略剔除掉;重新构造一个不包含已剔除策略的新的博弈;重新构造一个不包含已剔除策略的新的博弈;重复这个过程,
16、一直到只剩下一个重复这个过程,一直到只剩下一个唯一唯一的策略组合为止。的策略组合为止。这这个个唯唯一一剩剩下下的的策策略略组组合合就就是是这这个个博博弈弈的的均均衡衡解解,称称为为“重复剔除的占优均衡重复剔除的占优均衡”。注意,上述表述中强调了注意,上述表述中强调了“唯一唯一”这个词。也就这个词。也就是说,如果重复剔除后剩下的策略组合不唯一,那么是说,如果重复剔除后剩下的策略组合不唯一,那么该博弈就不是可通过重复剔除劣策略求解的。该博弈就不是可通过重复剔除劣策略求解的。思路:思路:理性共识理性共识0-阶阶理理性性共共识识:每每个个人人都都是是理理性性的的,但但不不知知道道其其他人是否是理性的;他人是否是理性的;1-阶阶理理性性共共识识:每每个个人人都都是是理理性性的的,并并且且知知道道其其他他人人也也是是理理性性的的,但但不不知知道道其其他他人人是是否否知知道道自自己己是理性的;是理性的;2-阶阶理理性性共共识识:每每个个人人都都是是理理性性的的,并并且且知知道道其其他他人人也也是是理理性性的的,同同时时知知道道其其他他人人也也知知道道自自己己是是理理性性的的;但但不不知知道道其其他他
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1