博弈论基础PPT文档格式.pptx

资源描述

博弈论基础PPT文档格式.pptx

《博弈论基础PPT文档格式.pptx》由会员分享，可在线阅读，更多相关《博弈论基础PPT文档格式.pptx（42页珍藏版）》请在冰豆网上搜索。

博弈论基础PPT文档格式.pptx

图2.保罗萨缪尔森博弈论学者Kandori（神取道宏）俏皮地作了引申：

现在这只鹦鹉需要再学习一个词，那就是“纳什均衡”。

由此可见博弈论在现代经济学中的重要地位、作用和影响。

技术与研发中心2022/11/104/41博弈论的应用国际政治军事外交金融经济团队管理计算机科学生物工程图3.博弈论的应用技术与研发中心2022/11/105/41嫌犯嫌犯1的的选择嫌犯嫌犯2的的选择供供认抵抵赖供认（-8，-8）（0，-10）抵赖（-10，0）（-1，-1）囚徒困境（theprisonersdilemma）p警察抓住两个犯罪嫌疑人，但没有确凿的证据指控其有罪，将两人分别带入不同的房间进行审讯。

如果双方都抵赖，则各判刑1年；

若有一方抵赖，另一方供认犯罪事实，则抵赖的嫌疑人判刑10年，承认的嫌疑人将被释放；

若双方都承认，则分别判刑8年。

表1.囚徒困境如果嫌犯1供认的话，对于嫌犯2，供认显示是很好的选择如果嫌犯1抵赖的话，对于嫌犯2，最佳选择任然是供认考虑对手的情况下对于嫌犯2，无论嫌犯1怎么选择，他的最佳策略都是供认供认。

反之，对于嫌犯1而言也是如此。

最后的情况两个嫌犯都选择供认。

他们都得不到最优的结果（-1,-1），即囚徒困境囚徒困境。

技术与研发中心2022/11/106/41现实中的囚徒困境价格大战公共产品的供给军备竞赛做广告围观时踮脚尖应试教育环境污染。

1968年，格雷特哈丁成功地将“囚徒困境”与资源耗竭结合起来,揭示了生态环境问题与囚徒困境的相似之处。

贸易自由与壁垒，地方保护主义技术与研发中心2022/11/107/41博弈的构成p博弈论：

博弈论：

研究多个决策主体的行为发生相互作用时候的决策以及这种决策的均衡问题。

p博弈论简史：

博弈论简史：

博弈论现代分析起源于冯诺伊曼和摩根斯坦恩在1944年出版了博弈论与经济行为一书。

约翰纳什所提出的纳什均衡（NashEquilibrium,NE）使得非合作博弈理论的研究有了巨大地飞跃。

纯粹理性人技术与研发中心2022/11/108/41博弈的结果p占优战略占优战略:

不管对手采取的策略是什么，该玩家的这个策略都是自己的最佳战略。

玩家玩家1玩家玩家2左左中中右右上1,01,20,1下0,30,12,0玩家玩家1玩家玩家2左左中中上1,01,2下0,30,1右严格劣于中表2-1.重复剔除严格劣战略p重复剔除严格劣重复剔除严格劣战略战略技术与研发中心2022/11/109/41博弈的结果p重复重复剔除严格劣剔除严格劣战略战略玩家玩家1玩家玩家2左左中中上1,01,2下0,30,1下严格劣于上玩家玩家1玩家玩家2左左中中上1,01,2左严格劣于中玩家玩家1玩家玩家2中中上1,2表2-2.重复剔除严格劣战略技术与研发中心2022/11/1010/41智猪博弈p猪圈里有两头猪，一头大猪，一头小猪。

猪圈的一边有个踏板，每踩一下踏板，在远离踏板的猪圈的另一边的投食口就会落下少量的食物。

如果有一只猪去踩踏板，另一只猪就有机会抢先吃到另一边落下的食物。

那么，两只猪各会采取什么策略？

小猪小猪大猪大猪踩不不踩踩（4，2）（3，5）不踩（10，-2）（0，0）表3-1.智猪博弈搭便车效应小猪舒舒服服地等在食槽边大猪不知疲倦地奔忙于踏板和食槽之间技术与研发中心2022/11/1011/41智猪博弈p改进策略一：

投食仅原来的一半分量投食仅原来的一半分量小猪小猪大猪大猪踩不不踩踩（0.5，0.5）（-2，5）不踩（5，-2）（0，0）表3-2.智猪博弈p结果结果囚徒困境小猪不踩大猪不踩p改进策略二：

投投食原来的两倍分量食原来的两倍分量小猪小猪大猪大猪踩不不踩踩（8，3）（8，5）不踩（10，3）（0，0）表3-3.智猪博弈p结果结果竞争意识不强的共产社会小猪和大猪都有可能踩技术与研发中心2022/11/1012/41智猪博弈p改进策略三：

投投食仅原来的一半分量，食仅原来的一半分量，但同时将投食口移到踏板但同时将投食口移到踏板附近。

附近。

小猪小猪大猪大猪（0.5，0.5）踩不不踩踩（0.5，0.5）（3，0）不踩（0，3）（0，0）表3-4.智猪博弈p结果结果等待者不得食，而多劳者多得小大猪都抢着踩p智猪博弈的现实意义：

智猪博弈的现实意义：

大企业和小企业的竞争；

股市散户跟随大户；

技术与研发中心2022/11/1013/41博弈论的价值p博弈论的价值：

博弈论的价值：

分析事物的内在逻辑规律，指导采取正确的策略；

小企业经营中，学会如何“搭便车”，让其他大的企业首先开发市场。

制定合理的规则，使得结果朝预期方向发展。

博弈论的价值解释预测启迪建议博弈科学博弈工程图4.博弈论的价值技术与研发中心2022/11/1014/41纳什均衡p纳什均衡的存在性纳什均衡的存在性玩家玩家1玩家玩家2正面正面反面反面正面（-1，1）（1，-1）反面（1，-1）（-1，1）p纳纳什什均衡的多重性均衡的多重性表4.猜硬币博弈女朋友女朋友你你世界杯电视剧世界杯（2，1）（0，0）电视剧（0，0）（1，2）表5.性别博弈技术与研发中心2022/11/1015/41混合战略p考虑对手选择策略上的概率性考虑对手选择策略上的概率性假设女朋友以q的概率选择看世界杯。

女朋友女朋友你你世界杯（q）电视剧（1-q）世界杯（2，1）（0，0）电视剧（0，0）（1，2）表5-1.性别博弈图5.性别博弈-男方收益图（1/3,2/3）p纯战略纯战略参与人在每一个给定信息的情况下只选择一个特定的行动。

p混合战略混合战略参与人在每一个给定信息的情况下以某种概率分布随机地选择不同的行动。

技术与研发中心2022/11/1016/41混合战略p如果女朋友同样精明的话如果女朋友同样精明的话假设男方以r的概率选择看世界杯。

图6性别博弈-女方收益图（2/3,2/3）女朋友女朋友你你世界杯（q）电视剧（1-q）世界杯（r）（2，1）（0，0）电视剧（1-r）（0，0）（1，2）表5-2.性别博弈技术与研发中心2022/11/1017/41混合战略p性别博弈中的混合战略性别博弈中的混合战略（r，1-r）为男方的混合战略。

（1/3，2/3）为男方的一个混合战略。

（q，1-q）为女方的混合战略。

（2/3，1/3）为女方的一个混合战略。

混合战略（1/3，2/3）,（2/3，1/3）为原博弈的一个纳什均衡。

1/32/311（电视剧）（世界杯）（电视剧）（世界杯）qr（），男方混合战略（），女方混合战略图7.性别博弈-混合战略图技术与研发中心2022/11/1018/41补充-古诺双头垄断模型企业1的收益函数：

企业2的收益函数：

p同理对于企业2，p为使每个企业获得最大利益，为纳什均衡时的解。

为使每个企业都获得最大的效益。

结果：

技术与研发中心2022/11/1019/41博弈的分类图8.博弈的分类p静态博弈静态博弈：

所有博弈方同时选择策略行动。

p动态博弈：

动态博弈：

决策行动有先后，后行动者行动之前可以观察到先行动者的行动。

p完全信息：

完全信息：

所有参与者的收益函数是共同的知识。

p完美信息：

完美信息：

动态博弈中，所有参与者的行动顺序以及行动之前前面所有行动，都是共同知识。

技术与研发中心2022/11/1020/41博弈的拓展式表述12坦白抵赖坦白抵赖坦白抵赖（-8,-8）（0，-10）（-10,0）（-1,-1）2图9.囚徒困境博弈的扩展式表述技术与研发中心2022/11/1021/41动态博弈p仿冒者与被仿冒者博弈仿冒者与被仿冒者博弈对于仿冒者A期望结果为（10，4）此时决策（仿冒，不制止不制止不制止不制止，仿冒，不制止不制止不制止不制止）对于被仿冒者B最好决策（仿冒仿冒仿冒仿冒，制止）结果为（-2，6）ABBA不制止制止（-2，6）（2，2）（10，4）（5，5）不仿冒（0，10）仿冒不制止制止仿冒不仿冒图10-1.仿冒者与被仿冒者博弈技术与研发中心2022/11/1022/41动态博弈可信性问题p可信性：

动态博弈中，先行动的参与者是否相信后行动参与者会采取对自己有利或不利的行动可信性：

动态博弈中，先行动的参与者是否相信后行动参与者会采取对自己有利或不利的行动。

许诺：

后行动者将来会采取对先行动者有利的行动。

威胁：

后行动者将来会采取对先行动者不利的行动。

进入者进入不进入（0，300）在位者合作（40，50）斗争（-10，0）图11.市场进入阻挠博弈树不可置信威胁剔除博弈中包含的不可置信威胁。

技术与研发中心2022/11/1023/41完全信息动态博弈ABBA不制止制止（-2，6）（2，2）（10，4）（5，5）不仿冒（0，10）仿冒不制止制止仿冒不仿冒图10-2.仿冒者与被仿冒者博弈（10,4）p子博弈子博弈：

由一个动态博弈第一阶段以外的某阶段开始的后续博弈阶段构成的，有初始信息集和进行博弈所需要的全部信息，能够自成一个博弈的原博弈的一部分。

（10,4）（-2,6）（0,10）p逆向归纳法逆向归纳法：

从动态博弈的最后一个阶段博弈方的行为开始分析，逐步倒推回前一个阶段相应博弈方的行为选择，一直到第一个阶段的分析方法。

技术与研发中心2022/11/1024/41海盗分金p一天，5个海盗得到100个金币，他们依次提出一个方案，如果有一半以上一半以上的人同意就通过，如果没有通过则提议的人就被丢到海里喂鲨鱼，再继续分金。

海盗首先希望生存，然后希望获得最大利益，并且乐意看到其他海盗被扔入大海喂鲨鱼，每个海盗都是绝顶聪明且很理智，假如你是第一个海盗你会怎么提议方案？

54321（0,0,0,0,100）投票：

投票：

提案：

（p5）（0,0,0,100,0）（p4,p5）（0,0,100,0,0）（p3,p4,p5）（0,98,0,1,1）（p2,p3,p4,p5）（p1,p2,p3,p4,p5）（97,0,1,2,0）（p1,p2,p3,p4,p5）（97,0,1,0,2）技术与研发中心2022/11/1025/41斯塔克尔贝里双头垄断模型企业2的收益函数：

技术与研发中心2022/11/1026/41重复博弈（repeatedgame）p概念：

概念：

基本博弈（完全信息静态博弈，完全信息动态博弈）至少重复两次，并且先前的博弈结果可以被观测到。

每次博弈被称为“阶段博弈”（stagegame）。

p收益收益：

重复博弈总收益重复博弈总收益=各阶段博弈方各次重复得益的总和；

考虑资金的时间价值，增加各阶段贴现系数：

重复重复T期的重复博弈总期的重复博弈总得益得益：

p重复博弈与合作：

重复博弈与合作：

一次性囚徒困境：

只考虑眼前利益重复博弈：

合作可能是最好的选择技术与研发中心2022/11/1027/41重复博弈p重复博弈的策略空间：

重复博弈的策略空间：

重复博弈之所以会导致合作，是因为改变了局中人的策略空间一次性博弈：

合作，不合作两阶段博弈：

合作，

展开阅读全文