博弈论基础复习111上课讲义Word文件下载.docx
《博弈论基础复习111上课讲义Word文件下载.docx》由会员分享,可在线阅读,更多相关《博弈论基础复习111上课讲义Word文件下载.docx(7页珍藏版)》请在冰豆网上搜索。
每个局中人从各种策略组合中获得的收益,由于它是参与人策略组合的函数,又称为支付函数
每个参与人的支付函数记为ui(s)=ui(s1,s2,…,sn),si∈Si
(5)Nash均衡
在博弈G={S1,S2,…,Sn;
u1,u2,…,un}中,如果策略组合s*=(s1*,s2*,…,sn*)满足对每一参与者i,si*是他针对其他参与者所选策略s-i*=(s1*,s2*,…si-1*,si+1*,…,sn*)的最优反应策略,则称策略组合s*=(s1*,s2*,…,sn*)为该博弈的一个纳什均衡。
即:
ui(si*,s-i*)≥ui(si,s-i*), si∈Si
纳什均衡是一种相对稳定状态,没有参与者有动机独自偏离纳什均衡下的策略选择。
2.分析两人两策略博弈构成囚徒困境博弈应满足的条件。
囚徒困境博弈说明了什么问题?
合作
背叛
R,R
S,T
T,S
P,P
条件:
(1)T>
R>
P>
S
(2) 2R>
T+S或2R>
2P
囚徒困境反映个人最佳选择并非团体最佳选择,说明个人利益与社会利益的冲突。
3.描述双人策略型博弈的纯策略和混合策略。
(1)纯策略:
参与人i的策略集(纯策略空间)为Si,i∈I
策略组合:
策略组合空间:
(2)混合策略
混合策略:
若参与人i有K个纯策略:
Si={si1,…,siK},则概率分布i=(i1,…,iK)称为i的一个混合策略,这里ik=(sik)是i选择sik的概率,对于所有的k=1,2,…,K,0≤ik≤1,∑kik=1。
纯策略为混合策略的一个特例。
混合策略空间:
参与人i的所有混合策略的集合,记为i
混合策略组合空间:
=×
ii
4.简要分析扩展型博弈(博弈树)的构成要素。
博弈树的基本元素有:
(1)节点:
x∈X,又称决策结,简称“结”
(2)枝:
连结结点的连线
(3)信息集:
一些节点的集合。
在同一信息集中,局中人面临完全相同的决策形势。
(4)结:
包括:
①初始结:
博弈的起点。
②决策结:
参与人采取行动的时点。
③终点结:
博弈行动路径的终点。
5.什么是子博弈和子博弈精炼(完美)纳什均衡?
什么是完美信息博弈?
简析完美信息博弈中逆向归纳法的求解思路。
(1)子博弈:
一个扩展式博弈的子博弈G由一个决策结x和所有该决策结的后续结T(x)(包括终点结)组成,它满足:
①x是一个单结信息集,即h(x)={x};
②对于所有的x’∈T(x),如果x’∈h(x’),则x’∈T(x)。
条件①是指子博弈必须从一个单结信息集开始;
条件②说明子博弈的信息集和支付向量直接承自原博弈。
这意味着子博弈不能切割原博弈的信息集。
同时,任何博弈是它自身的子博弈。
(2)子博弈精炼Nash均衡
子博弈精炼(完美)纳什均衡:
扩展式博弈的策略组合s*=(s1*,s2*,…,sn*)是一个子博弈精炼纳什均衡,如果:
①它是原博弈的纳什均衡;
②它在每一个子博弈上给出纳什均衡。
(3)完美信息博弈:
一个博弈的所有信息集都是单结的。
(4)完美信息博弈中逆向归纳法的求解思路:
(画图解释好)
假设只有两个阶段(参与人2在观察到参与人1的行动后再行动),当博弈进入第二阶段时,给定参与人1的选择a1∈A1,则参与人2的决策是使:
u2(a1,a2)
我们用a2*=R2(a1)代表上述最优化问题的解(参与人2的反应函数)。
由于参与人1知道参与人2在第二阶段的决策规则,参与人1在第一阶段的决策是:
u1(a1,R2(a1))
设其解为a1*,则该博弈的子博弈精炼纳什均衡是(a1*,R2(a1)),均衡结果为(a1*,R2(a1*))。
6.理解完全信息动态博弈下的纯策略和行动。
行动与策略
(1)行动:
是参与人在博弈的某个时点(某个信息集)的决策变量。
行动组合:
参与人的行动的有序集。
(2)策略:
是参与人在给定信息集情况下的行动规则,它规定参与人在什么时候选择什么行动。
在静态博弈中,策略和行动是等价的。
在动态博弈中,策略在给定信息集下完整的行动方案,与行动是不同的。
7.什么是冷酷(触发)策略?
谈谈你对重复博弈中冷酷策略的理解。
(1)触发策略:
如果一方采取不合作的策略另一方随即也采取不合作策略并且永远采取不合作策略。
8.描述双人不完全信息静态博弈的结构,并给出相应的静态贝叶斯均衡。
博弈论中对不完全信息是通过类型来处理的,对此,你是如何理解的?
(1)n人静态贝叶斯博弈的策略式表述G={A1,…,An;
p1,…,pn;
u1,…,un}包括:
(补充符号)P23
①参与人的类型空间:
1,…,n
②条件概率:
p1,…,pn
③类型依存支付函数:
ui(a1,…,an;
i)
④参与人i知道自己的类型ii,条件概率pi描述给定自己属于i的情况下,参与人i有关其他参与人类型-i-i的不确定性,ai(i)Ai(i)表示参与人i的类型为i时所选择的行动(即参与人的行动是类型依存的)。
贝叶斯纳什均衡:
n人不完全信息静态博弈G={A1,…,An;
u1,…,un}的纯策略贝叶斯纳什均衡是一个类型依存策略组合a*=(ai*(i)),i=1,2,…,n。
其中,ai*(i)满足:
(自己补充)
(2)①一般地,将一个参与人所拥有的所有私人信息称为他的类型。
②由于大多数博弈中,参与人的特征由支付函数完全确定,因而一般将参与人的支付函数等同于他的类型。
③通常假定,参与人i只知道自己的类型,并且知道其他局中人的类型分别为若干种可能类型中的一种,但不知道具体是哪一种,但他知道其他参与人类型的概率分布。
④通过引入“自然”这一虚拟局中人,将不完全信息博弈转换为不完美信息博弈。
⑤所有局中人的实际类型均来自于由“自然”根据类型上的联合概率分布进行的一种初始抽彩,局中人根据这种抽彩决定自己对其他局中人类型的主观判断,由此进行实际博弈。
9.什么是后续博弈?
简要分析完美贝叶斯均衡与后续博弈的关系。
(1)后续博弈:
将每个信息集开始的博弈的剩余部分称为后续博弈。
(2)①由于后续博弈之前的行动历史使得局中人可以修正自己对其他局中人类型分布的先验信念,所以在进行后续博弈时,局中人是根据修正后的后验信念(依贝叶斯法则修正)进行策略选择的。
②完美(精炼)贝叶斯均衡要求在所有的后续博弈上也达到贝叶斯均衡。
10.什么是信号传递博弈?
针对信号发送者有两种类型,简要分析信号博弈的结构,并给出相应的分离均衡和混同均衡。
(1)信号发送者具有私人信息(类型θ,由自然确定),先验概率分布p(θ)是公共信息。
信号发送者在观察到其类型θ后,在行动集合A1上选择行动a1(发送信号,即信号发送者选择类型依存的行动。
信号接收者在观察到参与人1发出的信号a1后,使用贝叶斯法则修正对参与人1类型的判断,得到后验概率 ,然后选择行动 ,最大化其期望支付。
P29
(2)结构:
(画图:
p33)
(3)
11.教育信号模型是怎样的?
斯宾塞教育博弈模型说明了什么问题?
(1)
12.比较合作博弈和非合作博弈。
(1)合约强制力不同
在合作博弈中,协议有外在力量保证强制执行;
在非合作博弈中,协议没有外在力量保证强制执行。
如囚徒困境博弈
(2)研究重点不同:
非合作博弈的重点是个体,合作博弈研究的重点是群体,讨论何种联盟会形成,联盟中的成员如何分配。
(3)用非合作博弈的框架来研究合作博弈:
将达成合作的谈判过程和执行合作协议的强制过程纳入扩展式博弈中研究
13.理解联盟、特征函数、分配、简单博弈、核和核仁等概念及相关定理。
(1)联盟:
局中人集合={1,2,3,…,I}的任意一个非空子集S。
P11
合作博弈的一个分配:
指对I个局中人来说,存在一个向量x=(x1,x2,…,xI),满足:
①∑xi=V()
②xi≥V(i)
条件①说明各人分配的收益总和正好是所有局中人的最大总和收益;
条件②说明从联盟中各人得到的收益不小于单独经营所得的收益。
(2)联盟型博弈:
又称特征函数型博弈,它对每一种可能联盟给出相应的联盟总和收益,称为特征函数V(·
)。
新材料手工艺品。
目前,国际上传统的金银、仿金银制成饰品的销售在逐步下降,与此形成鲜明对比的是,数年以前兴起的崇尚然风格、追求个性的自制饰品--即根据自己的创意将各种材质的饰珠,用皮、布、金属等线材串出的品,正在各国的女性中大行其道。
特征函数的超加性:
对任意两个独立联盟S和T(S∩T=),有V(S∪T)≥V(S)+V(T)。
十字绣□编制类□银饰制品类□串珠首饰类□特征函数型博弈记为(,V)。
据调查统计在对大学生进行店铺经营风格所考虑的因素问题调查中,发现有50%人选择了价格便宜些,有28%人选择服务热情些,有30%人选择店面装潢有个性,只有14%人选择新颖多样。
如图(1-5)所示
14.如何理解委托代理分析框架?
举例说明在经济金融领域中有哪些委托代理问题。
(1)但经济学上的委托-代理关系泛指任何一种涉及非对称信息的交易,交易中有信息优势的一方称为代理人,另一方称为委托人。
简单地说,知情者是代理人,不知情者是委托人。
这样定义背后隐含的假定是,知情者的私人信息(行动或知识)影响不知情者的利益,或者说,不知情者不得不为知情者的行为承担风险。
(一)对“漂亮女生”饰品店的分析
(2)①代理人具有委托人不知道的私人信息,通常可分为两类。
一类是代理人可以采取委托人无法观察到的行动,即道德风险问题(隐蔽行动)如:
股东与经理;
贿赂与非法回扣;
基民与基金经理;
保险中投保人投保后的不作为
②代理人具有委托人所没有的专业知识或私有信息,即逆向选择问题(隐蔽知识):
如:
保险投保问题;
柠檬市场(旧车市场)
2003年,上海市总人口达到1464万人,上海是全国第一个出现人口负增长的地区。
③此外,还有一类不可证实性问题:
委托人和代理人知道同样的信息,但无法被第三方证实。
口头合同
15.什么是逆向选择?
谈谈你对逆向选择的理解。
举例说明它们在经济金融领域中的应用。
(1)逆向选择:
是指由交易双方信息不对称和市场价格下降产生的劣质品驱逐优质品,进而出现市场交易产品平均质量下降的现象。
(2)
(3)因为是连锁店,老板的“野心”是开到便利店那样随处可见。
所以办了积分卡,方便女孩子到任何一家“漂亮女生”购物,以求便宜再便宜。
理解:
逆向选择在生活中普遍存在,由于社会生活中,完全信息这个假定并不符合实际,很难成立,于是由信息不对称引起的逆向选择到处可见。
由于信息可以看成一种生产要素,但在私有化的制度下,信息当然也被私有化。
在信息不对称的情况下,市场运行常常无效率,即我们所说的“市场失灵”,导致优汰劣胜。
调研要解决的问题:
(3)例子:
汽车保险业逆向选择
4.WWW。
google。
com。
cn。
大学生政策2004年3月23日 随着个人购买家庭轿车的数量逐渐增多,汽车保险业务近年增长得很快。
可是由于车多路窄,新手又多,汽车交通事故比原来增加很多。
这些购买了汽车保险的人由于有了保险,开起车了跟开坦克似的,横冲直撞,反正汽车坏了有保险公司负责修理。
更有人经常酒后开车,把握不住;
还有的是开车精力不集中,甚至打瞌睡。
结果就是汽车交通事故频繁发生,致使保险公司收取的保险费不够赔付汽车修理公司的汽车修理费。
两年下来,中原保险公司已经在汽车保险项目上赔了几百万。
调研结论:
综上分析,我们认为在学院内开发“DIY手工艺品”商店这一创业项目是完全可行的。
16.什么是道德风险?
谈谈你对道德风险的理解。
(2)根本不知道□道德风险:
从事经济活动的人在最大限度地增进自身效用的同时做出不利于他人的行动。
(3)理解:
由于道德是每个人发自内心的约束,它不需要人监督,成本非常低,而且道德是每时每刻都在起作用,效率非常高。
因此,道德对人的约束比制度约束更为重要,它是审计风险形成的一个重要变量因素。
如果想要降低审计风险,首先应从降低道德风险着手。
否则,无论设计多么完美、多么精确的审计准则、方案、程序都会由于道德风险的作祟而无法产生应有的作用。
三个特征:
①内生性特征;
即风险雏形的形成于经济行为者对利益与成本的内心考量和算计;
②牵引性持征;
凡风险的制造者都存在受到利益诱惑而以逐利为目的的;
③损人利已特征;
即风险制造者的风险收益都是对信息劣势一方利益的不当攫取,换言之,风险制造者与风险承担者的不对称存在。
保险市场:
道德风险是代理人签订合约后采用隐藏行为,由于代理人和委托人信息不对称,给委托人带来损失。
保险市场上的道德风险是指投保人在投保后,降低对所投保标的的预防措施,从而使损失发生的概率上升,给保险公司带来损失的同时降低了保险市场的效率。
三、计算题(7+8+3×
10=45分)
1.用划线法和一阶条件法求解纳什均衡:
P34:
4、6、7,古诺竞争博弈(P23,P34:
习题9)
2.博弈树与标准式博弈的转换ok
3.求解子博弈完美(精炼)纳什均衡。
(P49例2.2,P57:
习题4)
4.不完全信息博弈求解:
P68例3.3古诺竞争,P74习题1、5,公共产品供给问题(例题)
分离均衡和混同均衡求解:
例题和P90习题5。
四、综合题(共10分)
结合学习心得,谈谈你对博弈论的理解及其在经济金融中的运用。