博弈论重点.docx

资源描述

博弈论重点.docx

《博弈论重点.docx》由会员分享，可在线阅读，更多相关《博弈论重点.docx（15页珍藏版）》请在冰豆网上搜索。

博弈论重点.docx

博弈论重点

第一章

1.囚徒困境的均衡是：

剔除严格劣势策略

2.猜硬币的均衡是：

纯策略纳什均衡

3.博弈的基本要素（填空）：

博弈的标准式表达包括以下八个基本要素:

1.博弈的参与者（Players）

2.各博弈方各自可选择的全部策略（Strategies）或行为（Actions）的集合

3.进行博弈的次序（Orders）

4.博弈方的得益（Payoffs）

5.博弈行为（action）

6.博弈信息（information）

7.结果（outcome）*

8.均衡（equilibrium）*-分析追求的结果

理性假设：

参与者聪明的，利己的；聪明人假设

4.博弈的分类（填空）

1.按照博弈者的先后顺序,博弈持续的时间和重复的次数进行分类，博弈可以划分为静态博弈（Staticgame）和动态博弈（DynamicGame）。

动态博弈是指在博弈中，博弈者的行动有先后顺序（Sequential-Move），且后行动者能够观察到先行动者所选择的行动或策略,因此,动态博弈又叫做序贯博弈。

动态博弈的一类特殊形式叫做重复博弈（RepeatedGames），又分为有限次重复博弈和无限次重复博弈。

“有限次重复博弈”（FinitelyRepeatedGames）“无限次重复博弈”（InfinitelyRepeatedGames）。

5.策略表达方式：

1）矩阵式（静态博弈）2）扩展式（动态博弈）

第二章

1.占优策略均衡（不需要理性人假设）

2.求严格下策消去法（填空或计算）

所谓“严格劣策略”（StrictlyDominatedstrategies）是指：

在博弈中，不论其他参与人采取什么策略，某一参与人可能采取的策略中，对自己严格不利的策略。

思路：

1、先找出某个参与人的劣策略（假定存在），把它剔除，重新构造一个不包含已剔除策略的新博弈；

2、然后再剔除新博弈中某个参与人的劣策略；……

3、直至剩下一个唯一的策略组合。

该策略组合就是博弈的均衡解，称为“重复剔除的占优策略均衡”。

3.纳什均衡（问答或填空）

4.纳什均衡划线法（计算）

5.夫妻博弈（纯策略纳什均衡）

6.混合策略（硬币博弈、社会福利博弈）

在博弈G＝{S1,S2,…Sn;u1,u2,…,un}中，参与人的战略空间为Si={si1,si2,…sik},则参与人i以概率分布σi=（σi1,…σik）随机地在其k个可选战略中选择的“战略”称为－个混合策略。

其中0≤σij≤1,且∑σij=1。

为了区别于这种情况，我们将前面定义的纳什均衡称为“策”战略纳什均衡。

7.古诺模型

出清价格

收益函数

8.Bertrand模型

前提假设：

企业以价格作为决策变量，他们的产品为完全替代品。

参与人：

企业1和企业2

战略：

价格p1和p2

收益函数：

a）假设二者的边际成本为c，市场总量为D；

b）如果谁的价格低，则获得全部市场:

u（qi）=D（qi-c）；

c）如果谁价格高，则无法获得任何市场：

u（qi）=0；

d）如果二者价格相等，二者平分市场，各自收益为：

u（qi）=D（qi-c）/2

两个企业会竞相竞价以争取更多的顾客。

当价格降到p1=p2=c时，达到均衡，即Bertland均衡。

如果竞争对手是3个、4个，均衡点在哪里？

结论：

只要有一个竞争对手存在，企业的行为就如同在完全竞争的市场结构中一样，价格等于边际成本。

悖论：

这与我们通常认为寡头垄断可以获得超额利润的常识相矛盾。

9.Hoteling模型

假设城市是一个线形分布，长度为1；消费者均匀地分布于城市中，分布密度为1。

每个消费者的需求量为1。

两个商店分别位于0和1处。

x处的消费者购买0处的成本为p1+tx；购买1处的成本为p2+t（1-x）。

其中的tx和t（1-x）分别为购买的旅行成本。

参与人：

企业1和企业2

战略：

价格p1和p2

收益函数ui:

解：

i）首先求出需求函数：

因为无差异点x需满足：

所以企业1和企业2的需求函数分别为：

ii）确定收益函数

iii）求出反应函数

IV）联立求解得：

第三章

1.子博弈纳什均衡（填空）

子博弈定义：

从一个动态博弈第一阶段以外的任阶段开始的后续博弈阶段构成的，包含有初始信息集和进行博弈所需要的全部信息，能够自成一个博弈的原博弈的一部分，称为原动态博弈的一个“子博弈”。

子博弈精炼纳什均衡定义：

如果在一个具有完美信息的动态博弈中，各博弈方的策略构成的一个策略组合满足在整个动态博弈及它的所有子博弈中都构成纳什均衡，那么这个策略组合称为该动态博弈的一个“子博弈精炼纳什均衡”。

2.带先后顺序的古诺博弈（斯塔克博格模型，写模型、区别、计算）

qi：

第i个企业的产量C：

代表单位不变成本假定逆需求函数为：

第i个企业的利润函数为：

两个企业的支付函数为：

用逆推归纳法先分析第二个阶段厂商2的决策。

这样q2必须满足：

即企业1的最佳产量是生产1/2（a-c）单位。

此时企业2的最佳产量是1/4（a-c）单位，双方的利润分别为1/8（a-c）2和1/16（a-c）2单位。

企业1在第一阶段选择1/2（a-c）单位产量，企业2在第二阶段选择1/4（a-c）单位产量，是这个动态博弈的唯一的子博弈完美纳什均衡。

企业2在决策之前知道企业1的选择，然而拥有较多的信息不一定有较多的利益。

古诺型与斯氏模型比较

斯氏均衡的总产量>古诺均衡的总产量，但是企业1利润更大，而总产量的上升使总利润下降了，从而企业2的利润一定下降。

这就是所谓的“先动优势”（first-mover-advantage）。

当然，如果企业选择的是价格不是产量，那么得到的就是“后动优势”（second-moveradvantage）。

第四章

1.重复博弈的定义

定义：

给定一个标准博弈G（可以是静态博弈，也可以是动态博弈），重复进行Ｔ次G，并且每次重复G之前以前博弈的结果各博弈方都能观察到，这样的博弈过程称为“G的Ｔ次重复博弈”，记为G（T）。

而Ｇ则称为G（T）的“原博弈”或“阶段博弈”。

G（T）中的每次重复称为G（T）的一个“阶段”

2.重复博弈的分析

3.重复博弈的均衡（单一纳什均衡、多个纳什均衡）

4.触发策略的定义（填空、问答）

触发策略（TriggerStrategy）:

即首先博弈双方试择合作，若双方都选择合作，则下一阶段继续进行合作；一旦选择不合作，就会触发其后的报复行为。

5.产品定价模型

6.两种常见的触发策略（填空）

1、冷酷战略：

首先合作，看到对方不合作，则一直惩罚下去；2、一报还一报：

首先合作；以后每一次行动都跟随对方的上一次策略；如果对方合作，则合作；对方背叛则背叛；可以给对方一个改过自新的机会，降低惩罚成本

7.冷酷策略贴现率（计算P133）

囚徒困境的无限重复博弈

1、该博弈一次博弈的Nash均衡在哪里？

2、团体理性解在哪里？

3、无限重复博弈的均衡策略是什么？

囚徒困境无限重复博弈的冷酷策略

1、囚徒A首先一直采取合作策略，使用策略H；如果观察到对方不合作，使用策略L，则自己以后都改为策略L；2、囚徒B的策略同囚徒A。

冷酷策略下囚徒A的收益

合作的收益：

不合作的收益：

冷酷战略是均衡的条件

也即当贴现率大于1/4时，博弈方1将会采用合作策略H；博弈方2也一样。

第五章

1.不完全信息静态博弈不知类型信息，知概率分布。

2.P146拍卖机制：

英式拍卖、荷式拍卖、一级密封价格拍卖、二级密封拍卖、双方叫价拍卖

1.英式拍卖：

投标者按照递增的顺序宣布他们的出价,直到没有人愿意出更高的价格,出价最高的投标者获得拍卖品；2.荷兰式拍卖：

拍卖从一个非常高的初始价格标价逐渐降低到有一个买主接受报价；3.一级密封价格拍卖：

出价最高的投标者获得拍卖品,并支付自己的出价给卖者；4.二级密封价格拍卖：

出价最高的投标者获得拍卖品,但支付次高价格给卖者；

5.双方叫价拍卖：

潜在的买者和卖者同时开价，卖者提出要价，买者提出出价，拍卖商

然后选择成交价格p清算市场：

所有要价低于p的卖者卖出，所有要价高于p的买者

买入；在价格p下的总供给等于总需求显然,拍卖或招投标问题属于不完全信息博弈，包括不完全信息静态博弈和不完全信息

动态博弈。

3.P148不完全信息的古诺模型与完全信息古诺模型的区别

传统古诺模型博弈方：

企业1和企业2策略空间：

产量q>=0收益函数：

出清价格：

p=8-（q1+q2）变动成本：

c=2利润：

u=[8-（q1+q2）]*q–2q不完全信息的古诺模型企业1的变动成本：

2（公共知识）企业2的变动成本：

有可能是3，也有可能是1概率分别为0.5具体是多少，企业2知道，企业1不知道

4.企业2的变动成本

5.海萨尼转换p150：

将不完全信息博弈转化成为完全但不完美信息动态博弈进行分析的思路。

6.p151贝叶斯纳什均衡的定义

7.p154性别之争模型（问答：

写出临界策略）

8.p159连续价格一级密封拍卖（得益函数，最佳策略，单一价格均衡）

两个参加投标的人（Bidder），分别为博弈方1和博弈方2。

两个博弈方对拍卖品的估价分别是v1和v2，并假设v1和v2是相互独立的，并服从[0，1]上的均匀分布；各博弈方知道自己的估价和另一方估价的概率分布。

博弈方i以价格P拍得卖品，其得益为vi-P。

得益函数

当i=1时,j=2；当i=2时,j=1.第一种情况表示的是博弈方i的标价由于高于博弈方j的标价而中标时的得益；第二种情况是博弈方i的标价与博弈方j的标价相同，博弈方i的中标机会为1/2，其期望得益（1/2）×（vi-bi）=（vi-bi）/2；第三种情况是博弈方i的标价低于博弈方j，博弈方i没有中标，此时博弈方I的得益为0。

求解:

1.构建两博弈方的策略空间.博弈方i的策略空间为所有可能的函数关系bi（vi）的集合.2.贝叶斯纳什均衡:

如策略组合[b1（v1）,b2（v2）]是一个贝叶斯纳什均衡,则必须对每个博弈方i的每个类型

，bi（vi）都满足:

对bi求偏导等于0，得：

同理得：

所以：

因为上述等式是对于所有的vi和vj永远成立，所以：

所以大家的策略是：

这就是说，每个博弈方的最佳策略是把自己的报价定在自己对拍品估值的一半，即采用兼顾中标机会和得益大小的折中报价，也就是自己估值的一半，这是博弈方的最佳选择。

9.p161双向报价拍卖（线性策略均衡）

双方估价：

卖家vs，买家vb;（私人信息，对方不知道,但是知道其均匀分布于[0,1]）双方报价：

卖方ps,买方pb；如果ps≤pb成交，以（ps+pb）/2成交；否则不成交；收益：

买家：

（ps+pb）/2-vs,卖家：

vb-（ps+pb）/2。

一价均衡

首先找出买家愿意买的区域；然后找出卖家愿意卖的区域；交集即为成交区域；黄色部分为应该成交区域，有1/2

10.p168委托——代理理论与道德风险

委托人（Principle）和代理人（Agents）之间的博弈关系是现代经济学研究的重要内容，通常称为“委托人—代理人理论”。

在委托人—代理人关系中,存在信息的不对称。

掌握信息多的市场参加者为代理人,掌握信息少的市场参加者为委托人。

由于代理人掌握委托人不了解的市场信息和个人信息,如企业的实际经营情况,代理人个人的能力和工作的努力程度,外部环境对企业的影响等,因此可能存在着较大的代理人道德风险。

11.p169图5.8

两个约束

激励相容约束代理人经理：

W（E）–E>W（S）–S参与约束：

代理人经理：

W（E）–E>0委托人股东：

0.9*[20-w（E）]+0.1*[10-w（E）]>0

促使代理人努力的激励相容约束、参与约束，以及委托人选择委托的条件0.9*[w（20）-E]+0.1*[w（10）-E]>0.1*[w（20）-S]+0.9*[w（10-S）]

接受：

0.9*[w（20）-E]+0.1*[w（10）-E]>0

委托：

0.9*[20-w（20）]+0.1*[10-w（10）]>0

12.p170激励相容约束

其定义为，如果在给定机制下，真实报告自己的个人信息是参与者的占优策略均衡，那么这个机制就是激励相容的。

此时，即便每个人按照自利原则制订个人目标，机制实施的客观效果也能达到设计者所要实现的目标。

13.p171“激励相容约束”和“参与约束”条件就是在该产博弈具有确定性工作成果时进行激励机制设计的具体依据。

第六章

1.p186关于精炼贝叶斯均衡条件的分析

一、精炼贝叶斯均衡的定义（PerfectBayesianEquilibrium）根据前面对完全但不完美信息动态博弈的基本讨论，借鉴子博弈精炼纳什均衡的思想，我们提出的精炼贝叶斯均衡概念必须满足一些要求：

要求1：

在每一个信息集中，轮到选择的博弈方必须具有一个关于博弈达到该信息集中每个节点可能性的“推断”（Belief）。

对非单节点信息集，一个“推断”就是博弈达到该信息集中各个节点可能性的概率分布，对单节点信息集，博弈方的推断可理解为达到该节点的概率为1。

要求2：

给定各博弈方的“推断”，他们的策略必须是满足“序列理性”（sequentiallyrational）的要求。

即在每个信息集中，给定轮到选择博弈方的推断和其他博弈方的“随后的策略”，该博弈方的行为及以后阶段的“随后的策略”，必须使自己的得益或期望得益最大。

这里所谓的“随后的策略”是指相应的博弈方在达到给定的信息集以后的阶段中，对所有可能的情况如何行为的完整计划。

要求3：

在均衡路径上的信息集处，“推断”由贝叶斯法则和各博弈方的均衡策略决定。

要求4：

对不处于均衡路径上的信息集，“推断”由贝叶斯法则和各博弈方在此处可能有的均衡策略决定。

当一个策略组合及相应的判断满足上面四个要求时，称其为“精炼贝叶斯均衡”。

之所以称这种均衡为精炼贝叶斯均衡，首先是因为它的第二个要求“序列理性”，与子博弈精炼纳什均衡中的子博弈精炼性要求相似；其次是因为要求3和要求4中规定“推断”的形成必须符合贝叶斯法则。

二．关于精炼贝叶斯均衡条件的分析不完美信息动态博弈的均衡概念为什么须要那么多条件?

要求1到要求3包含了精炼贝叶斯均衡的主要内容，即在精炼贝叶斯均衡的定义中，“推断”被提高到和策略同等重要的地位。

也就是说，一个均衡不再只是由每个博弈者的一个策略所构成，还包括了两个博弈者在该他行动的每一信息集中的一个“推断”。

通过这种方式使博弈者的“推断”得以明确的价值在于，和前面强调博弈者选择可信的策略一样，现在我们就可以强调博弈方持有理性的“推断”，无论是处于均衡路径之上，还是处于均衡路径之外（要求4）。

子博弈精炼纳什均衡是精炼贝叶斯均衡在完全且完美信息动态博弈中的特例。

即在完全且完美信息博弈中精炼贝叶斯均衡就是子博弈精炼纳什均衡。

实际上，序列理性在子博弈中就是子博弈的精炼性，在整个博弈中就是纳什均衡，而在完全且完美信息动态博弈中，所有轮到选择博弈方的信息集都是单节点的，他们对博弈达到该节点的“推断”都是概率等于1。

这些判断当然都是满足贝叶斯法则和以其他博弈方随后的策略为基础的。

而且，精炼贝叶斯均衡在静态博弈中就是纳什均衡。

2.p189市场类型与均衡类型的关系

市场完全失败型：

混同策略均衡；市场完全成功型：

分离策略均衡；市场部分成功型：

混同策略均衡市场接近失败型：

准分离均衡

3.p191交易价格唯一的旧车交易博弈模型（博弈树、市场出现均衡的条件）

P：

交易价格V：

新车的价值W：

旧车的价值C：

旧车的翻新费用

4.p193旧车市场交易模型的精炼贝叶斯均衡的两个关键条件。

5.P195有两种价格的旧货交易模型

车况好时价值6000，差时价值2000；买方不知道车况；高价4000，低价1000；差车翻新后可以伪装为好车，卖4000，费用为3500。

卖方先选择卖高价还是低价；如果旧车想卖高价，要先伪装；然后买方选择买还是不买。

当以下两个条件满足时：

假设V-Ph>W-Pl>0，即买到好车的收益大于买到旧车的收益；买到旧车收益仍然大于0，说明旧车也有一定收益。

假设C>Ph-Pl，即车辆伪装成本高于伪装后获得的净收益。

此时，卖家会诚实交易，所有产品都能卖出，市场完全成功。

6.p197逆向选择

逆向选择是指在买卖双方信息不对称的情况下，差的商品总是将好的商品驱逐出市场。

当交易中的一方对交易可能出现的风险状态比另一方知道更多时，便会产生逆向选择问题。

这种由于私人信息隐藏（亦称隐藏信息）而导致的市场功能的紊乱，对商品的需求不随其价格的下降而增加，对商品的供给不随其价格的上升而增加的市场异常现象，就是逆向选择问题，即，“由参与人错误报告信息引起的问题”称为“逆向选择”。

事前（exante）隐藏信息。

同样的情况就是，劣币驱逐良币，劣才驱逐良才。

这正是“分不出好歹”的经济学。

第七章

斯彭赛的就业市场博弈

自然决定求职者（S）的类型：

低能力（L）和高能力（H）；P（H）=p（L）=0.5；求职者自己知道这个类型信息，雇主不知道；但是雇主知道P（H）=p（L）=0.5。

求职者决定是否接收大学教育接受大学教育：

E不接受大学教育：

NE低能力的求职者接受大学教育的成本为14元；折合每月800元；高能力的求职者接受大学教育的成本为7万元；折合每月400元；雇主观测到求职者是否上过大学，决定工资数额每月创造价值：

低能力员工1000元，高能力员工2000元；与是否上大学没有关系。

精炼贝叶斯均衡：

求职者：

高能力的上大学；低能力不上大学；雇主的信念：

p（H|E）=1;p（L|E）=0;p（H|NE）=0;p（L|NE）=0;雇主的行动：

求职者上大学，则给出2000元工资，不上大学则给出1000元工资。

题型

填空

问答（概念、模型假设）

计算（50分，三至四道）

展开阅读全文