经济博弈论期末考试复习资料.docx

资源描述

经济博弈论期末考试复习资料.docx

《经济博弈论期末考试复习资料.docx》由会员分享，可在线阅读，更多相关《经济博弈论期末考试复习资料.docx（15页珍藏版）》请在冰豆网上搜索。

经济博弈论期末考试复习资料.docx

经济博弈论期末考试复习资料

《经济博弈论》期末考试复习资料

第一章导论

1.博弈的概念：

博弈即一些个人、队组或其他组织，面对一定的环境条件，在一定的规则下，同时或先后，一次或多次，从各自允许选择的行为或策略中进行选择并加以实施，并从中各自取得相应结果的过程。

它包括四个要素：

参与者，策略，次序和得益。

2.一个博弈的构成要素：

博弈模型有下列要素：

（1）博弈方。

即博弈中决策并承但结果的参与者．包括个人或组织等：

（2）策略。

即博弈方决策、选择的内容，包括行为取舍、经济活动水平或多种行为的特定组合等。

各博弈方的策略选择范围称策略空间。

每个博弈方各选一个策略构成一个策略组合。

（3）进行博弈的次序：

次序不同一般就是不同的博弈，即使博弈的其他方面都相同。

（4）得益。

各策略组合对应的各博弈方获得的数值结果，可以是经济利益，也可以是非经济利益折算的效用等。

3.合作博弈和非合作博弈的区别：

合作博弈：

允许存在有约束力协议的博弈；非合作博弈：

不允许存在有约束力协议的博弈。

主要区别:

人们的行为互相作用时，当事人能否达成一个具有约束力的协议。

假设博弈方是两个寡头企业，如果他们之间达成一个协议，联合最大化垄断利润，并且各自按这个协议生产，就是合作博弈。

如果达不成协议，或不遵守协议，每个企业都只选择自己的最优产品（价格），则是非合作博弈。

合作博弈：

团体理性（效率高，公正，公平）

非合作博弈：

个人理性，个人最优决策（可能有效率，可能无效率）

4.完全理性和有限理性:

完全理性：

有完美的分析判断能力和不会犯选择行为的错误。

有限理性：

博弈方的判断选择能力有缺陷。

区分两者的重要性在于如果决策者是有限理性的，那么他们的策略行为和博弈结果通常与在博弈方有完全理想假设的基础上的预测有很大差距，以完全理性为基础的博弈分析可能会失效。

所以不能简单地假设各博弈方都完全理性。

5.个体理性和集体理性：

个体理性：

以个体利益最大为目标；集体理性：

追求集体利益最大化。

第一章课后题：

2、4、5

2.设定一个博弈模型必须确定哪几个方面?

设定一个博弈必须确定的方面包括:

（1）博弈方，即博弈中进行决策并承担结果的参与者;

（2）策略（空间），即博弈方选择的内容，可以是方向、取舍选择，也可以是连续的数量水平等;（3）得益或得益函数，即博弈方行为、策略选择的相应后果、结果，必须是数量或者能够折算成数量;（4）博弈次序，即博弈方行为、选择的先后次序或者重复次数等;（5）信息结构，即博弈方相互对其他博弈方行为或最终利益的了解程度;（6）行为逻辑和理性程度，即博弈方是依据个体理性还是集体理性行为，以及理性的程度等。

如果设定博弈模型时不专门设定后两个方面，就是隐含假定是完全、完美信息和完全理性的非合作博弈。

4.“囚徒的困境”的内在根源是什么?

举出现实中囚徒的困境的具体例子。

“囚徒的困境”的内在根源是在个体之间存在行为和利益相互制约的博弈结构中，以个体理性和个体选择为基础的分散决策方式，无法有效地协调各方面的利益，并实现整体、个体利益共同的最优。

简单地说，“囚徒的困境”问题都是个体理性与集体理性的矛盾引起的。

现实中“囚徒的困境”类型的问题是很多的。

例如厂商之问的价格战、恶性的广告竞争，初等、中等教育中的应试教育等，其实都是“囚徒的困境”博弈的表现形式。

5.博弈有哪些分类方法，有哪些主要的类型?

首先，可根据博弈方的行为逻辑，是否允许存在有约束力协议，分为非合作博弈和合作博弈两大类。

其次，可以根据博弈方的理性层次，分为完全理性博弈和有限理性博弈两大类，有限理性博弈就是进化博弈。

第三是可以根据博弈过程分为静态博弈、动态博弈和重复博弈三大类。

第四是根据博弈问题的信息结构，根据博弈方是否都有关于得益和博弈过程的充分信息，分为完全信息静态博弈、不完全信息静态博弈、完全且完美信息动态博弈、完全但不完美信自、动态博弈和不完全信息动态博弈几类。

第五是根据得益的特征分为零和博弈、常和博弈和变和博弈。

第六是根据博弈中博弈方的数量，可将博弈分为单人博弈、两人博弈和多人博弈。

第七是根据博弈方策略的数量，分为有限博弈和无限博弈两类。

第二章完全信息静态博弈

1.纳什均衡的实质

给定你的策略，我的策略是最优的，给定我的策略，你的策略也是最优的。

2.纳什均衡的一致预测性质

如果所有博弈方都预测特定的博弈结果会出现，那么所有博弈方都不会利用该预测或者这种预测能力选择与预测结果不一致的策略，即没有哪个博弈方有偏离预测结果的愿望，因此预测结果最终真会成为博弈的结果。

正是由于纳什均衡是一致预测，因此各博弈方可以预测它，可以预测他们的对手会预测它，还可以预测他们的对手会预测自己会预测它……预测博弈结果是非纳什均衡，意味着要么各博弈方的预测不同，要么预期至少一个博弈方会“犯错误”，会选择错误的策略或者在实施策略时会出现差错。

因为只有纳什均衡才具有一致预测的性质，因此一致预测性是纳什均衡的本质属性。

一致预测性是保证纳什均衡价值的两个重要性质之一。

3.帕累托上策均衡

根据帕累托效率意义上的优劣关系选择出来的纳什均衡，就是帕累托上策均衡。

4.风险上策均衡

如果所有博弈方在预计其他博弈方采用两种纳什均衡的策略概率相同时，都偏爱其中某一纳什均衡，则该纳什均衡就是风险上策均衡。

5.防共谋均衡

定义：

满足下列要求的均衡策略组合称为“防共谋均衡”。

（1）没有任何单个博弈方的“串通”会改变博弈的结果。

（2）给定选择偏离的博弈方有再次偏离的自由时，没有任何两个博弈方的串通会改变博弈的结果。

（3）依次类推，直到所有博弈方都参加的串通也不会改变博弈的结果。

目标：

排除共谋问题给博弈结果带来的不稳定性和问题。

防共谋均衡是非合作博弈的均衡概念，而不是合作博弈的概念

6.反应函数

每个博弈方针对其他博弈方所有策略的最佳反应构成的函数。

而各个博弈方反应函数的交点（如果有的话）就是纳什均衡。

7.纯策略纳什均衡与混合策略纳什均衡的计算

纯策略纳什均衡：

划线法、箭头法

混合策略纳什均衡：

自己的策略选择不能被另一方预知或猜到，即在决策时利用随机性。

选择每种策略的概率一定要恰好使对方无机可乘，即让对方无法通过有针对性的倾向某一策略而占上风。

8.古诺的寡头模型中个体收益最大化和集体收益最大化的差异及现实意义。

与个体收益最大化相比，追求集体收益最大化时总产量较小，而总利润较高。

从两厂商总体来看，根据集体利润最大化确定产量效率更高，两厂商考虑合作，联合起来决定产量，定出使集体利益最大的产量后各自生产一半，比只考虑个体收益的独立决策行为得到的利益要高。

在独立决策、缺乏协调机制的两个企业间，考虑集体收益最大化的合作并不容易实现，即使实现了也是不稳定的。

主要原因是各自生产一半实现最大总利润总产量的产量组合不是纳什均衡策略组合。

第二章课后题:

1、2、6、9

1.上策均衡、严格下策反复消去法和纳什均衡相互之间的关系是什么?

上策均衡是各博弈方绝对最优策略的组合，而纳什均衡则是各博弈方相对最优策略的组合。

因此上策均衡是比纳什均衡要求更高，更严格的均衡概念。

上策均衡一定是纳什均衡，但纳什均衡不一定是上策均衡。

对于同一个博弈来说，上策均衡的集合是纳什均衡集合的子集，但不一定是真子集。

严格下策反复消去法与上策均衡分别对应两种有二定相对性的决策分析思路:

严格下策反复消去法对应排除法，即排除绝对最差策略的分析方法;上策均衡对应选择法，即选择绝对最优策略的均衡概念。

严格下策反复消去法和上策均衡之间并不矛盾，甚至可以相互补充，因为严格下策反复消去法不会消去任何上策均衡，但却可以简化博弈。

严格下策反复消去法与纳什均衡也是相容和补充的，因为严格下策反复消去法把严格下策消去时不会消去纳什均衡，但却能简化博弈，使纳什均衡分析更加容易。

2.为什么说纳什均衡是博弈分析中最重要的概念?

之所以说纳什均衡是博弈分析（非合作博弈分析）最重要的概念，主要原因是纳什均衡与其他博弈分析概念和分析方法相比，具有两方面的优秀性质。

第一是一致预测性质。

一致预测性是保证纳什均衡具有内在稳定性，能做出可靠的预测的根本基础。

而且只有纳什均衡才有这种性质，其他均衡概念要么不具有一致预测性，要么本身也是纳什均衡，是纳什均衡的组成部分，因此一致预测性是纳什均衡的本质属性。

第二是普遍存在性。

纳什定理及其他相关定理保证在允许采用混合策略的情况下，在我们关心的所有类型博弈中都存在纳什均衡。

这意味着纳什均衡分析方法具有普遍适用性。

相比之下，其他各种均衡概念和分析方法，如上策均衡、严格下策反复消去法、严格上策均衡等，则可能在许多博弈中不存在，从而限制了它们的作用和价值。

纳什均衡是惟一同时具有上述两大性质的博弈分析概念，而且它也是其他各种博弈分析方法和均衡概念的基础，因此纳什均衡是博弈分析中最重要、作用最大的概念。

6.求出下图中得益矩阵所表示的博弈中的混合策略纳什均衡。

根据计算混合策略纳什均衡的一般方法，设博弈方1采用T策略的概率为p，则采用B策略的概率为1-p；再设博弈方2采用策略L的概率为q，，那么采用策略R的概率是1-q。

根据上述概率分别计算两个博弈方采用各自两个纯策略的期望得益，并令它们相等：

解上述两个方程，得p=2/3、q=3/4。

即该博弈的混合策略纳什均衡为:

博弈方1以概率分布2/3和1/3在T和B中随机选择;博弈方2以概率分布3/4和1/4在L和R中随机选择。

9.两寡头古诺模型.P（Q）=a一Q等与上题相同，但两个厂商的边际成本不同，分别为c1和c2。

如果0

如果c1a+c1，则.纳什均衡产，又为多少?

（1）两个厂商的利润函数为:

将利润函数对产量求导并令其为。

得:

解得两个厂商的反应函数为:

或具体写成:

（2）当0

（3）当c1a+c1时，根据反应函数求出来的厂商2产量q2<0。

这意味着厂商2不会生产，这时厂商1成了垄断厂商，厂商1的最优产量选择是利润最大化的垄断产量

第三章完全且完美信息动态博弈

1.可信性问题

由于动态博弈中博弈方的策略是多阶段的行动计划，实施起来有一个过程，而且又没有强制力，因此博弈方完全可以在博奔过程中改变计划。

我们称这种问题为“相机选择”问题。

相机选择的存在使得动态博弈中各博弈方策略设定的行为选择的“可信性”有了疑问。

各个博弈方是否会真正、始终按照自己的策略所设定的方案行为，还是可能临时改变自己的行动方案？

纳什均衡不能解决这种可信性问题，无法排除博弈方策略中不可信的行为设定，因此在动态博弈中不是真正稳定的。

动态博弈分析中具有真正稳定性的均衡概念是子博弈完美纳什均衡。

2.逆推归纳法

从动态博弈的最后一个阶段开始，逐个阶段向前面的阶段倒推分析博弈方行为选择的动态博弈分析方法，称为“逆推归纳法”。

逆推归纳法的逻辑基础是理性的先行为博弈方，在前面阶段选择行为时必然合考虑后行为博弈方在后面阶段的行为选择，只有在博弈的最后一个阶段选择的，不再有后续阶段牵制的博弈方才能直接做出明确选择，当后面阶段博弈方的选择确定以后，前一阶段博弈方的选择就可以确定了。

逆推归纳法是动态博弈分析，也就是子博奔完美纳什均衡分桥最重要的基本方法。

3.子博弈完美纳什均衡

如果在一个完美信息的动态博弈中，一个策略组合满足在整个动态博弈及它所有的子博弈中都构成纳什均衡。

那么该策略组合称为—个“子博弈完美纳什均衡”。

因为要求在所有子博弈中都构成纳什均衡，因此子博弈完美纳什均衡能够排除均衡策略中不可信的行为（威胁或承诺），因此具有真正的稳定性。

非子博弈完美的纳什均衡不能做到这一点。

子博弈完美纳什均衡是动态博弈分析的核心均衡概念。

子博弈完美纳什均衡本身也是纳什均衡，是比纳什均衡更强的均衡概念。

4.古诺模型与寡占的斯塔克博格模型区别及现实意义

斯塔克博格模型与古诺模型相比，唯一的不同是前者有一个选择的次序问题（两厂商所处地位具有不对称性），其他如博弈方、策略空间和得益函数等完全都是相同的。

斯塔克博格模型的产量大于古诺模型，价格低于古诺模型，总利润小于古诺模型。

在信息不对称的博弈中，信息较多的博弈方不一定能得到较多的利益。

5.委托人—代理人博弈模型分析（4种）

详细内容见课本150—162

无不确定性的委托人—代理人模型

有不确定性但可监督的委托人—代理人博弈

有不确定性且不可监督的委托人—代理人博弈

选择报酬和连续努力水平的委托人—代理人博弈

第三章课后题:

1、4、6、9

1.动态博弈分析中为什么要引进子博弈完美纳什均衡，它与纳什均衡是什么关系?

子博弈完美纳什均衡即动态博弈中具有这样特征的策略组合:

它们不仅在整个博弈中构成纳什均衡，而且在所有的子博弈中也都构成纳什均衡。

在动态博弈分析中引进子博弈完美纳什均衡概念的原因在于，动态博弈中各个博弈方的行为有先后次序，因此往往会存在相机抉择问题，也就是博弈方可能在博弈过程中改变均衡策略设定的行为，从而使得均衡策略存在可信性问题，而且纳什均衡无法消除这种问题，只有子博弈完美纳什均衡能够解决它。

子博弈完美纳什均衡一定是纳什均衡，但纳什均衡不一定是子博弈完美纳什均衡。

因此一个动态博弈的所有子博弈完美纳什均衡是该博弈所有纳什均衡的一个子集。

4.如果开金矿博弈中第三阶段乙选择打官司后的结果尚不能肯定，即下图中a、b的数值不确定。

试讨论本博弈有哪几种可能的结果。

若要本博弈中的“威胁”和“承诺”是可信的，a或b应满足什么条件?

括号中的第一个数字代表乙的得益，第二个数字代表甲的得益，所以a表示乙的得益，而b表示甲的得益。

在第三阶段，如果a<0，则乙会选择不打官司。

这时逆推回第二阶段，甲会选择不分，因为分的得益2小于不分的得益4。

再逆推回第一阶段，乙肯定会选择不借，因为借的最终得益。

比不借的最终得益1小。

在第三阶段，如果a>0，则乙轮到选择的时候会选择打官司，此时双方得益是（a、b）。

逆推回第二阶段，如果b>2，则甲在第二阶段仍然选择不分，这时一候双方得益为（a、b）。

在这种情况下再逆推回第一阶段，那么当a<1时乙会选择不借，双方得益（l、0），当a>1时乙肯定会选择借，最后双方得益（a、b）。

在第二阶段如果b<2，则甲会选择分，此时双方得益为（2、2）。

再逆推回第一阶段，乙肯定选择借，因为借的得益2大于不借的得益1，最后双方的得益（2、2）.

根据上述分析我们可以看出，该博弈比较明确可以预测的结果有这样几种情况:

（1）a<0，此时本博弈的结果是乙在第一阶段不愿意借给对方，结束博弈，双方得益（1、0），不管这时候b的值是多少;

（2）02，此时博弈的结果仍然是乙在第一阶段选择不借，结束博弈，双方得益（1、0）;（3）a>1且b>2、此时博弈的结果是乙在第一阶段选择借，甲在第二阶段选择不分，乙在第三阶段选择打，最后结果是双方得益（a、b）;（4）a>0且b<2，此时乙在第一阶段会选择借，甲在第二阶段会选择分，双方得益（2、2）.

要本博弈的“威胁”，即“打”是可信的，条件是a>0。

要本博弈的“承诺”，即“分”是可信的，条件是a>0且b<2.

注意上面的讨论中没有考虑a=0、a=1、b=2的几种情况，因为这些时候博弈方的选择很难用理论方法确定和预测。

不过最终的结果并不会超出上面给出的范围。

6.三寡头市场需求函数P=100-Q，其中Q是三个厂商的产量之和，并且已知三个厂商都有常数边际成本2而无固定成本。

如果厂商1和厂商2先同时决定产量，厂商3根据厂商1和厂商2的产量决策，问它们各自的产量和利润是多少?

首先，设三个厂商的产量分别为q1、q2:

和q3。

三个厂商的利润函数为:

根据逆推归纳法，先分析第二阶段是厂商3的选择。

将厂商1的利润函数对其产量求偏导数并令其为0得:

因此厂商3的反应函数为:

再分析第一阶段是厂商1和厂商2的决策。

先把厂商3的反应函数代入厂商1和厂商2的利润函数得:

分别对q1和q2求偏导数并令为0，得:

联立两个方程可解得q1=q2=98/3。

再代入厂商3的反应函数得：

把三个厂商的产量代入各自的利润函数，可得三个厂商的利润分别为4802/9、4802/9和2401/9.

9.根据3.4.4中对店主和店员之间委托人一代理人关系的分析.讨论在信息不完全的情况下，“基本工资+提成奖金”式的工资制度和租赁、承包制相比，哪种方式更能使雇员或承祖、承包人的利益，与雇主或出租、发包人的利益一致，使代理人的行为更加符合委托人的利益?

工资加奖金制度与租赁、承包制度各有什么优缺点?

根据3.4.4中对店主和店员之间委托人一代理人关系的分析，不难清楚在信息不完全的情况下，租赁、承包制显然比“基本工资+提成奖金”式的工资制度，更能使雇员或承租、承包人的利益，与雇主或出租、发包人的利益一致，使代理人的行为更符合委托人的利益。

理由是在这个委托人一代理人关系博弈中，同时满足参与约束和激励相容约束的惟一子博弈完美纳什均衡解，就是一种固定租金或承包费的承包或租赁经营制。

租赁、承包制度的最大优点就是上述出租、发包人与租赁、承包之间的利益一致性。

但这有一定前提，那就是租赁、承包的条件、合同是合理的。

此外，在租赁、承包制下所有的不确定性风险实际上都是由代理人而不是委托人承担。

由于通常代理人在风险类型方面总是比委托人更偏向风险厌恶而不是风险偏好，与租赁、承包制的风险安排正好矛盾，因此承包制和固定租金租赁制不一定能采用或合理。

工资奖金制度的优点是代理人所承担的风险比较小，委托人和代理人双方分担不确定性的风险，这对于代理人比较厌恶风险，每单位带风险的期望得益价值较小的情况是较好的制度安排。

工资奖金制度的缺点是在信息不完全的情况下，委托人和代理人在利益方面的某种不一致性无法完全避免，无法使代理人的行为完全符合委托人的利益。

第四章重复博弈

1.有限次重复的囚徒困境博弈与无限次重复的囚徒困境式博弈的子博弈完美纳什均衡

有限次重复的囚徒困境博弈：

各博弈方在每个阶段都采用原博弈的纳什均衡策略。

无限次重复的囚徒困境式博弈：

触发策略（贴现因素）

2.触发策略

重复博弈中博弈方首先试探合作，一旦发觉对方不合作则用不合作报复的策略，称为“触发策略”（triggerstrategy）。

触发策略的报复机制本身必须构成纳什均衡，否则触发策略就不是子博弈完美纳什均衡：

触发策略是重复博奔中实现合作和提高均衡效率的关键机制，是重复博弈分析中构造子博弈完美纳什均衡的基本“构件”之一。

触发策略在现实中有很多例证。

触发策略也可能存在可信性的问题，因为触发策略在报复其他博弈方的时候，也可能对报复者自己造成损害，在重复博弈分析时必须注意这个问题。

3.民间定理

有限次重复博弈民间定理：

设原博弈的一次性博弈有均衡得益数组优于各博弈方在一次性博弈中最差均衡得益构成的得益数组，那么在多次重复博弈中，所有不小于个体理性得益（1ndividualrationalityPayoff，即博弈方保证能获得的得益）的可实现得益（feasiblepayoff，博弈中所有纯策略组合得益的加权平均数组）．都至少有一个子博弈完美纳什均衡的极限的平均得益来实现它们。

这个定理在有人正式证明并发表之前就是博弈理论界众所周知和认为当然成立的，因此称“民间定理”。

无限次重复博弈民间定理：

设G是一个完全信息的静态博弈。

用（e1，…，en）记G的纳什均衡的得益。

用（xl，…，xn）表示G的任意可实现得益。

如果xi＞ei对任意博弈方i都成立，而足够接近1，那么无限次重复博弈中一定存在一个子博弈完美纳什均衡。

各博弈方平均得益是（xl，…，xn）。

这个无限次重复博弈的民间定理是弗里德曼（Fried-man）于1971年提出的，也称为民间定理是因为它与有限次重复博弈民间定理的相似性。

4.重复博弈得益的计算

有限次重复博弈:

各博弈方在G（T）中的总得益为在G中得益的T倍。

无限次重复博弈:

各博弈方在G（∞、δ）中的“得益”等于各阶段得益的现在值。

贴现系数：

δ＝1/（1+γ），其中γ为以一阶段为期限的市场利率。

给定贴现系数δ，若无限次重复博弈一路径的某博弈方各阶段的收益为

则该博弈方在该无限次重复博弈中的总收益为各阶段博弈中得益的“现在值”：

注意：

重复次数较多的有限次重复博弈也要考虑得益的时间价值差别，方法与无限次重复博弈一致。

5.无限次重复博弈的效率工资模型

有效工资率无限次重复博弈模型是关于工资率决定和劳动激励的众多博弈模型之一。

这个模型揭示了企业经营者不能只是以压低雇员工资为目标，必须考虑用适当的高工资激励员工努力，应该在考虑到工人对工资率反应的情况下确定最有效率的工资率。

这个博弈模型在现代经济学中有非常重要的作用。

一次性博弈的结局：

在厂商必须支付工资w条件下，工人将选择偷懒；此时厂商的收益（py－w）很可能是负值（概率p很小），因此其支付的工资w很低（w

触发策略：

厂商：

第一阶段支付较高的工资率w*；如果在前（t－1）阶段产量都为y，那么第t阶段继续支付；否则解雇w＝0。

工人：

如果工资率高于w0则接受。

如果在前（t－1）阶段工资率都为w*，第t阶段继续努力工作；否则偷懒。

为了促使工人努力工作，除了要提供补偿从事个体户的机会成本w0和努力工作的成本e以外，还要提供一个促进效率的工资e（1－δ）/δ（1－p）。

其值大小与工人努力工作付出的成本e、贴现系数δ的大小、偷懒也可以获得高产量的概率p有关。

第四章课后题:

2、4

2.举出现实生活中的一个重复博弈与一次性博弈效率不同的例子。

火车站和机场餐饮商业服务的顾客往往都是一次性的，回头客、常客比较少，这些经济交易具有一次性博弈的特征，它们的价格总是较高而质量又会差一些，顾客也会尽量不在这些地方购买商品和消费。

在一般商业区和居民区的餐饮商业服务则回头客和常客较多，有明显的重复博弈特征，在居民区购买商品和消费的老顾客一般能得到比较公平、优惠的价格，还能得到较好的服务，甚至有些还可以信用消费（赊账），因此消费者一般会比较放心地消费。

这就是现实生活中重复博弈和一次性博弈效率不同的典型例子之一。

4.若三次重复2.3.1的古诺模型，子博弈完美纳什均衡是什么?

2.3.1的古诺模型是一个典型的囚徒的困境型博弈，有惟一的纯策略纳什均衡。

根据关于有惟一纯策略纳什均衡的有限次重复博弈的定理，这个二次重复博弈的子博弈完美纳什均衡是，两个厂商在每次重复时都会采用一次性博弈的纳什均衡，也就是2单位的古诺产量。

第五章有限理性和演化博弈

1.有限理性：

有限理性意味着一般至少有部分博弈方不会采用完全理性博弈的均衡策略，他们会在博弈过程中学习、博弈通过试错寻找较好的策略；

有限理性意味着均衡是不断调整和改进而不是一次性选择的结果，而且即使到达了均衡也可能再次偏离。

2.最优反应动态：

有快速学习能力的小群体成员的反复博弈及策略调整的动态机制.

例子：

五方博弈模型和古诺调整模型，分析它们的进化稳定策略ESS

3.复制动态：

学习速度很慢的成员组成的大群体随机配对的反复博弈及策略调整的动态机制.

例子（分析见书）：

分析签协议博弈的复制动态，一般两人对称博弈的复制动态，协调博弈的复制动态，鹰鸽博弈的复制动态及它们所有的进化稳定策略。

两人非对称博弈（学习和策略模仿仅在自己所在的群体内部）的复制动态及ESS。

协调博弈有两个纯策略纳什均衡，其中一个是帕累托上策均衡，另一个是风险上策均衡，存在明显的合作利益，但效率比较低的风险上策均衡更容易出现。

这种博弈，实现较好的结果需要双方之间的协调或默契，这正是称其为“协调博弈”的原因。

展开阅读全文