博弈论基础复习11教学文案.docx

资源描述

博弈论基础复习11教学文案.docx

《博弈论基础复习11教学文案.docx》由会员分享，可在线阅读，更多相关《博弈论基础复习11教学文案.docx（7页珍藏版）》请在冰豆网上搜索。

博弈论基础复习11教学文案.docx

博弈论基础复习11教学文案

《博弈论基础》复习大纲

一、辨析题（2×5＝10分）

二、简答题（5×7＝35分）

1.描述双人策略型（标准型）博弈的基本结构及其纳什均衡。

你是如何理解纳什均衡的？

（1）标准式博弈记为：

G＝｛S1，S2，…，Sn；u1，u2，…，un｝。

其基本要素包括:

局中人、策略（策略组合）、支付（支付函数）

（2）局中人：

博弈的参与人i

博弈的参与人集合I：

i∈I=｛1,2,…,n｝

（3）纯策略：

指局中人在博弈中可以选择采用的行动方案。

每个局中人都有可供其选择的多种策略，参与人i的纯策略si∈Si

①参与人i的策略集（纯策略空间）为Si，i∈I

　　②策略组合：

s=（s1,s2,…，si，…,sn）

③策略组合空间：

S＝×iSi

（4）支付（效用）：

每个局中人从各种策略组合中获得的收益，由于它是参与人策略组合的函数，又称为支付函数

每个参与人的支付函数记为ui（s）=ui（s1,s2,…,sn），si∈Si

（5）Nash均衡

在博弈G＝｛S1，S2，…，Sn；u1，u2，…，un｝中，如果策略组合s*=（s1*,s2*,…,sn*）满足对每一参与者i，si*是他针对其他参与者所选策略s-i*=（s1*,s2*,…si-1*,si+1*,…,sn*）的最优反应策略，则称策略组合s*=（s1*,s2*,…,sn*）为该博弈的一个纳什均衡。

即：

　　ui（si*,s-i*）≥ui（si,s-i*），　　si∈Si

纳什均衡是一种相对稳定状态，没有参与者有动机独自偏离纳什均衡下的策略选择。

2.分析两人两策略博弈构成囚徒困境博弈应满足的条件。

囚徒困境博弈说明了什么问题？

合作

背叛

合作

R,R

S,T

背叛

T,S

P,P

条件：

（1）T>R>P>S

（2）　2R>T+S或2R>2P

囚徒困境反映个人最佳选择并非团体最佳选择，说明个人利益与社会利益的冲突。

3.描述双人策略型博弈的纯策略和混合策略。

（1）纯策略：

指局中人在博弈中可以选择采用的行动方案。

每个局中人都有可供其选择的多种策略，参与人i的纯策略si∈Si

　　参与人i的策略集（纯策略空间）为Si，i∈I

　　策略组合：

s=（s1,s2,…，si，…,sn）

　　策略组合空间：

S＝×iSi

（2）混合策略

混合策略：

若参与人i有K个纯策略：

Si＝｛si1，…，siK｝，则概率分布i＝（i1，…，iK）称为i的一个混合策略，这里ik＝（sik）是i选择sik的概率，对于所有的k＝1，2，…，K，0≤ik≤1，∑kik＝1。

纯策略为混合策略的一个特例。

混合策略空间：

参与人i的所有混合策略的集合，记为i

混合策略组合空间：

＝×ii

4.简要分析扩展型博弈（博弈树）的构成要素。

博弈树的基本元素有：

（1）节点：

x∈X，又称决策结，简称“结”

（2）枝：

连结结点的连线

（3）信息集：

一些节点的集合。

在同一信息集中，局中人面临完全相同的决策形势。

（4）结：

包括：

　　①初始结：

博弈的起点。

　　②决策结：

参与人采取行动的时点。

　　③终点结：

博弈行动路径的终点。

5.什么是子博弈和子博弈精炼（完美）纳什均衡？

什么是完美信息博弈？

简析完美信息博弈中逆向归纳法的求解思路。

（1）子博弈：

一个扩展式博弈的子博弈G由一个决策结x和所有该决策结的后续结T（x）（包括终点结）组成，它满足：

①x是一个单结信息集，即h（x）={x}；

②对于所有的x’∈T（x），如果x’∈h（x’），则x’∈T（x）。

条件①是指子博弈必须从一个单结信息集开始；

条件②说明子博弈的信息集和支付向量直接承自原博弈。

这意味着子博弈不能切割原博弈的信息集。

同时，任何博弈是它自身的子博弈。

（2）子博弈精炼Nash均衡

子博弈精炼（完美）纳什均衡：

扩展式博弈的策略组合s*=（s1*,s2*,…,sn*）是一个子博弈精炼纳什均衡，如果：

①它是原博弈的纳什均衡；②它在每一个子博弈上给出纳什均衡。

（3）完美信息博弈：

一个博弈的所有信息集都是单结的。

（4）完美信息博弈中逆向归纳法的求解思路：

（画图解释好）

假设只有两个阶段（参与人2在观察到参与人1的行动后再行动），当博弈进入第二阶段时，给定参与人1的选择a1∈A1，则参与人2的决策是使：

　　　　　u2（a1,a2）

我们用a2*=R2（a1）代表上述最优化问题的解（参与人2的反应函数）。

由于参与人1知道参与人2在第二阶段的决策规则，参与人1在第一阶段的决策是：

　　　　　　u1（a1,R2（a1））

　设其解为a1*，则该博弈的子博弈精炼纳什均衡是（a1*，R2（a1）），均衡结果为（a1*，R2（a1*））。

6.理解完全信息动态博弈下的纯策略和行动。

行动与策略

（1）行动：

是参与人在博弈的某个时点（某个信息集）的决策变量。

　　　行动组合：

参与人的行动的有序集。

（2）策略：

是参与人在给定信息集情况下的行动规则，它规定参与人在什么时候选择什么行动。

　　在静态博弈中，策略和行动是等价的。

　　在动态博弈中，策略在给定信息集下完整的行动方案，与行动是不同的。

7.什么是冷酷（触发）策略？

谈谈你对重复博弈中冷酷策略的理解。

（1）触发策略：

如果一方采取不合作的策略另一方随即也采取不合作策略并且永远采取不合作策略。

8.描述双人不完全信息静态博弈的结构，并给出相应的静态贝叶斯均衡。

博弈论中对不完全信息是通过类型来处理的，对此，你是如何理解的？

（1）n人静态贝叶斯博弈的策略式表述G＝｛A1，…，An；p1，…，pn；u1，…，un｝包括：

（补充符号）P23

　　①参与人的类型空间：

1，…，n

　　②条件概率：

p1，…，pn

　　③类型依存支付函数：

ui（a1,…,an;i）

④参与人i知道自己的类型ii，条件概率pi描述给定自己属于i的情况下，参与人i有关其他参与人类型-i-i的不确定性，ai（i）Ai（i）表示参与人i的类型为i时所选择的行动（即参与人的行动是类型依存的）。

贝叶斯纳什均衡：

n人不完全信息静态博弈G＝｛A1，…，An；p1，…，pn；u1，…，un｝的纯策略贝叶斯纳什均衡是一个类型依存策略组合a*=（ai*（i）），i=1，2，…，n。

其中，ai*（i）满足：

（自己补充）

（2）①一般地，将一个参与人所拥有的所有私人信息称为他的类型。

②由于大多数博弈中，参与人的特征由支付函数完全确定，因而一般将参与人的支付函数等同于他的类型。

③通常假定，参与人i只知道自己的类型，并且知道其他局中人的类型分别为若干种可能类型中的一种，但不知道具体是哪一种，但他知道其他参与人类型的概率分布。

④通过引入“自然”这一虚拟局中人，将不完全信息博弈转换为不完美信息博弈。

⑤所有局中人的实际类型均来自于由“自然”根据类型上的联合概率分布进行的一种初始抽彩，局中人根据这种抽彩决定自己对其他局中人类型的主观判断，由此进行实际博弈。

9.什么是后续博弈？

简要分析完美贝叶斯均衡与后续博弈的关系。

（1）后续博弈：

将每个信息集开始的博弈的剩余部分称为后续博弈。

（2）①由于后续博弈之前的行动历史使得局中人可以修正自己对其他局中人类型分布的先验信念，所以在进行后续博弈时，局中人是根据修正后的后验信念（依贝叶斯法则修正）进行策略选择的。

②完美（精炼）贝叶斯均衡要求在所有的后续博弈上也达到贝叶斯均衡。

10.什么是信号传递博弈？

针对信号发送者有两种类型，简要分析信号博弈的结构，并给出相应的分离均衡和混同均衡。

（1）信号发送者具有私人信息（类型θ，由自然确定），先验概率分布p（θ）是公共信息。

信号发送者在观察到其类型θ后，在行动集合A1上选择行动a1（发送信号，即信号发送者选择类型依存的行动。

信号接收者在观察到参与人1发出的信号a1后，使用贝叶斯法则修正对参与人1类型的判断，得到后验概率　　　　　，然后选择行动　　　　，最大化其期望支付。

P29

（2）结构：

（画图：

p33）

（3）

11.教育信号模型是怎样的？

斯宾塞教育博弈模型说明了什么问题？

（1）

12.比较合作博弈和非合作博弈。

（1）合约强制力不同

　　在合作博弈中，协议有外在力量保证强制执行；在非合作博弈中，协议没有外在力量保证强制执行。

如囚徒困境博弈

（2）研究重点不同：

　　非合作博弈的重点是个体，合作博弈研究的重点是群体，讨论何种联盟会形成，联盟中的成员如何分配。

（3）用非合作博弈的框架来研究合作博弈：

　　将达成合作的谈判过程和执行合作协议的强制过程纳入扩展式博弈中研究

13.理解联盟、特征函数、分配、简单博弈、核和核仁等概念及相关定理。

（1）联盟：

局中人集合={1,2,3,…,I}的任意一个非空子集S。

P11

合作博弈的一个分配：

指对I个局中人来说，存在一个向量x=（x1,x2,…,xI），满足：

　①∑xi=V（）

②xi≥V（i）

条件①说明各人分配的收益总和正好是所有局中人的最大总和收益；

条件②说明从联盟中各人得到的收益不小于单独经营所得的收益。

（2）联盟型博弈：

又称特征函数型博弈，它对每一种可能联盟给出相应的联盟总和收益，称为特征函数V（·）。

特征函数的超加性：

对任意两个独立联盟S和T（S∩T=），有V（S∪T）≥V（S）+V（T）。

十几年的学校教育让我们大学生掌握了足够的科学文化知识，深韵的文化底子为我们创业奠定了一定的基础。

特别是在大学期间，我们学到的不单单是书本知识，假期的打工经验也帮了大忙。

特征函数型博弈记为（，V）。

14.如何理解委托代理分析框架？

举例说明在经济金融领域中有哪些委托代理问题。

木质、石质、骨质、琉璃、藏银……一颗颗、一粒粒、一片片，都浓缩了自然之美，展现着千种风情、万种诱惑，与中国结艺的朴实形成了鲜明的对比，代表着欧洲贵族风格的饰品成了他们最大的主题。

（1）但经济学上的委托-代理关系泛指任何一种涉及非对称信息的交易，交易中有信息优势的一方称为代理人，另一方称为委托人。

简单地说，知情者是代理人，不知情者是委托人。

　　　这样定义背后隐含的假定是，知情者的私人信息（行动或知识）影响不知情者的利益，或者说，不知情者不得不为知情者的行为承担风险。

（四）DIY手工艺品的“个性化”

（2）①代理人具有委托人不知道的私人信息，通常可分为两类。

一类是代理人可以采取委托人无法观察到的行动，即道德风险问题（隐蔽行动）如：

股东与经理；贿赂与非法回扣；基民与基金经理；保险中投保人投保后的不作为

7、你喜欢哪一类型的DIY手工艺制品？

②代理人具有委托人所没有的专业知识或私有信息，即逆向选择问题（隐蔽知识）：

如：

保险投保问题；柠檬市场（旧车市场）

图1-2大学生购买手工艺品可接受价位分布③此外，还有一类不可证实性问题：

委托人和代理人知道同样的信息，但无法被第三方证实。

如：

口头合同

根据调查资料分析：

大学生的消费购买能力还是有限的，为此DIY手工艺品的消费不能高，这才有广阔的市场。

15.

16.在现代文化影响下，当今大学生对新鲜事物是最为敏感的群体，他们最渴望为社会主流承认又最喜欢标新立异，他们追随时尚，同时也在制造时尚。

“DIY自制饰品”已成为一种时尚的生活方式和态度。

在“DIY自制饰品”过程中实现自己的个性化追求，这在年轻的学生一代中尤为突出。

“DIY自制饰品”的形式多种多样，对于动手能力强的学生来说更受欢迎。

什么是逆向选择？

谈谈你对逆向选择的理解。

举例说明它们在经济金融领域中的应用。

（1）逆向选择：

是指由交易双方信息不对称和市场价格下降产生的劣质品驱逐优质品，进而出现市场交易产品平均

展开阅读全文