洪开荣《经济博弈论》习题答案.docx
《洪开荣《经济博弈论》习题答案.docx》由会员分享,可在线阅读,更多相关《洪开荣《经济博弈论》习题答案.docx(39页珍藏版)》请在冰豆网上搜索。
洪开荣《经济博弈论》习题答案
《经济博弈论》思考题
第1章纳什均衡
1、每位学者的贡献都是建立在前者理论基础之上的,排名考虑的因素是理论的原创性。
纳什提出了纳什均衡概念,建立了一种互动分析模式;泽尔腾以纳什均衡为基础建立了策略性思维的动态分析模式;海萨尼提出海萨尼转换及其均衡体系。
2、博弈论学科对数学工具的利用使得博弈论乃至经济学成为一门真正的科学。
博弈均衡数学表达式的简明与繁复意味着背景事实的简明与繁复。
3、要素包括参与人,行动,支付和信息。
明确了三要素也就完成了建模。
模型的表述需要将各要素参数化和数据化。
参与人1
参与人2
尽力
不尽力
闹
(5,-5)
(0,0)
不闹
(0,0)
(-5,5)
4、博弈论模型中的元素就是对经济分析中因素的抽象,分析方法就是关注各个参与人之间的互动及相互之间的影响。
比如,甲、乙两公司分数两个国家,在开发某种新产品时有下面矩阵表示的博弈关系(单位:
百万美元)。
乙公司
开发
不开发
甲公司
开发
—10,—10
100,0
不开发
0,100
0,0
在这个收益矩阵中,将原本复杂的经济问题抽象化,用明确的数据表示出双方的博弈的收益,这些不同策略组合下的收益则是双方互动选择的结果。
5、博弈论和经济学都是基于“理性人”的假设,人们都是追求自身利益的最大化。
以性别战博弈为例,女生选择芭蕾时,尽管男生更偏好足球,但此时他为使收益最大化,会选择芭蕾,即男生的最适反应是芭蕾。
同样,男生选择足球时,尽管女生更偏好芭蕾,但此时她为使收益最大化,会选择足球,即女生的最适反应是足球。
6、
(1)博弈双方是在比较每个策略下自己的受益而做出选择,得益值的绝对值也就失去了意义。
(2)若对受益矩阵修改如下:
囚徒2
坦白
不坦白
囚徒1
坦白
-5,-5
-1,-7
不坦白
-7,-1
0,0
此时,(坦白,坦白)和(不坦白,不坦白)是两个纳什均衡,但如果双方稍作协商,必然会选择(不坦白,不坦白),因为这样双方的收益都能最大化。
7、博弈至少是在两方之间进行的,博弈的过程中双方都是理性的,在理性的指引下做出策略选择,故博弈论应包含理性、互动和决策。
其中理性是前提,互动是过程,决策时结果。
博弈过程中,各方都追求其自身的利益最大化,也就是给定对方的策略,自己的策略总是最优的。
博弈双方的两个最优反应以最适合的方式结合起来,也就是互为最适反应,这就会说博弈论的决策方法。
8、以囚徒困境为例,若双方同时选择抵赖,收益为(-1,-1),此时,双方收益和最大,但这种非纳什均衡的情况是不稳定的。
纳什均衡下,双方的策略为(坦白,坦白),收益为(-8,-8),此时收益明显比双方同时抵赖要低。
纳什均衡是完全自利的双方理性作用的结果,但结果却并非最优。
在现实生活中,在各方同时逐利的前提下,往往会造成结果的次优,如劣币驱逐良币,这也就是说在各方同时理性(追求自身利益的最大化)的情况下,有时会引导出非理性。
9、交互理性指个体的利益与他人的行为有关,或者相互取决于其他人的行为时追求自身利益的意识或能力。
不论是策略互动还是信念互动,都是博弈主体在保证自身利益的前提下,各方的一种交互。
特定主体内心的交互理性是个人追求自身利益最大化;而关联主体之间的交互理性是个体之间利益关联之下,各方在其他人的策略下选定自己的策略。
双方的差别在于参与方数量的不同、主体考虑的角度不同。
10、不是的。
存在多重纳什均衡时,博弈方的决策只会是纳什均衡下的各项策略,不会是随意的。
11、模型是对已有信息的加工和抽象,当通过该模型运算出的结论与之前的假设不相符合,这存在两种可能,一是假设存在错误,另一种是模型本身存在缺陷。
因此,这就要求我们在构建模型时要将严格把握控制变量,减少其对因变量的影响。
12、博弈论是以完全自利人为假设的,也就是说,经济学中的理性人为完全自利人。
这一假设是经济学的基础,实际是有悖于实际生活的,因此就需要更加深入的研究来探讨有限理性下的决策模型和非完全自利人的决策问题。
13、纳什均衡的精炼将最基本的纳什均衡进行扩展,使其适用范围更广。
纳什均衡的三种精炼为“策略支持式”精炼、“信念扩展式”精炼和“自利坚守式”精炼。
它们的区别在于一个对纳什均衡扩展的方向不同,前者由静态扩展至动态,由完全信息扩展至不完全信息;中间方将个体完全理性扩展至有限理性;后者放松了主体的完全自利假设。
14、博弈论就是在个体之间寻求最适策略组合,而纳什均衡是在理性人的假设之下,各方的最适反应,这也就是博弈论的内核之所在。
纳什均衡就是个博弈主体在信念的支持下做出的最优策略的组合,因此博弈均衡就是策略互动均衡与信念互动均衡。
15、不可或缺的关键词是纳什均衡,因为纳什均衡是博弈论的关键性支柱,各类博弈最终的结果都是寻找纳什均衡。
本书从第3章到第10章,遵循由一般到具体,由原理到应用实例,由简单到复杂的原则进行编排,内容充实有序。
第2章博弈逻辑
1、从最简化意义上,博弈均衡就是纳什均衡。
博弈均衡就是互为最适反应,纳什均衡尽管外在表现为特定形式的策略组合,但在完全信息下而隐藏信念互动,而在不完全信息以及非对称信息下,信念互动甚至对博弈均衡的结果产生关键性影响。
策略互动逻辑是指纳什均衡直接表现为一种策略组合,信念互动逻辑是指支撑策略组合的信念互动才是决策的关键动因。
自利互动逻辑是指支撑主体策略选择的自利特征决定了决策的关键特征。
2、颤抖手均衡是纳什均衡思想的扩展。
从理性基础的扩展角度,颤抖手均衡把自利主体可能的犯错行为(决策颤抖)考虑进纳什均衡中,是围绕策略互动,信念互动和自利假设的纳什均衡概念,扩展纳什均衡的思想,强化均衡思维的博弈均衡的概念。
3、以采金矿博弈为例:
由于信念的非对称性,企业家无法让其对手相信其还钱承诺,则均衡为(1,0),社会财富无法增长,而当美德形成,企业家具有遵守承诺的美德,并且资本家也认可这种美德,于是资本家将会借钱给企业家,形成(2,2)的均衡,社会财富增长。
群体性策略互动逻辑是由特殊利益群体的策略选择来决定,个体之间存在特殊的利益关联和相同的策略选择。
4、海萨尼转换盒贝叶斯均衡是建立在信念互动的基础上,信念互动在完全信息的情况下隐藏在策略互动之中。
而在不完全信息和非对称信息中更是影响策略均衡结果的关键因素,由此我们发现信念是一种隐藏在心中,但却一直影响人行为的偏好,从某种意义上是精神信仰,乃至宗教。
如在囚徒困境中,由于博弈方2有义气的信念存在,原本(坦白,坦白)的博弈均衡成为了(抵赖,抵赖)的均衡,两者发生了颠覆性的改变,这就是革命的力量。
5、真正的理性是私利,私利是理性的唯一标准,江湖道义也是一种追求私利的表现。
在法官私恩和江湖道义中,对于博弈方2来说,坦白会产生-6的心理惩罚,这-6是理性的私利,出于不愿让自己心理难受的私利,于是博弈方2选择抵赖,由此产生了“美德”。
而在完全且完美信息的囚徒困境中,只会出现双方都认为对方会坦白,于是“美德”无法产生,私利也无法实现。
6、在真假话博弈中,假定其中一个博弈方相信对方讲真话,而这种相信也被策略对手充分认知,如此的信念互动将引导出帕累托效率的纳什均衡,讲假话的策略选择被排除了,有帕累托效率的纳什均衡精炼实现了。
而在社会稳定诉求的博弈中,会产生(0,0)、(2,2)两种均衡,政府应当引导博弈双方都能在特定阶段共同寻找到策略2选择的信念判断,从而达到更好的均衡(2,2)。
7、狭义自利:
性别战博弈;
广义自利:
拆迁问题;
完全信息:
美苏争霸;
不完全信息:
连锁店博弈;
个体:
美苏争霸;
群体:
资本家和企业家博弈;
8、在群体性策略互动逻辑下,特殊的利益群体中,个体之间存在特殊的利益关联和相同的策略选择,在个体作用微乎其微的特殊博弈环境中,相同利益需求的个体构成特殊利益群体,于是产生了社会群体疯狂事件。
在道德沦丧的社会中,在利益群体的博弈中,由于背叛的存在,(不相信,背叛)将成最终的博弈均衡结果。
于是社会财富无法得到增长,整个社会向下沉沦。
9、在慈善式财富创造的博弈均衡假设中,由于对于商家来说,生产优质产品会使得心理得到极大的满足,由此我们构造:
厂家
消费者
少买
多买
劣质产品
10,-1
10,-2
优质产品
5,2
20,1
从而产生(优质产品,少买)的均衡。
10、瓦尔拉斯均衡指整个经济体系处于均衡状态时,所有消费品和生产要素的价格将有一个确定的均衡值,它们的产出和供给,将有一个确定的均衡量。
在“完全竞争”的均衡条件下,出售一切生产要素的总收入和出售一切消费品的总收入必将相等。
博弈逻辑是研究理性的行动者或参与者在互动过程中如何选择策略或如何做出行动的逻辑。
从经济观念来看,博弈逻辑是基于经济个体的行为逻辑,要保证经济问题分析的正确性,就必须要保证任何现实行动的主体一定要具有符合博弈逻辑的个体理念,自利观念和理性观念。
所以博弈论是现在经济学一个特别重要的组成部分。
11、
博弈方1
博弈方2
高尚
卑鄙
高尚
5,5
-2,2
卑鄙
2,-2
0,0
第1、2节,是对人类生存世界的黑暗体验并由此产生质疑。
在诗中所描绘的世界里,卑鄙者以卑鄙的手段可以在世上畅行,高尚者的高尚品行却使其自身走向墓地。
“镀金的天空”喻示着以辉煌的表象掩盖了一个时代真正的黑暗,到处是歌功颂德,到处是粉饰太平,人性被扭曲成“弯曲的倒影”四处凋落。
博弈方1
博弈方2
相信
不相信
相信
2,2
3,1
不相信
1,3
0,0
从第3节开始,“我”作为抒情主体,出现在一片死寂、冰凉、规则混乱和缺乏公正的世界,以一种理性的声音,开始对世俗世界审判、否定和挑战,对一切习以为常的规则表示质疑:
“我——不——相——信!
”
12、从经济观念来看,个体观念是站在自我本体立场上各自依据各自主观价值的独立判断,自利观念是与个体观念相依托,是不必证明的先验判断,而理性观念是主体行为的观念标准。
从经济行为来看,逐利源于人类天性,在追求利益最大化的同时,也会寻求损失最小化。
同时特定主体也具有不可更改的信念判断。
所以政府在制定决策时,也一定要考虑到上文所述的观念的行为,只有均衡,理性,微观的政策才能长久有效的实行。
例如将贫民区搬到富人区,希望发达带动落后,但是由于人对于逐利的理性观念,使得这种理想化的政策无法实行。
第3章完全信息博弈
1、完全信息博弈分析纯粹自利支配个人行动的博弈均衡,将经济问题高度抽象为具有完全理性和完全信息的博弈问题,是经济问题分析的极度深化。
囚徒困境博弈:
生产优质和劣质产品的生产者与多买和少买商品的消费者博弈,双方都基于完全自利和完全信息的支配下,生产者不相信消费者愿意多花钱买更多的优质产品,从而生产劣质产品;消费者不相信生产者会多生产优质产品,从而花更低的价格少买商品。
最终博弈的结果就是厂商生产更多的劣质产品,消费者用较低的价格买较少的商品,个人和社会效用并没有达到最优。
斗鸡博弈:
三星手机厂商与苹果手机厂商在某技术研发方面的竞争也属于斗鸡博弈。
双方同时投入研发,增加双方研发投入和产品竞争成本,若只有其中一人研发,研发者获取更大收益,若都不研发,则减少相应成本。
性别战博弈与猜硬币博弈当中,在现实经济博弈过程中,若博弈双方对其策略选择并不是百分之百的倾向,而是存在不同的概率,但双方都知道自己和对方的倾向,这时可以用混合策略博弈均衡求解。
2、混合策略纳什均衡是博弈方以概率判断的方式进行策略选择,这种随机选择的概率判断正是博弈主体信息或信念判断不完全性的特殊表现而已,表现为博弈主体对可选策略的不确定性。
从不完全信息博弈的角度看,混合策略纳什均衡是完美贝叶斯均衡的一种特例。
以猜硬币博弈为例,博弈主体双方猜正面和反面各自存在两种概率,由于在互为最适反应的情况下无法得到纯策略纳什均衡,所以根据支付均等化方法,使博弈主体的两种策略选择效用支付值相等,从而得出混合策略均衡解。
3、
表3打假对策博弈
厂家
消费者
少买(p)
多买(1-p)
劣质产品(q)
5,-7
-3,0
优质产品(1-q)
0,4
0,0
(1)如上表3打假对策博弈所示,在互为最适反应的完全信息博弈条件下,不存在打假对策的纯策略纳什均衡。
因此,只能通过求混合策略纳什均衡的方式来球均衡解。
厂家和消费者各自策略选择的概率如上表中小括号所示,给定p,厂家选择“劣质铲平”的支付值为:
5p-3(1-p);选择“优质产品”的支付值为:
0。
根据混合策略支付均等方法,令5p-3(1-p)=0,得出p=3/8。
给定q,消费者选择“少买”的支付值为:
-7q+4(1-q);选择“多买”的支付值为:
0。
根据支付均等方法,令-7q+4(1-q)=0,得出q=4/11。
因此,打假对策博弈的混合策略均衡解为(3/8,4/11),即消费者以3/8的概率选择少买,厂商4/11的概率选择劣质产品。
(2)当社会上厂家认为消费者愿意花更多的钱买更多的买优质产品,更少的买劣质产品,以及消费者更愿意相信厂家生产的更多是优质产品时,或者国家出台相应假冒伪劣产品严厉的惩罚措施,提高产品信息透明度,让消费者清楚了解优质产品的价值和劣质产品的坏处,打假对策将对得到纯策略纳什均衡(优质产品,多买)。
这里面,只需要将消费者生产优质产品的支付值分别增加到6和7,消费者多买的支付值都增加到7就能够实现。
(3)若在完全信息博弈条件下,改变支付值得到一个纯策略均衡(劣质产品,少买);但即使若在动态博弈环境下,无论谁具有先行优势,在狭义自利互动下,仍然无法改变(劣质产品,少买)的囚徒困境均衡
4、
表4智猪博弈(小国占优)
小猪
大猪
踩
不踩
踩
1.5,3.5
-0.5,6
不踩
5,0.5
0,0
智猪博弈中,在完全信息博弈的互为最适反应条件下,小猪必然会选择“不踩”策略,而大猪不能忍受任何利益的损失,只能选择“踩策略”。
其现实意涵就在于,在小国与大国的利益博弈过程中,小国需要抓住大国不愿利益受到任何损失的弱点,积极构建利于自身最有优势策略选择地位的条件,使大国只能服从自己的最优策略选择。
就比如,中国所主导的APEC组织,中国在该组织中起主导地位,拥有绝对的话语权,而美国若不加入这个组织将会失去很多利益,但若要加入这个组织,则必须服从中国的话语权。
表5智猪博弈(弱国无外交)
小猪
大猪
踩
不踩
踩
1.5,3.5
1,6
不踩
-1,0.5
0,3
如上表5所示“弱国无外交”的智猪博弈中,由于大猪在能力、资源等各方面的条件都优于小猪,所以无论大猪选择“踩”还是“不踩”策略,小猪都只能向大猪妥协选择“踩策略”,才能最大化自己的利益;而当小猪选择“踩”的策略时,大猪选择“不踩”的策略能实现最大化利益。
其现实意涵为,大国有其强力优势,小国在大国面前只能选择屈服于大国才能保全自己微弱的利益,否则损失更大,而且在小国选择与大国诚心合作的情况下,大国可以随意选择不合作以获取更大利益,此谓“弱国无外交”。
5、表6转型升级博弈
政府政策
企业生产方式选择
传统生产方式
转型升级生产方式
传统发展政策
0,6
3,0
转型升级发展政策
1,1
8,3
上表6是在汽车厂引擎厂博弈模型基础上构建了转型升级博弈模型,博弈参与者有政府(政策),企业(生产方式选择);支付值在原汽车厂引擎厂的基础上稍有改变,纯策略纳什均衡结果也变为唯一的(转型升级发展政策,转型升级生产方式)。
在未改变支付值之前,存在两个纯策略纳什均衡,(传统政策,传统方式),(转型升级政策,转型升级方式),其总社会效用相等。
但政府为了实现国家产业转型升级,实现更长远、更大的社会效用,愿意出台政策,使传统发展政策的效用支付由3,变为0,即政府愿意牺牲暂时的税收和就业等效用收入,促进产业转型升级;在这种情况下,企业也明知政府的政策意图,会意识到从长远上来看,政府的转型升级政策会给企业带来更大的政策红利,因而会选择转型升级方式,在这种策略和信念互动的情况下,得到唯一纯策略纳什均衡(转型升级政策,转型升级方式),国家产业转型升级会慢慢形成。
此外,在计划经济向市场经济转型的过程中,政府的政策对市场仍然有很大的导向作用,政府这只有形的手可以引导市场,通过政策调控快速而有力地促进市场的产业转型升级,发挥中国政府调控力的特色优势;中国作为人口大国,其国内市场的需求和消费能力潜力巨大,因此可以引导需求和消费,增大对转型升级产品的需求和消费,促进转型升级。
6、采金矿博弈中,在完全信息博弈条件下,博弈双方基于完全自利理性的人,企业家会选择不还款以获得更大利益,资本家在明知企业家策略选择和不守信的信念条件下,会选择不借款,保证1个单位的利益,但社会总效用最低。
当加入一个打官司博弈环节时,资本家可以通过法律保障利益,企业家有法律限制其不守信行为,资本家会愿意借款,企业家会选择还款,社会生产得以进行,社会总财富得以增加。
7、福利博弈中,并不存在纯策略纳什均衡,因为政府愿意救助愿意找工作的贫民,而不愿救济那些游手好闲坐等救济的贫民;但一般情况下,贫民只有在得不到政府救助时才会找工作,而政府无法准确辨别贫民的这种非对称选择,所以只有通过概率判断的形式寻找混合策略均衡。
在这种博弈情况下,政府只能遵循福利保障与市场机制平衡的原则,让那些确实需要救助的贫民及时得到救助,那些坐等救助的人刺激其找工作。
如果不这样,则会造成社会上大量游手好闲的人存在。
如下表7所示,可以通过改变支付值的相对大小,使得到唯一纯策略纳什均衡结果为(救济,游手好闲)。
其现实意涵在于,若政府欲打造成绝对平等、正义的福利主义政府,对所有贫民实行救助计划,为贫民提供丰厚的救助,政府会在全国乃至全世界得到一个美名,得到很大的效用支付。
但对于贫民而言,其不用工作就能够得到巨大的政府补助,而工作的贫民选择工作却只能得到较少的工资收入,并且还付出劳动力,从而造成社会上大多数人选择游手好闲,社会不再有工作的动力,最终社会财富创造停止。
表7福利博弈(纯策略纳什均衡)
政府
贫民
工作
游手好闲
救济
2,2
3,3
不救济
-1,1
0,0
8、
(1)典型特征:
可能存在所谓的“破坏者”或“建设者”,其策略选择的变化可能对自身利益影响并不大,但对其他博弈方可能产生很大影响。
(2)因为对于某个特定利益主体来说,多主体博弈的破坏者肯能对其他博弈主体造成利益损失,但对于整个社会来说可能带来社会总体效用的增加。
(3)根据“三主体共谋和防共谋”博弈模型,在多主体博弈中,不同的利益判别标准导致对多主体策略选择的破坏性和建设性判别不同,但这都是基于每个博弈方追求自身利益最大化的先验理性假设下形成的,谁也不会偏离这以共同认知,这是分析任何博弈问题可能性的必要前提。
9、
(1)在现实博弈问题中,多主体博弈使得个体的策略互动和信念互动不再突出显像,个体已无法直接影响和觉察博弈的均衡结果,而是基于由相同关联主题组成的群体之间的策略和信念互动博弈,现代经济问题的实质就是各种不同利益集团之间的博弈。
(2)当完全信息博弈的高度抽象性思考对应到经济社会问题分析的极端深刻性要求,通过一种极值化与极端化的逻辑分析构架构建,各种形式经济社会博弈问题的实质内涵被充分显现出来,使自利主体博弈方的道德包袱完全卸下,让所有博弈问题有了共同的论证基础。
10、首先,企业成长是社会帕累托效率提升的基础动力,而企业竞争行为是维持这一动力的源泉,寡头竞争的博弈模型能对产业竞争进行数理化分析;其次,将寡头竞争模型集合起来,产业组织理论化产业经济学的模型体系也就建立了;然后,最经典的寡头竞争模型常常以连续性策略互动的完全信息博弈形式出现,充分体现虚拟性和现实性,使得现代经济社会的深层次难题有了简单的破解之法。
11、完全信息古诺模型构建的最优产量博弈竞争模型;完全信息斯坦伯格模型构建的动态博弈产业组合均衡;完全信息贝特朗模型构建的价格竞争的古诺模型;完全信息霍特林模型构建的企业区位竞争博弈模型,等等。
12、以日元兑美元的折现率与汇率博弈为例,若日元价格与美元价格相同,二者货币发行量相互均衡,折现率和汇率相等;若美元率先定价,日元再确定自身的价格,并且日元接受美元价格作为汇率计算和调整价格,以确定日元的折现率,那么美元发行更多的货币可以是日元升值,提高日元兑美元汇率,折现率提高;发行更少的货币,可以使降低日元兑美元汇率,降低折现率,即美元有绝对的定价权。
13、
(1)在有限重复博弈中,原博弈的一次性博弈有均衡得益数组由于一次性博弈中最差的均衡得益,那么在该博弈的多次重复中,所有不小于个体理性得益的可实现得益,都至少有一个子博弈完美纳什均衡的极限平均得益来实现它们在无限次重复博弈中,博弈主体对于未来博弈结果无法准确预期,但只要关联主题对于未来的利益看得足够的重,折现率足够的大,博弈者就会出于自利动机选择触发策略,实现合作博弈。
(2)以双寡头三价博弈为例,若是有限重复博弈,博弈方第一次选择(H,H)而第二次则选择M,若第一次结果选择其他策略组合,则第二次选择L,而到了第二阶段的(L,L)策略,任何一方都不会偏离;若是无限重复博弈,只要博弈方队未来利益看得足够重,贴现率达到一定的临界值,那么博弈方从第一阶段到最后阶段都不会偏离选择(H,H),合作博弈实现。
14、在完全且完美信息的极端化假设下,作为支撑博弈主体均衡策略行为基础的完全自利假设被凸显,这种伴随共同知识和共同理性的完全自利假设,使策略互动的博弈逻辑找到一个可以先验假定的论证基础。
而这种先验假定也隐含了第三方“自然”的支撑和左右,因为没有这个第三方“自然”的先验假定,博弈主体必然陷入思想悖论,无法逃脱现实决策的行为困境。
15、
(1)以囚徒困境博弈为例,在完全且完美信息特殊假定前提下,博弈双方为完全自利的理性人,始终摆脱不了囚徒困境的均衡结果;但若在不完全信息博弈的条件下,博弈双方不仅存在策略互动,更多的是一种信念互动,江湖道义信念的存在使得博弈主体能够摆脱囚徒困境。
(2)完全信息博弈均衡类型包括:
一是纯策略纳什均衡。
博弈主体完全以其个体自利理性行为偏好做出个体经济效用最大化的互为最适反应决策;二是混合策略纳什均衡。
博弈主体在给定对手策略选择以概率判断的情况下选择最大化自身利益的策略,在混合策略当中根据概率判断随机选择;三是子博弈完美纳什均衡。
博弈主体并不是同时决策,而是存在决策的先后顺序的动态博弈过程时,先行的博弈方具备先行优势,但其必须考虑后行动者的策略互动选择,所以采取逆推归纳法进行决策;四是触发机制下的子博弈完美纳什均衡,也就是有限重复博弈和无限重复博弈均衡。
重复博弈的各个博弈方既有有限次和无限次阶段博弈的每一阶段最大化自己利益的选择,也同时追求所有阶段平均利益或整体利益的最大化。
第四章不完全信息博弈
1、因为在海萨尼转换的这种方式下,原本不利于双方的决策不一定是百分之百的,所以博弈决策必须以一些先验而不必证明的人性假设为基础,在此种方式下有利于博弈方实现最大效益。
在囚徒困境博弈中,当其中一个囚徒在先验判断基础上后验判断出其策略对手百分之百不会选择坦白(P值为0)时,他实际确信其策略对手是百分之百的侠士,维持讲义气的江湖道义是其必然选择。
如此一来,囚徒困境将在特定的策略信念组合下消失,保证江湖道义的策略选择成为了两个囚犯谁也不会偏离的均衡选择。
博弈方1不确定博弈方2是否有义气,能使得博弈方1可能会得到优于(坦白,坦白)决策的博弈结果。
2、对于囚徒1选择坦白的概率判断为P,选择抵赖