ImageVerifierCode 换一换
格式:DOCX , 页数:26 ,大小:40.81KB ,
资源ID:9513130      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/9513130.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(无限重复完全信息博弈的例子.docx)为本站会员(b****7)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

无限重复完全信息博弈的例子.docx

1、无限重复完全信息博弈的例子无限重复完全信息博弈的例子【篇一:无限重复完全信息博弈的例子】四 完全信息重复博弈(完整版)博弈博弈完全信息重复博弈【故事 1: 笑林广记有一个人去理发铺剃头,剃头匠给他剃得很草率。剃完后,这人却付给剃头匠双倍的钱,什么也没说 就走了。一个多月后的一天, 这人又来理发铺子剃头。剃头匠还记得他上次多付了钱, 觉得此人阔绰大方, 为讨其欢心,多赚点钱,便竭力上心,周到细致,多用了一倍的功夫。剃完后,这人便起身付钱,反而少 给了许多钱。剃头匠不愿意,说“上次我为您剃头,剃得很草率,您尚且给了我很多钱;今天我格外用心, 为何反而少付钱呢?”这人不慌不忙地解释道: “今天的剃头

2、钱,上次我已经付给你了;今天给你的钱,正 是上次的剃头钱。”说完大笑而去。两人缓缓地走到山脚下, 回头只见夕阳在山, 照得半天云彩红中泛紫, 蓝天薄雾衬着山顶积雪,实是美艳难以言宣,两人想到在世之时无多,对这丽景更是留念。龙女痴痴的望了一会,忽问: “你说人死 之后,真要去阴世,真是有个阎罗王么?”杨过道: “但愿如此。阴世便有刀山油锅诸般苦刑,也还是阴世 的好。否则,渺渺茫茫,咱俩可永远不能相见聚会了。”小龙女道: “是啊,但愿得真有个阴世才好。听说 黄泉路上有个孟婆,她让你喝一碗汤,阳世种种你便尽都忘了。这碗汤啊,我可不喝。过儿,我要永永远 远记得你的恩情。”她善于自制,虽然心中悲伤,语气

3、还是平平淡淡。杨过却实在忍耐不住了,转过身去, 拭了拭眼泪。小龙女叹道: “幽冥之事,究属渺茫,能够不死,总是不死的好。”。两人又行一阵,在一 片草地上坐了下来。小龙女道: “你还记得那日拜我为师的情景么?”杨过道: “怎不记得?”小龙女道: “你发过誓,说这一生永远听我的话,不管我说什么,你总是不会违拗。”杨过笑道: “你说什么,我 便做什么。师命不敢违,妻命更加不敢违。”小龙女道: “嗯,你可要记得才好。” 。陆无双忽道: “还有一处没去瞧过,说不定她正设法捞那颗绝情丹上来” 。杨过心头一震,没 听她说完,发足便往断肠崖奔去。他一面急奔,一面大呼: “龙儿,龙儿! ”到得崖前,俯视深谷,但

4、见灰 雾蒙蒙,哪有人影?。忽听得隔崖陆无双叫道: 。“杨大哥,你在那边干什么啊?”杨过一回头,猛见崖壁 上用剑尖刻着两行字,一行大的写道: “十六年后,在此重会,夫妻情深,勿失信约。”另一行较小的字写 道: “小龙女书嘱夫君杨郎,珍重万千,务求相聚。” 。黄蓉默默沉思了一会,忽然分享到: 分享到: 使用一键分享,轻松赚取财富值, 嵌入播放器:普通尺寸(450*500pix)较大尺寸(630*500pix)免费大小:960.19kb所需财富值:2登录XX文库,专享文档复制特权,财富值每天免费拿!你可能喜欢【篇二:无限重复完全信息博弈的例子】1.首先行动优势首先行动优势(first-mover a

5、dvantage)是指,在博弈中首先作出战略选择并采取相应行动的参与人可以获得较多的利益.2.确实可信的威胁确实可信的威胁(credible threat)是指,博弈的参与人通过某种行动改变自己的支付函数,从而使得自己的威胁显得可信.参与人为改变博弈结果而采取的措施称为承诺(commitment).第四节 不完全信息静态博弈在许多情况下,参与人对对手的了解往往是不够精确的.这种情况下的博弈就是不完全信息博弈.举例来说,某一市场原来被a企业所垄断.现在b企业考虑是否进入.b企业知道,a企业是否允许它进入,取决于a企业阻挠b企业进入所花费的成本.如果阻挠的成本低,那么,正如表7-10后两列所表示的

6、,a企业的占优战略是阻挠,博弈有重复剔除的占优战略均衡a阻挠,b不进入.如果阻挠的成本高,那么,正如表7-10前两列所表示的,a企业的占优战略是默许b进入,博弈有重复剔除的占优战略均衡a默许,b进入.b企业所不知道的,是a企业的阻挠成本是高是低.这里,某一参与人本人知道、其他参与人则不知道的信息称为私人信息.某一参与人所拥有的全部私人信息称为他的类型.在上述例子中,阻挠成本就是 a的私人信息.高阻挠成本和低阻挠成本则是两种不同的类型.显然,在这里,b所遇到的,是不确定性条件下的选择问题.因为b不仅不知道a的类型(是高还是低),而且不知道不同类型的分布概率.解决这类问题的方法之一,就是把不确定性

7、条件下的选择转换为风险条件下的选择.在风险条件下,b虽然不知道a的类型,但可以知道不同类型的分布概率.将不确定性条件下的选择转换为风险条件下的选择,称为海萨尼转换(the harsanyi transformation)按照海萨尼的方法,所有参与人的真实类型都是给定的.其他参与人虽然不清楚某一参与人的真实类型,但知道这些可能出现的类型的分布概率,而且这种概率是公共知识.用上例来说,公共知识不仅意味着b企业知道a企业高阻挠成本与低阻挠成本的分布概率,而且意味着a也清楚b知道这一概率.通过海萨尼转换,不完全信息博弈变成了完全但不完美信息博弈(games of complete but imperf

8、ect information).这里的不完美信息,就是指其他参与人只知道某一参与人某些方面类型的分布概率,而不知道该参与人在这些方面的真实类型.在上述转换的基础上,海萨尼提出了贝叶斯纳什均衡(bayesian nash equilibrium).对此,可以作如下解释:在不完全信息静态博弈中,参与人同时行动,没有机会观察到别人的选择.给定其他参与人的战略选择,每个参与人的最优战略依赖于自己的类型.由于每个参与人仅知道其他参与人有关类型的分布概率,而不知道其真实类型,因而,他不可能知道其他参与人实际上会选择什么战略.但是,他能够正确地预测到其他参与人的选择与其各自的有关类型之间的关系.因此,该参

9、与人的决策目标就是:在给定自己的类型,以及给定其他参与人的类型与战略选择之间关系的条件下,使得自己的期望效用最大化.贝叶斯纳什均衡是一种类型依赖型战略组合.在给定自己的类型和其他参与人类型的分布概率的条件下,这种战略组合使得每个参与人的期望效用达到了最大化.回到上面提到的市场进入的例子.在这个例子里,对于挑战者b来说,原垄断者a在阻挠成本方面,存在着两种可能性:高成本或低成本.b不知道a的阻挠成本究竟是高是低,但他知道a在这两种不同阻挠成本下会作出的选择,以及不同阻挠成本(类型)的分布概率.假定高成本的概率为x,则低成本的概率为(1-x).如果a的阻挠成本高,a将默许b进入市场;如果a的阻挠成

10、本低,a将阻挠b进入市场.在这两种情况下,如表7-10所示,b进入的支付函数分别是得到40和失去10.因此,b选择进入所得到的期望利润为40x+(-10)(1- x),选择不进入的期望利润为0.简单的计算表明,当a阻挠成本高的概率大于20%时,挑战者b选择进入得到的期望利润大于选择不进入的期望利润.此时,选择进入是b的最优选择.此时的贝叶斯纳什均衡为,挑战者b选择进入,高成本原垄断者选择默许,低成本原垄断者选择阻挠.根据参与者类型的公共知识获得参与者行动的概率,依此决定下一步策略.第五节 不完全信息动态博弈在动态博弈中,行动有先后次序,后行动者可以通过观察先行动者的行为,来获得有关先行动者的信

11、息,从而证实或修正自己对先行动者的判断.如上所述,在不完全信息条件下,博弈的参与人知道其他参与人可能有哪几种类型,也知道不同的类型与相应战略选择之间的关系.但他们并不知道其他参与人的真实类型.在不完全信息静态博弈中,我们是通过海萨尼转换,即通过假定其他参与人知道某一参与人的所属类型的分布概率,来得出博弈的贝叶斯纳什均衡结果的.而在不完全信息动态博弈中,问题变得更加简单.博弈开始时,某一参与人既不知道其他参与人的真实类型,也不知道其他参与人所属类型的分布概率.他只是对这一概率分布有自己的主观判断,即有自己的信念.博弈开始后,该参与人将根据他所观察到的其他参与人的行为,来修正自己的信念.并根据这种

12、不断变化的信念,作出自己的战略选择.对应于不完全信息动态博弈的均衡概念是精炼贝叶斯均衡(perfect bayesian equilibrium).这个概念是完全信息动态博弈的子博弈精炼纳什均衡与不完全信息静态均衡的贝叶斯(纳什)均衡的结合.具体来说,精炼贝叶斯均衡是所有参与人战略和信念的一种结合.它满足如下条件:第一,在给定每个参与人有关其他参与人类型的信念的条件下,该参与人的战略选择是最优的.第二,每个参与人关于其他参与人所属类型的信念,但是使用贝叶斯法则从所观察到的行为中获得的.贝叶斯法则是概率统计中的应用所观察到的现象对有关概率分布的主观判断(即先验概率)进行修正的标准方法.采用上一节

13、的例子,可以将贝叶斯规则的分析思路表达如下.挑战者b不知道原垄断者a是属于高阻挠成本类型还是低阻挠成本类型,但b知道,如果a属于高阻挠成本类型,b进入市场时a进行阻挠的概率是20%(此时a为了保持垄断带来的高利润,不计成本地拼命阻挠);如果a属于低阻挠成本类型,b进入市场时a进行阻挠的概率是100%.博弈开始时,b认为a属于高阻挠成本企业的概率为70%,因此,b估计自己在进入市场时,受到a阻挠的概率为:0.44是在b给定a所属类型的先验概率下,a可能采取阻挠行为的概率.当b进入市场时,a确实进行阻挠.使用贝叶斯法则,根据阻挠这一可以观察到的行为,b认为a属于高阻挠成本企业的概率变成根据这一新的

14、概率,b估计自己在进入市场时,受到a阻挠的概率为:如果b再一次进入市场时,a又进行了阻挠.使用贝叶斯法则,根据再次阻挠这一可观察到的行为,b认为a属于高阻挠成本企业的概率变成这样,根据a一次又一次的阻挠行为,b对a所属类型的判断逐步发生变化,越来越倾向于将a判断为低阻挠成本企业了.以上例子表明,在不完全信息动态博弈中,参与人所采取的行为具有传递信息的作用.尽管a企业有可能是高成本企业,但a企业连续进行的市场进入阻挠,给b企业以a企业是低阻挠成本企业的印象,从而使得b企业停止了进入地市场的行动.应该指出的是,传递信息的行为是需要成本的.假如这种行为没有成本,谁都可以效仿,那么,这种行为就达不到传

15、递信息的目的.只有在行为需要相当大的成本,因而别人不敢轻易效仿时,这种行为才能起到传递信息的作用.传递信息所支付的成本是由信息的不完全性造成的.但不能因此就说不完全信息就一定是坏事.研究表明,在重复次数有限的囚徒困境博弈中,不完全信息可以导致博弈双方的合作.理由是:当信息不完全时,参与人为了获得合作带来的长期利益,不愿过早暴露自己的本性.这就是说,在一种长期的关系中,一个人干好事还是干坏事,常常不取决于他的本性是好是坏,而在很大程度上取决于其他人在多大程度上认为他是好人.如果其他人不知道自己的真实面目,一个坏人也会为了掩盖自己而在相当长的时期内做好事.根据参与者类型的公共知识以及参与者历史行为

16、来获得参与者行动的概率,依此决定下一步策略【篇三:无限重复完全信息博弈的例子】1 / 26 完全信息 【故事 1: 笑林广记 有一个人去理发铺剃头,剃头匠给他剃得很草率。剃完后,这人却付给剃头匠双倍的钱,什么也没说就走了。一个多月后的一天, 这人又来理发铺子剃头。剃头匠还记得他上次多付了钱, 觉得此人阔绰大方,为讨其欢心,多赚点钱,便竭力上心,周到细致,多用了一倍的功夫。剃完后,这人便起身付钱,反而少给了许多钱。剃头匠不愿意,说 上次我为您剃头,剃得很草率,您尚且给了我很多钱;今天我格外用心,为何反而少付钱呢? 这人不慌不忙地解释道: 今天的剃头钱,上次我已经付给你了;今天给你的钱,正是上次的

17、剃头钱。说完大笑而去。】 问:剃头匠为什么对同一个人提供的两次服务截然不同? 【故事 2: 神雕侠侣 三十二回 情是何物】 。两人缓缓地走到山脚下, 回头只见夕阳在山, 照得半天云彩红中泛紫, 蓝天薄雾衬着山顶积雪,实是美艳难以言宣,两人想到在世之时无多,对这丽景更是留念。龙女痴痴的望了一会,忽问: 你说人死之后,真要去阴世,真是有个阎罗王么? 杨过道: 但愿如此。阴世便有刀山油锅诸般苦刑,也还是阴世的好。否则,渺渺茫茫,咱俩可永远不能相见聚会了。小龙女道: 是啊,但愿得真有个阴世才好。听说黄泉路上有个孟婆,她让你喝一碗汤,阳世种种你便尽都忘了。这碗汤啊,我可不喝。过儿,我要永永远远记得你的恩

18、情。她善于自制,虽然心中悲伤,语气还是平平淡淡。杨过却实在忍耐不住了,转过身去,拭了拭眼泪。小龙女叹道: 幽冥之事,究属渺茫,能够不死,总是不死的好。两人又行一阵,在一片草地上坐了下来。小龙女道: 你还记得那日拜我为师的情景么? 杨过道: 怎不记得? 小龙女道: 你发过誓,说这一生永远听我的话,不管我说什么,你总是不会违拗。杨过笑道: 你说什么,我便做什么。师命不敢违,妻命更加不敢违。小龙女道: 嗯,你可要记得才好。陆无双忽道: 还有一处没去瞧过,说不定她正设法捞那颗绝情丹上来 。杨过心头一震,没听她说完,发足便往断肠崖奔去。他一面急奔,一面大呼: 龙儿,龙儿! 到得崖前,俯视深谷,但见灰雾蒙

19、蒙,哪有人影?。忽听得隔崖陆无双叫道: 杨大哥,你在那边干什么啊? 杨过一回头,猛见崖壁上用剑尖刻着两行字,一行大的写道: 十六年后,在此重会,夫妻情深,勿失信约。另一行较小的字写道: 小龙女书嘱夫君杨郎,珍重万千,务求相聚。黄蓉默默沉思了一会,忽然两眼发亮,双手一拍,笑道: 过儿,大喜,大喜! 杨过惊喜交集,颤声道: 你说。说是喜讯么? 黄蓉道: 这个自然。龙家妹子遇到了南海神尼, 当真是旷世奇缘。黄蓉道: 我爹爹说,每隔十六年,她老人家便来中土一行,恶人撞到了她那是前世不修。好人遇到了,她老人家必有慈悲。龙家妹子这等美艳如仙的人物, 她老人家定是十分欢喜, 将她收作徒儿, 带到南海去了。十

20、六年后十六年后杨过再来到断肠崖杨过再来到断肠崖 此刻再临旧地,但见荆莽森森,空山寂寂,仍是毫无曾经有人到过的迹象,当下奔到断肠崖前,走过石梁,抚着石壁上小龙女用剑尖划下的字迹,手指嵌入每个字的笔划之中,一笔笔的将石缝中的青苔揩去, 那两行大字小字显了出来。这一日中, 他便如此痴痴的望着那两行字发呆 。这般苦苦等候了五日,已到了三月初七,他已两日两夜未曾交睫入睡, 。却哪里有小龙女的影踪。他便如一具石像般在山顶呆立了一夜,直到红日东升。四下里小鸟鸣啾,花香浮动,春意正浓,他心中却如一片寒冰,似有一个声音在耳际不住响动: 傻子!她早死了,在十六年之前早就死了。她自知中毒难愈,你决计不肯独活,因此图

21、了自尽,却骗你等她十六年。傻子,她待你如此情谊深重,你怎么到今日还不明白她的心意? 。奔到断肠崖前,瞧着小龙女所刻下的那几行字,大声叫道: 十六年后,在此重会,夫妻情深,勿失信约!小龙女啊小龙女!是你亲手刻下的字,怎地你不守信约? 。他自来便生性激烈,此时万念俱灰,心想: 龙儿既已在十六年前便即逝世,我多活这十六年实在无谓之至。望着断肠崖前那个山谷,只见谷口烟雾缭绕。他轻轻说道: 当年你突然失踪,不知去向,我寻遍山前山后,找不到你,那时定是跃入了这万丈深谷之中,这十六年,难道你不怕寂寞吗? 泪眼模糊,眼前似乎幻出了小龙女白衣飘飘的影子,又隐隐似乎听到小龙女在谷底叫道: 杨郎,杨郎,你别伤心,别

22、伤心! 杨过双足一蹬,身子飞起,跃入了深谷之中。完全信息重重复博弈复博弈 完全信息重复博弈 2 / 26 重复博弈重复博弈 以前讨论的动态博弈基本上都有一个特征, 即参与人在前一个阶段的行动选择决定随后的子博弈的结构,因此从后一个决策结开始的子博弈不同于从前一个决策结开始的子博弈,或者,同样结构的子博弈只出现一次。房地产开发博弈中,开发商 a 选择 开发 后的子博弈就不同于选择 不开发 后的子博弈。这样的博弈称为序贯博弈。动态博弈的另一种特殊但是非常重要的类型是 重复博弈 ,重复博弈就是同样结构的的博弈重复多次,其中的每次博弈称为 阶段博弈 (stage game) 。重复博弈有 3 个基本特

23、征: 阶段博弈之间没有物理上的联系(no physical link) ,即前一个阶段博弈的结果不改变后一个阶段博弈的结构 (例: 石头、剪刀、布) 每个参与人都能观察到博弈过去的历史,即过去发生的事情 (合作还是背叛) 每个参与人得到的最终报酬是各个阶段博弈支付的贴现值之和 ? 重复博弈中参与人的策略 在单次囚犯困境博弈中,参与人只有两种选择:合作(抵赖)还是不合作(坦白) 。每个参与人的选择没有办法建立在对方如何行动的基础上。但是在重复博弈中, 由于参与人过去的行动历史是可以被观察到的, 每个参与人就可以把自己今天的选择建立在其他参与人行动历史的基础之上。比方说,你过去欺骗过我,那么我这次

24、就不选择与你合作,或者我也同也欺骗你一次;咱们过去合作很愉快,那么我这次也选择与你合作。由于过去历史的多样化,当前行动和历史关联的方式也多种多样,这就使得每个人的策略空间大大扩展了。正是这种可能性使得合作有可能作为均衡结果出现。定义: (1)一个博弈在时期 的历史历史 h 是在所有时期合)的列表(list) (2)某个参与者在重复t 次博弈中的策略策略是一个由该参与者在每个时期t(t,.,t21=) 所采取行动的序列 (列表) , 每个时期t的行动h 到行动a 的一个映射) 一个例子: 战争与和平 国家 1 战争(w) 和平(p) 12,1 = ,.,t博弈结果(即策略组iitaa 是以该博弈

25、在时期t的历史为基础的(即ita 建立了从历史ti 在单次博弈中, 均衡结果是两个国家都会选择战争, 尽管和平对双方来说都是最好的。这是个典型的囚徒困境。(?)该博弈重复两次,那么国家 1 纯策略集中共有多少策略? 首先考虑第二期。第二期会有可能的 4 种历史, 它们是由第一期参与者的 4 种不同的行动序列决定的。第二期的历史满足,w(h 2对每一种历史,国家 1 可以采取的行动行动(非策略)有)p,p( ),w,p( ),p,42 个,联同第一期的两个行动,当博32个。p,w( ),w。在第二期,针w两种。策略必须指定在每种给定历史下的行动,因此在第二期国家 1 的行动弈重复两次时,国家 1

26、 的纯策略数量一共是(?)如果博弈重复 3 次,那么国家 1 的纯策略数有多少个? 简记b)p,w( , a)w,w(=弈之后的结果有 4 种,即),w,w(行动数量共有2 42=d,连同第一期博弈后的 4 种结果bb,ba,ad,ac,ab)p,ppaa,p(),( ,cw,h 3)(w,pp,( ,w(=p。考虑第三期,由于第二期博),),可知,第三期的历史历史共有1644= 个,即:dd,dc,db,da,cd,cc,cb,ca,bd,bc, 基于第三期的历史,第三期的行动数 2 个,该博弈重复三次后国家 1 的纯策略共有 行动共有共有162个,连同第二期行动个数22 42 和第一期的行

27、动个2097152个! 2221164=国家 2 战争(w) 1,1 3,0 和平(p) 0,3 2,2 完全信息重复博弈 3 / 26 策略是从信息集到行动空间的映射,上述方法其实是在利用信息集计算纯策略个数 如果博弈重复两次,国家 1 在第二期有 4 种历史,也就是有 4 个信息集,连同第一期的 1 个信息集,那么写出国家 1 的策略共需要 5 个步骤,每个步骤(信息集)可以有两种选择。因此国家 1 的纯策略数总共有222 (w;p,w,w,p ) 。如果博弈重复三次,那么国家 1 在第三期有么连同第二期的 4 个信息集和第 1 期的一个信息集,国家 1 共有 21 个信息集,每个信息集上

28、可以有两种行为选择,因此国家 1 的纯策略数总共有是(w;p,w,w,p;p,w,p,p,w,w,w,p,w,w,w,w,p,p,p,w) 。重复博弈的支付 重复博弈中每个参与人得到的总支付是各个阶段博弈支付的贴现值之和。贴现系数(因子) :111 +=)r/( ,计算明天的 1 元钱值今天多少。贴现因子反映的是参与人的耐心程度, 越大意味着一个人越重视未来。今天的 1 元钱是 1 元钱;明天的 1元钱值今天的 ,后天的 1 元钱值今天的 ;如此等等,离现在越远的 1 元钱在今天越不值钱。反过来,过去某种价值放在今天会变得更加珍贵。例子: ? 大晏: 满目河山空念远,落花风雨更伤春,不如怜取眼

29、前人 ? 红杏尚书: 为君持酒劝斜阳,且向花间留晚照 ? 纳兰: 被酒莫惊春睡重,赌书消得泼茶香,当时只道是寻常 ? 不思过去,不思将来,把握当下 :禅宗的思想,将贴现系数瞬间调整到 0 ? 庄子 齐物论 :狙公赋芧(xu?) ,曰: 朝三而暮四。众狙皆怒。曰: 然则朝四而暮三。众狙皆悦。名实未亏而喜怒为用,亦因是也。t 次重复博弈的某博弈方,某一均衡下各阶段支付分别为总支付的贴现值为: 5222= 个。例如,国家 1 的纯策略之一是1644= 种历史,也即 16 个信息集,那212 个。例如,国家 1 的纯策略之一? 2t,., 21,则重复博弈的 =t =+=ttttt.1113221 给

30、定贴现因子 ,若在无限次重复博弈一路经下,某博弈方各阶段支付为,.,21 则该博国家 国家 国家 国家 国家 国家 国家 国家 国家 国家 国家在第二期有种历史 国家在第三期有 16 种历史 w p w p w p 国家 国家 完全信息重复博弈 4 / 26 弈方总支付的贴现值就是: =t =+113221tt. 定义:如果一个常数 作为重复博弈各个阶段的支付,能产生与支付序列贴现值,则称 为,.,2 的平均支付平均支付。无限次重复博弈每阶段支付都是 时,贴现值为: )/( 1【即 ,.,21 相同的1 )/(.)( =+112】 而每阶段博弈支付为,.,21 时,无限次重复博弈的支付的贴现值

31、是 = 11ttt ,因此令 =t =1t = 111tt)/( , 得到: =11tt)( 这就是计算无限次重复博弈平均支付的公式。平均支付是贴现值之和的标准化(标准化因子是可以直接与阶段博弈支付比较, 因为平均支付用相同的单位度量阶段博弈支付和重复博弈支付。如果一个策略组合给出每阶段 2 单位的支付,另一个策略组合给出平均支付 1(每阶段支付可能不同) ,我们说参与人从前一个策略组合中得到的支付大于从后一个策略组合中得到的支付。后面将要介绍的无名氏定理无名氏定理中的支付应该被理解为平均支付。随机停止随机停止 将 作一些扩展,我们就可以把随机结束的重复博弈与无限次重复博弈统一起来。典型的随机结束重复博弈可以理解为在进行一个重复博弈时, 每次都通过抽签来决定是否停止重复,如果抽到停止重复的概率为 p ,则抽到重复下去的概率为t ,利率为r ,因为在第一次博弈以后能够继续下一次重复的可能性是p 1,因此第二阶段的期望支付为p( 12 22311)r/()p(+ , 所以该博弈方在该重复博弈中的期望支付的贴现值为: 1) 。使用平均支付的优越性在于? p 1。设某博弈方在此博弈中的阶段支付为)r/()+1。进一步,第三阶段的期望支付为.)r/()p()r/()p(+ + +=223211111 =t =t =+ =111111tttt)rp( 令 =+

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1