博弈论课件4-重复博弈.ppt

资源描述

博弈论课件4-重复博弈.ppt

《博弈论课件4-重复博弈.ppt》由会员分享，可在线阅读，更多相关《博弈论课件4-重复博弈.ppt（50页珍藏版）》请在冰豆网上搜索。

博弈论课件4-重复博弈.ppt

第四章重复博弈前言前言l重复博弈不是基本博弈的简单叠加，必须把重复博弈过重复博弈不是基本博弈的简单叠加，必须把重复博弈过程作为整体进行研究程作为整体进行研究l大多数重复博弈是静态博弈的重复，而重复博弈又是一大多数重复博弈是静态博弈的重复，而重复博弈又是一个动态的过程，属于动态博弈的范畴，前两章的分析是个动态的过程，属于动态博弈的范畴，前两章的分析是本章的基础本章的基础主要内容主要内容l4.1重复博弈引论重复博弈引论l4.2有限次重复博弈有限次重复博弈l4.3无限次重复博弈无限次重复博弈4.1重复博弈引论重复博弈引论l4.1.1为什么研究重复博弈为什么研究重复博弈l4.1.2基本概念基本概念l生活中的重复博弈生活中的重复博弈你到菜场去买菜，当你担心上当受骗而犹豫不决时，卖菜的你到菜场去买菜，当你担心上当受骗而犹豫不决时，卖菜的摊主便会对你说摊主便会对你说:

“:

“你放心好了，我天天在这里卖菜，不会你放心好了，我天天在这里卖菜，不会骗你的，如果菜不好你回来找我！

骗你的，如果菜不好你回来找我！

”他强调自己他强调自己“天天天天”在在这里卖菜，你通常便会放下心来，与之成交。

因为他的这句这里卖菜，你通常便会放下心来，与之成交。

因为他的这句话翻译成经济学的语言就是话翻译成经济学的语言就是“我跟你是我跟你是重复博弈重复博弈”!

而一次性的买卖往往发生在双方以后不再有买卖机会的时候，而一次性的买卖往往发生在双方以后不再有买卖机会的时候，特点是尽量谋取暴利并且带欺骗性，比如车站、码头、旅游特点是尽量谋取暴利并且带欺骗性，比如车站、码头、旅游景点的东西往往质次价高，其原因就在于买卖双方景点的东西往往质次价高，其原因就在于买卖双方很少有很少有“重复博弈重复博弈”的机会的机会。

l在公共汽车上，两个陌生人会为一个座位争吵，因为彼在公共汽车上，两个陌生人会为一个座位争吵，因为彼此知道，这是此知道，这是一次性博弈一次性博弈，吵过了谁也不会再见到谁，吵过了谁也不会再见到谁，因此谁也不肯在嘴上吃亏；可如果他们相互认识，就会因此谁也不肯在嘴上吃亏；可如果他们相互认识，就会相互谦让，因为他们知道，二者以后还会有碰面甚至交相互谦让，因为他们知道，二者以后还会有碰面甚至交往的可能。

两个朋友因为什么事情发生了争吵，如果不往的可能。

两个朋友因为什么事情发生了争吵，如果不想彻底决裂，通常都会在争吵中留有余地，因为二人日想彻底决裂，通常都会在争吵中留有余地，因为二人日后还要后还要“重复博弈重复博弈”。

4.1.1为什么研究重复博弈为什么研究重复博弈l长期反复合作与竞争关系的存在长期反复合作与竞争关系的存在例：

两企业的长期竞争，长期协议，回头客例：

两企业的长期竞争，长期协议，回头客l长期关系比短期关系更加复杂，考虑当前也要兼顾未长期关系比短期关系更加复杂，考虑当前也要兼顾未来来l一般动态博弈环环相扣；长期关系中，经济活动各个一般动态博弈环环相扣；长期关系中，经济活动各个阶段之间的相互独立性阶段之间的相互独立性例：

回头客例：

回头客信誉、信任信誉、信任4.1.2基本概念基本概念l重复博弈的定义重复博弈的定义同样结构的博弈重复多次，其中每次博弈同样结构的博弈重复多次，其中每次博弈称为称为“阶段博弈阶段博弈”。

l重复博弈的分类重复博弈的分类有限次重复博弈、无限次重复博弈、随机有限次重复博弈、无限次重复博弈、随机结束的重复博弈。

结束的重复博弈。

有限次重复博弈：

给定一个基本博弈给定一个基本博弈GG（可以是静态博弈，也（可以是静态博弈，也可以是动态博弈），重复进行可以是动态博弈），重复进行TT次次GG，并且在每次重复，并且在每次重复GG之前各博之前各博弈方都能观察到以前博弈的结果，这样的博弈过程称为弈方都能观察到以前博弈的结果，这样的博弈过程称为“GG的的TT次重复博弈次重复博弈”，记为，记为G（T）G（T）。

而。

而GG则称为则称为G（T）G（T）的的“原博弈原博弈”。

G（T）G（T）中的每次重复称为中的每次重复称为G（T）G（T）的一个的一个“阶段阶段”。

注意：

重复博弈与一般动态博弈的区别，每个阶段都有得益，重复博弈与一般动态博弈的区别，每个阶段都有得益，每个阶段的博弈方和博弈内容都相同每个阶段的博弈方和博弈内容都相同4.1.2基本概念基本概念l无限次重复博弈：

无限次重复博弈：

一个基本博弈一个基本博弈GG一直重复博弈下去的一直重复博弈下去的博弈，用博弈，用表示。

表示。

l如果某个重复博弈没有可以预见的结束时间，各博弈方如果某个重复博弈没有可以预见的结束时间，各博弈方主观上认为博弈会不断进行下去，就可以看作是无限重主观上认为博弈会不断进行下去，就可以看作是无限重复博弈。

复博弈。

l随机结束的重复博弈：

随机结束的重复博弈：

重复的次数虽然有限，但重复的重复的次数虽然有限，但重复的次数或博弈结束的时间却是不确定的。

次数或博弈结束的时间却是不确定的。

l策略策略在每个阶段（即每次重复），针对每种情况在每个阶段（即每次重复），针对每种情况（以前阶段的结果）如何行为的计划。

（以前阶段的结果）如何行为的计划。

l子博弈子博弈从某个阶段（不包括第一阶段）开始，包括从某个阶段（不包括第一阶段）开始，包括此后所有的重复博弈部分。

仍然可以应用逆推归纳法来此后所有的重复博弈部分。

仍然可以应用逆推归纳法来分析。

分析。

l均衡路径均衡路径由每个阶段博弈方的行为组合串联而成。

由每个阶段博弈方的行为组合串联而成。

重复博弈的路径数目：

。

l重复博弈使博弈有了更多的可能，分析重复博弈就是要重复博弈使博弈有了更多的可能，分析重复博弈就是要在这些路径中找出具有稳定性的均衡路径，并分析它们在这些路径中找出具有稳定性的均衡路径，并分析它们的效率意义。

的效率意义。

4.1.2基本概念基本概念4.1.2基本概念基本概念l重复博弈的得益重复博弈的得益总得益、平均得益总得益、平均得益重复博弈中的博弈方的行为、策略选择不可能只考虑本重复博弈中的博弈方的行为、策略选择不可能只考虑本阶段的得益，而必须兼顾其它阶段的得益，或者说会考虑整阶段的得益，而必须兼顾其它阶段的得益，或者说会考虑整个重复博弈过程的总体情况。

个重复博弈过程的总体情况。

11、总得益：

博弈方各次重复得益的总和、总得益：

博弈方各次重复得益的总和22、平均得益：

总得益除以重复次数、平均得益：

总得益除以重复次数l贴现系数：

贴现系数：

4.1.2基本概念基本概念l无限次重复博弈时无限次重复博弈时4.1.2基本概念基本概念l随机停止和贴现率随机停止和贴现率将典型的随机结束重复博弈理解成在进行一个重复博弈将典型的随机结束重复博弈理解成在进行一个重复博弈时，每次都通过抽签来决定是否停止重复，假设抽到时，每次都通过抽签来决定是否停止重复，假设抽到停止重复的概率为停止重复的概率为pp，则抽到重复下去的概率为，则抽到重复下去的概率为1-p1-p，设，设某博弈方在此博弈中的阶段得益为某博弈方在此博弈中的阶段得益为，利率为，利率为，则该，则该博弈方在重复博弈中期望得益的现值为：

博弈方在重复博弈中期望得益的现值为：

把已知概率的随机停止重复博弈与无限次重复博弈统一把已知概率的随机停止重复博弈与无限次重复博弈统一起来，随机停止重复博弈问题可以当作无限次重复博弈起来，随机停止重复博弈问题可以当作无限次重复博弈来进行分析。

来进行分析。

4.2有限次重复博弈有限次重复博弈l4.2.14.2.1两人零和博弈的有限次重复博弈两人零和博弈的有限次重复博弈l4.2.24.2.2惟一纯策略纳什均衡的有限次重复博弈惟一纯策略纳什均衡的有限次重复博弈l4.2.34.2.3多个纯策略纳什均衡的有限次重复博弈多个纯策略纳什均衡的有限次重复博弈l4.2.44.2.4有限次重复博弈的无名氏定理有限次重复博弈的无名氏定理4.2.1两人零和博弈的有限次重复博弈两人零和博弈的有限次重复博弈l猜硬币博弈猜硬币博弈l零和博弈是严格竞争的，重复博弈并不改变这一点。

零和博弈是严格竞争的，重复博弈并不改变这一点。

l重复零和博弈不会创造出新的利益。

重复零和博弈不会创造出新的利益。

-1，11，-11，-1-1，1正面反面猜硬币方猜硬币方盖盖硬硬币币方方正面反面4.2.1两人零和博弈的有限次重复博弈两人零和博弈的有限次重复博弈l以以零和博弈零和博弈为原博弈的有限次重复博弈与猜硬币博为原博弈的有限次重复博弈与猜硬币博弈的有限次重复博弈一样，弈的有限次重复博弈一样，博弈方的正确策略是重博弈方的正确策略是重复一次性博弈中的纳什均衡策略。

复一次性博弈中的纳什均衡策略。

l可用逆推归纳法来证明可用逆推归纳法来证明l可以推广到非零和或多个博弈方，但博弈方的利益可以推广到非零和或多个博弈方，但博弈方的利益严格对立，没有纯策略纳什均衡的其他严格竞争博严格对立，没有纯策略纳什均衡的其他严格竞争博弈中弈中l产生原因：

产生原因：

利益关系严格对立，矛盾不可调和利益关系严格对立，矛盾不可调和4.2.2惟一纯策略纳什均衡的有限次重复博弈惟一纯策略纳什均衡的有限次重复博弈情形一：

情形一：

惟一纯策略纳什均衡是帕累托效率意义惟一纯策略纳什均衡是帕累托效率意义上的最佳策略组合上的最佳策略组合情形二：

情形二：

原博弈惟一的均衡没有达到帕累托效率，原博弈惟一的均衡没有达到帕累托效率，存在通过合作进一步提高效率的可能性，例如：

存在通过合作进一步提高效率的可能性，例如：

囚徒困境博弈囚徒困境博弈4.2.2惟一纯策略纳什均衡的有限次重复博弈惟一纯策略纳什均衡的有限次重复博弈有限次重复的囚徒困境博弈有限次重复的囚徒困境博弈假定进行两次重复博弈，双方看到第一次博弈的结果后再进行第二假定进行两次重复博弈，双方看到第一次博弈的结果后再进行第二次博弈，最后得益是两阶段各自得益的和。

次博弈，最后得益是两阶段各自得益的和。

用逆推归纳法，先分析第二阶段，再分析第一阶段。

-5，-50，-8-8，0-1，-1坦白不坦白囚徒囚徒2坦白不坦白囚囚徒徒1（-5，-5）-10，-10-13，-5-5，-13-6，-6坦白不坦白囚徒囚徒2坦白不坦白囚囚徒徒1（-10，-10）第二阶段第二阶段第一阶段第一阶段4.2.2惟一纯策略纳什均衡的有限次重复博弈惟一纯策略纳什均衡的有限次重复博弈l一般结论：

一般结论：

原博弈有惟一的纯策略纳什均衡的博弈，则原博弈有惟一的纯策略纳什均衡的博弈，则有限次重复博弈的惟一均衡即各博弈方在每阶段（每次有限次重复博弈的惟一均衡即各博弈方在每阶段（每次重复博弈）中都采用原博弈的纳什均衡策略。

重复博弈）中都采用原博弈的纳什均衡策略。

l原因：

原因：

不存在不可信的威胁或承诺，是子博弈完美纳什不存在不可信的威胁或承诺，是子博弈完美纳什均衡，虽然存在潜在的合作利益，但合作有确定的期限，均衡，虽然存在潜在的合作利益，但合作有确定的期限，。

l定理：

定理：

设原博弈设原博弈GG有惟一的纯策略纳什均衡有惟一的纯策略纳什均衡,则对任意整则对任意整数数TT，重复博弈，重复博弈G（T）G（T）有唯一的子博弈完美纳什均衡，即有唯一的子博弈完美纳什均衡，即各博弈方每个阶段都采用各博弈方每个阶段都采用GG的纳什均衡策略。

各博弈方的纳什均衡策略。

各博弈方在在G（T）G（T）中的总得益为在中的总得益为在GG中得益的中得益的TT倍，平均得益等于原倍，平均得益等于原博弈博弈GG中的得益。

中的得益。

4.2.2惟一纯策略纳什均衡的有限次重复博弈惟一纯策略纳什均衡的有限次重复博弈有限次重复削价竞争博弈有限次重复削价竞争博弈100，10020，150150，2070，70高价低价高价低价寡头寡头2寡寡头头1削价竞争博弈削价竞争博弈有唯一纯策略纳什均衡有唯一纯策略纳什均衡（70，70）有限次重复的结果仍然是有限次重复的结果仍然是（低价，低价）（低价，低价）同理：

有限次重复古诺模型同理：

有限次重复古诺模型4.2.2惟一纯策略纳什均衡的有限次重复博弈惟一纯

展开阅读全文