西财考研博弈论.docx

资源描述

西财考研博弈论.docx

《西财考研博弈论.docx》由会员分享，可在线阅读，更多相关《西财考研博弈论.docx（12页珍藏版）》请在冰豆网上搜索。

西财考研博弈论.docx

西财考研博弈论

博弈论初步

内容：

一、静态博弈：

支付矩阵表示

纳什均衡

囚徒困境

混合策略纳什均衡

二、动态博弈：

博弈树表示

逆向归纳法

动态博弈的均衡

一、静态博弈：

参与人同时行动，参与人行动的时候，不知道其它参与人的行动。

描述一个博弈，基本三要素：

□参与人

□参与人的行动策略

□各种策略组合下，每个参与人获得的支付

理性假设：

博弈参与人是理性的，理性共识：

所有参与人知道所有参与人是理性的。

用支付矩阵（标准式）描述静态博弈，以囚徒困境为例：

坦白抗拒

坦白

-89-8

-0.5,-10

抗拒

-10,-0.5

-1,-1

Ua（坦白，坦白）=-8,Ub（坦白，坦白）=-8

Ua（坦白，抗拒）=-0.5,Ue（坦白，抗拒）=-10

一个参与人的支付不但取决于自身的策略，也取决于其它参与人的策略。

占优策略均衡：

占优策略:

无论其它参与人采取什么策略，某个策略的支付都优于其它策略（绝对优势策略）剔除劣策略

如果一策略组合是所有参与人的占优策略，该策略组合就构成占优策略均衡

做广告

不

敝广告

做广告

10,5

15,（

1n:

个做丿告

（做广告，做广告）是本博弈的占优策略均衡。

纳什均衡

相对优势策略：

相对于其它参与人的某个策略，选择最优的策略。

打卞划线。

坦白抗拒

A坦白

-8-8

-0.5,-10

抗拒

-10,-0.5

-1,-1

若某个策略组合的支付都打了下划线，那么该策略组合就是一个纳什均衡。

（坦白，坦白）是囚徒困境博弈的纳什均衡

若某个策略组合中的策略都是参与人的相对优势策略，则这样的策略组合构成纳什均衡。

在纳什均衡上，每一个参与人都不想单独改变策略，任何参与人单独改变策略无利可图。

个体理性不符合集体理性（个体理性与集体理性相冲突〉

一种经验的办法寻找纳什均衡：

盯着每一个格子，左边的数上卞比，右边的数左右比，若都是大于等于，则这个格子所在的策略组合，是纳什均衡。

（纯策略）纳什均衡可能存在，可能不存在，可能唯一，可能不唯一，可能最优，可能不是最优。

例子：

智猪博弈：

□猪圈里有一头大猪、一头小猪。

猪圈的一头有猪仅槽，另一头安装着控制猪食■供应的按钮，按一下按钮会有10个单位的猪食进槽，但是谁按按钮就会首先付出2个单位的成本，若人猪先到槽边，大小猪吃到食物的收益比是9：

1：

同时到槽边，收益比是7：

3：

小猪先到槽边，收益比是6:

小猪

按钮

等待

按钮

5,1

4,4

等待

2-1

o,Q

（人猪按钮，小猪等待）是本博弈的纳什均衡。

斗

不斗

斗

-2,-2

不斗

4,丄

0,0

E鸡

A鸡

斗鸡博弈的纳什均衡有两个：

（A斗，E不斗），（A不斗，E斗）

纳什均衡不存在。

混合策略

参与人不是选择纯策略，而是以某种概率进行策略选择。

参与人A选U的概率为pu,选D的概率为1-pu

概率分布（pu,l-pu）就是A的混合策略

同样,参与人E选L的概率为pl,选R的概率为1-Pl概率分布就是B的混合策略

PlayerB

L57Cl

混合策略纳什均衡：

方法一：

期望支付相等

B选择L时,其期望收益为2ku+5（1一兀u）

当B选择R时,其期望收益为：

47t|j+2（1-兀u）

2毛+5（1—%）二4%+2（1—%）亠龙〃=3/5.

女口果A选U,其期望收益为

0X7lj+OX（1—兀「）=兀1“

如果A选D,其期蚩收益为：

Ox兀也-4-3x（!

—兀.）=3（1—兀也）・

勺=3（1-矶）n矶=3/4.

本博弈的混合策略纳什均衡为A:

（3/5,2/5）卩:

（3/4,1/4）。

R1~c

方法二：

期望支付最优化求解

（U丄）概率为:

広

（D丄）概率为：

（1-r）c

（U,R）概率为:

r（1-c）

（D,R）概率为（1-r）（1-c）

参与人A的期望收益（1-0（-1-c）

参与人B的期望收益J=rc+2（V・r）（4・c）

参与人的理性决策是追求期塑收益最人化：

L（A>=2rc+d（1-r>（d-c）

clL（A）/€ir=3e-1=Oc=1/3

L=rc+2（1-r）（1-c）

ciJL（B）/clc=32=0r=2/3

因此本博弈的混合策略纳什均衡是：

（2/3,l/3）,E:

（l/3,2/3）

二、动态博弈：

博弈参与人决策有先有后，一个参与人先采取行动，另一个参与人后采取行动，也叫序贯博弈。

用博弈树表示动态博弈：

后行动者的支付写在后面。

先行动者的支付写在前面，

逆向归纳法:

从最后的子博弈开始，对参与人做理性选择，逆向层层做理性选择。

E选择L.

逆向归纳到A选择，选择U。

本博弈的均衡是：

A选择U,

本博弈的均衡是：

进入者进入，在位者不斗争。

市场失灵

在一系列理想化的假设条件下，市场机制可以导致资源配置达到帕累托最优状态。

但事实上，很多假设条件并不符合现实。

市场机制在很多场合并不能实现资源的有效配置，称为市场失灵。

市场失灵的几种情况：

垄断、外部性、公共物品、不完全信息等。

外部性：

若某个人的活动给其它人带来危害或利益，却没有支付赔偿或得到补偿，就产生了外部性。

正外部性（外部经济）：

某个人的活动给其它人带来利益，却没有得到补偿。

负外部性（外部不经济）：

某个人的活动给其它人带来危害，却没有支付赔偿。

外部性导致市场失灵

负外部性：

社会成本〉私人成本，私人产量大于社会合意的产量。

负外部性行为总是供给过多。

Cp（VP-Cp）,若社会可以对该人做出补偿，这个人可以放弃这项行动。

正外部性^社会价值〉私人价值，私人产量低于社会合意产量。

正外部性行为总是供给不足。

Vp（Cp-Vp）,若社会可以对该人做出补偿，这个人就会从事这项行动。

外部性产生时，潜在的帕累托改进为何不能得到实现呢？

1、交易费用人，难以达成补偿协议，涉及的人多时，协议更难达成。

2、存在搭便车现彖。

3、势力不对称，污染者对众多受害者时，就像一个垄断者。

4、产权不明确，是工厂有权污染，还是居民有环境权，法律并不明确。

解决外部性的有关政策：

1、税收（庇占税）或补贴，对负外部性征税，对正外部性行为补贴，使外部性内在化，让私人成本和社会成本或者私人收益和社会收益趋于一致。

2、企业合并，外部性内部化。

3、明确产权，依据是科斯定量。

科斯定理：

只要产权明确，并且交易成本为零或很小，不管最初将财产权赋予谁，通过市场机制，总可以达到资源的有效配置。

一般通过财产权的转让，来解决外部性问题

科斯定理解决外部性问题的局限性

1、财产权不明确，立法存在困难。

如法律该赋予养狗权还是该赋予邻居的安静权？

2、财产权转让，交易成本不为零，甚至很高。

公共物品和公共资源

私人物品：

既有排他性，也有竞争性。

排他性：

不支付价格，就不能使用。

竞争性：

某人使用了，他人就不能使用。

公共物品：

不具有排他性，也没有竞争性的物品，如国防。

公共资源：

不具有排他性，但具有竞争性的物品，如公海里的鱼。

公共物品的量优数■:

等于边际成本。

总产量是每个消费者需求量之和。

公共物品：

公共物品的非竞争性，使得各消费者的消费数量与市场总消费量相等。

公共物品的供求曲线相交所决定的均衡数量就是公共物品的最优数量。

但在总消费量上，边际成本等于每个消费者的边际利益之和。

图形上，公共物品的市场需求曲线是个人需求曲线的垂直相加。

总的供给价格T等于各消费者支付的价格之和，T=L+N

公共物品导致市场失灵：

消费者往往不清楚自己对公共物品的需求曲线，因此，其需求价格无法确定。

消费者会隐瞒或低报自己对公共物品的偏好，因而得不到真实的市场需求曲线并确定公共物品的最优数量。

由于非排他性和非竞争性，消费者在享用公共物品时，充当“免费搭车者”，在享受利益时不支付成本。

这会导致，市场供给公共物品数量不足。

一般来说，公共物品会由政府来供给。

公共资源：

不具有排他性，但有竞争性的物品。

公地的悲剧：

公地具有非排他性，每位村民都可以无限制地在公地上免费放牧，但公地具有竞争性，每个人放的羊越多，会使所有羊的质量变差。

私人决策的最优放羊量超过公地最优的数量，公地由于过度放牧而口益衰落，这就是公地的悲剧。

公地的悲剧是所有公共资源面临的问题。

解决公地的悲剧：

政府根据草场的承载力颁发牧羊许可证，公有资源私有化，对羊征税等。

倍息不对称与市场失灵

倍息：

信息具有价值，可以减少经济主体的决策风险和失误。

信息不具有竞争性，信息可以被许多人同时利用。

完全竞争市场假设完全信息。

不完全信息：

事实上，信息是不完全的。

由于认知能力的限制，人们不可能知道任何时间、任何地方发生的任何情况。

市场经济不能够产出足够的信息并有效地配置它们。

人们购买信息前,需要知道信息是否值得买，人们愿意购买信息，是因为还不知道它，若信息生产方让买方充分地了解信息的价值，购买者可能知道了该信息而不再购买。

倍息不对称：

不同经济主体占有信息的程度不同，有些人比其它人拥有更多的相关信息。

逆向选择：

在信息不对称情况下，掌握私人信息的一方隐藏信息使交易的另一方利益受损的现象。

在柠檬市场中，由于买方和卖方对商品质量具有不对称信息，卖方只把差的商品推向市场,次品驱逐优品，是为逆向选择。

逆向选择导致资源配置失效。

例子：

旧车市场，好车值4万元，差车值2万元，若信息对称，买方支付4万元买好车，或者支付2万元买差车。

若信息不对称，买方不知道旧车的质量，只知道好车和差车的概率各占一半，于是支付期望价值0.5*4P.5*2=3万元。

这样的话，卖方若是好车，就不卖了，卖给买方的是差车，卖方由于隐藏信息而获利，买方则利益受损。

市场的差车驱逐了好车。

事实上，只要买方足够精明，买方知道只能买到差车，因而只付2万元。

这样，好车就被逐出市场，市场的有效性被破坏了。

逆向选择一般发生在合同签订之前，当事人隐藏自己的类型引起的。

例子：

居住坏境不安全、失窃率高的地区的居民乐于购买平均价格的财产保险。

身体健康差的人乐于购买平均价格的医疗保险，差车的车主乐意在期望价格上出售，差的应聘者乐意在期望工资水平上签约。

相反，质量好的人不愿意签约，次品驱逐优品。

逆向选择的解决：

政府管制，塑造诚信经营。

信号发送：

例如，文凭在劳动力市场充当信号作用，保修承诺，人规模广告支出等。

信息甄别：

没有信息的一方通过某种机制的设计，使有信息的一方披露私人信息。

道德风险：

签订合同之后，由于信息不对称，一方不能察知另一方的行动（隐藏行动问题），而导致当事人采取欺骗等不道德行为，损害另一方利益。

例如，购买了汽车保险的人不再注意保管自己的车。

购买了火险的人，不再注意防火安全，购买了医疗保险的人，小病人看，要医生开贵重药品。

签订劳动协议之后，偷懒。

委托-代理关系：

委托人难以观察、监督代理人，因为信息不对称，代理人可能存在道德风险，如偷懒，代理人为了自己的利益而违背委托人的利益。

委托人通过设计激励机制，使代理人的利益和委托人的利益趋于一致。

如分成制、股票期权计划、奖勤罚懒等等。

展开阅读全文