关于定价的博弈论模型.docx
《关于定价的博弈论模型.docx》由会员分享,可在线阅读,更多相关《关于定价的博弈论模型.docx(14页珍藏版)》请在冰豆网上搜索。
关于定价的博弈论模型
CH13 关于定价的博弈论模型
分析寡头市场的最大困难在于策略问题。
在此情形下,市场上仅有几家企业,每一家企业
在做决策时,都必须在一定程度上考虑其它企业的行为。
博弈论就是用以研究策略选择的
一种主要的工具。
一、基本概念
在一些情况下,个人或企业必须作出策略性选择,并且最终的结果依赖于每一个行动者的
选择,这种情况就可以看成是一个博弈。
1.博弈的三要素
任何一个博弈都必须具备三个要素:
(1)博弈的参与者
参与人的具体身份无关紧要,在博弈中没有“好人”与“坏蛋”之分,我们只是简单地假
设每个参与者在考虑到对手行为的前提下,做出最有利的策略性选择。
(2)策略
策略是博弈参与者的行动规则。
在非合作博弈中,参与者之间不能就策略选择达成一个有约束力的协议。
(3)支付(payoffs)
支付是参与者的最终受益。
支付包括了与博弈结果相关的所有方面,既包括显性的货币报
酬,也包括隐性的参与者关于结果的心理感受。
2. 符号
两个参与者(A 和 B)之间的博弈 G 用下式表示
G[SA , SB ,U A (a, b),U B (a, b)]
其中, SA 和 SB 分别表示参与者 A 和参与者 B 的可选策略,U A (a, b) 和U B (a, b) 分别表示
当参与者 A 和 B 分别选择策略 a 和策略 b 时,各自所得到的支付( a ∈ SA , b ∈ SB )。
二、Nash 均衡
市场均衡:
在均衡价格和产量下,买方和卖方都没有动力去改变自己的行为。
1
Nash 均衡:
对于策略组合( a , b ),如果给定其它参与者的策略,没有一个参与者会选
* *
择单方面偏离,那么这个策略组合就构成一个 Nash 均衡。
也就是说
U A (a*, b* ) ≥ U A (a', b* ) 对于所有 a' ∈ SA
U B (a*, b* ) ≥ U B (a*, b') 对于所有 b' ∈ SB
对纳什均衡的理解
设想所有参与者在博弈之前达成一个(没有约束力的)协议,规定每个参与人选择一个特
定的战略。
那么,给定其他参与人都遵守此协议,是否有人不愿意遵守此协议?
如果没有
参与人有积极性单方面背离此协议,我们说这个协议是可以自动实施的(self-enforcing),
这个协议就构成一个纳什均衡。
否则,它就不是一个纳什均衡。
三、一个例子
两个厂商(A 和 B)决定自己花多少钱用于做广告。
每个厂商可以选择较高的预算(H)或
较低的预算(L)。
1.博弈的扩展式表述
图 13.1
2.博弈的策略式(规范式)表述
表 13.1
3.占优策略和 Nash 均衡
从表 13.1 可以看出,低预算(L)是厂商 B 的占优策略,即不管厂商 A 选择哪一种策略,
L 都是厂商 B 的最佳选择。
由于该博弈的结构是公共知识,厂商 A 也知道 L 是厂商 B 的占
优策略,所以厂商 A 将选择 L。
因此,该博弈的均衡是(L,L)。
请验证(L,L)构成一个 Nash 均衡,而其它三个策略组合都不是 Nash 均衡。
2
1,-1
-1,1
-1,1
1,-1
四、混合策略 Nash 均衡
上面的博弈存在唯一的 Nash 均衡,但是并非所有博弈都是如此。
在下图所示的猜谜博弈
中,没有上述意义上的 Nash 均衡存在;而在“性别之战”博弈中,存在两个 Nash 均衡。
儿童 B
H(正面) T(反面)
儿童 A
表 13.2 猜谜博弈
表 13.3 “性别之战”
Nash 均衡不存在的一个主要原因是参与人的策略较少,缺乏灵活性。
在以下两种情况下,
参与者的潜在策略数无穷大,就可以保证博弈至少存在一个均衡:
(1)参与者的策略是某
一区间内的连续变量(比如厂商对产量或价格的选择);
(2)参与者使用混合策略——以
一定的概率选择某种概率。
相应地,以概率 1 选择某种行动的策略叫做“纯策略”。
下面,我们来求解“猜谜博弈”的混合策略 Nash 均衡。
Suppose that the players decide to randomize amongst his strategies and play a mixed strategy.
Player A could flip a coin and play H with probability r and T with probability 1-r , and player B
flip a coin and play H with probability s and T with probability 1-s.
Given these probabilities, the outcomes of the game occur with the following probabilities:
H-H ,
rs; H-T, r(1-s); T-H, (1-r)s; T-T,(1-r)(1-s). Player A’s expected utility is then given by
E(uA ) = rs
(1) + r(1- s)(-1) + (1- r)s(-1) + (1- r)(1- s)
(1)
= 4rs - 2r - 2s +1 = 2r(2s -1) - 2s +1
Oviously, A’s optimal choice of r depends on B’s probability, s. If s < 1 2 , utility is maximized
by choosing r = 0 . If s > 1 2 , A should opt for r = 1 . And when s = 1 2 , A’s expected utility
is 0 no matter what value of r is choosen. A’s best response function is
⎧ 0,if s < 1 2
⎪
⎪[0,1], if s = 1 2
3
For player B, expected utility is given by
E(uB ) = rs(-1) + r(1- s)
(1) + (1- r)s
(1) + (1- r)(1- s)(-1)
= -(4rs - 2r - 2s +1) = 2s(1- 2r) - (1- 2r)
Now, when r > 1 2 , B’s expected utility is maximized by choosing s = 0 . If r < 1 2 , A should
opt for s = 1 . And when r = 1 2 , A’s expected utility is independent of what s is choosen. B’s
best response function is
⎧ 1,if r < 1 2
⎪
⎪[0,1], if r = 1 2
s
1
response
curve of B
response
curve of A
1/2
1/21
r
Nash equilibria are shown in the figure by the intersections of optimal response curves for A and
B.
Or, we can get the equilibrium through the FOC
∂E(uA )
∂r
∂E(uB )
∂s
= 4s - 2 = 0
= 4r - 2 = 0
⇒ s =
⇒ r =
1
2
1
2
⎩EuB (H ) = EuB (T )
⎩(-1) ⨯ r +1⨯ (1- r) = 1⨯ r + (-1) ⨯ (1- r)
对上式的理解:
在给定参与人B采用混合战略 (s)H + (1- s)T 的情况下,如果混合战略
(r)H + (1- r)T 是参与人A的最优选择,必有 EuA (H ) = EuA (T ) 。
同样的,在给定参与
人A采用混合战略 (r)H + (1- r)T 的情况下,如果混合战略 (s)H + (1- s)T 是参与人B的
最优选择,必有 EuB (H ) = EuB (T ) 。
这样,混合策略Nash均衡就可以由以下两式得到
⎧EuA (H ) = EuA (T )
⎨
即
⎧1⨯ s + (-1) ⨯ (1- s) = (-1) ⨯ s +1⨯ (1- s)
⎨
这样很容易就可以得到上面的混合策略Nash均衡。
4
-3,-3
0.5,-10
-10,0.5
-2,-2
四、囚徒困境
囚徒 B
囚徒 A
坦白
抵赖
表 13.3 囚徒困境
抵赖 is a dominated strategy. A rational player would therefore never 抵赖. This solves the
game since every player will 坦白. Notice that I don't have to know anything about the other player.
囚徒困境:
个人理性与集体理性之间的矛盾。
This result highlights the value of commitment in the Prisoner's dilemma – commitment consists
of credibly playing strategy 抵赖.
囚徒困境的广泛应用:
军备竞赛、卡特尔、公共品的供给。
五、动态博弈
参与人 A 首先行动,参与人 B 在观察到参与人 A 的行动以后,再行动。
相对于动态博弈,
参与者同时行动,或者虽然行动上又先后,但是后行动者不能观察到先行动者的选择的博
弈叫做静态博弈。
1. 扩展式表述
图 13.2
2.策略式表述
表 13.4
请注意企业B的策略和策略空间。
策略是对行动规则的完备描述,由于在参与者A选择以后,
5
1,1
3,0
0,3
2,2
参与者B可能面临两种情况——参与者A选择了H或者选择了L,因此,参与者B的策略就要
分别描述这两种情况下自己的行动选择。
以策略(L,H)为例,它表示如果参与人A选择
了L,那么参与人B就选择L,如果参与人A选择了H,那么参与人B也选择H。
3. 均衡
(1)Nash 均衡
根据表 13.4 的策略式表述,该博弈一共有 3 个纯策略 Nash 均衡:
[L, (L, L)]、[L, (L, H)]和
[H, (H,L)]。
其中,[L, (L, H)]和[H, (H,L)]并不合理。
以[H, (H,L)]为例,参与人 A 之所以选择
H,是因为他相信如果自己选择了 L,参与人 B 将选择 H。
但是很明显,参与人 B 的这一
“威胁”并不可信。
因为一旦参与人 A 真的选择了 L,对参与人 B 来说,最有选择是 L 而
不是 H。
策略组合[L, (L, H)]同样存在这一问题。
只有[L, (L, L)]是唯一合理的均衡。
因此,Nash 均衡不能剔除动态博弈中的不可信威胁。
为了得到更为合理的均衡,我们需要
更强的均衡概念。
(2)子博弈精炼(完备)均衡(Subgame Perfect Equilibrium)
定义:
一个扩展式博弈的子博弈由单个决策结x和该决策结的所有后续结(包括终点结)组
成,它不能切割原博弈的信息集。
图 13.2 中的博弈包含 3 个子博弈——原博弈本身以及由参与者 B 的两个决策结点开始的两
个子博弈;而图 13.1 中的博弈仅包含 1 个子博弈,那就是原博弈本身。
定义:
如果策略组合在每一个子博弈上都构成 Nash 均衡,那么,该策略组合构成子博弈
精炼(完备)均衡。
运用逆向归纳法,我们可以剔除不可信威胁,得到子博弈精炼均衡[L, (L, L)]。
六、重复博弈
在重复博弈中,参与者的策略集扩大。
在这种博弈中,前期的行动结果可能影响到后期的
行动选择,因此,需要考虑可信威胁和子博弈精炼的问题。
重复博弈的结果受博弈重复次数的影响很大。
1.有限期重复博弈
B
A
U
D
表 13.5
很容易看出,该博弈的唯一 Nash 均衡是(U,L)——一个典型的囚徒困境博弈。
由逆向归纳法可知,在重复次数有限的情况下,重复博弈的唯一子博弈精炼均衡是每一期
博弈的策略组合都是(U,L)——即简单地重复单期博弈的 Nash 均衡。
6
2.无限期重复博弈
上述逻辑在无限期重复博弈中不再适用。
在无限期博弈中,逆向归纳法没有一个起始点。
在此情形下,参与者可以宣布自己将采用“触发策略”(triggerstrategy)——从第一期开
始,自己一直采用最优的合作策略,即(D,R),只要其它参与者也这样做;一旦发现有
人背离此策略组合,将永远采用单期 Nash 均衡策略(U,L)。
要使两个参与人都采用触发策略成为一个子博弈精炼均衡,必须使该威胁(承诺)可信。
假设在第 K 期,参与人 A 宣布自己将采用触发策略,在该期合作,那么参与人 B 有无动
力背离?
如果参与人 B 合作,在每一期都可以得到 2;如果背离(选择 L),在第 K 期得到
3,而在随后的每一期得到 1。
以 δ 表示贴现因子。
如果合作,参与人 B 的总收益的现值是
2 + δ 2 + δ 2 2 + L =
2
1- δ
如果背离,参与人 B 的总收益的现值是
3 + δ1+ δ 21+ L = 3 +
参与人选择合作当且仅当
δ
1- δ
2
1- δ
> 3 +
δ
1- δ
即
δ > 1 2
也就是说,只要参与人有足够的耐心,合作就可以实现。
这就是著名的“无名氏定理”的
主要内容。
七、静态博弈中的定价
假设有两个企业,A 和 B,均以不变的边际成本 c 生产相同的产品。
每个企业的策略是选
择各自的价格, pA 和 pB 。
显然,价格不可能小于 c。
由于两家企业的产品是同质的,因
此,如果 pA = pB ,我们假设两家企业的市场份额相等。
1.Bertrand-Nash 均衡
假设两家企业的生产能力不受限制。
该博弈的唯一均衡是 pA = pB = c 。
如果企业 A 的价格高于 c,企业 B 将选择一个比 pA 稍低的价格得到这个市场,并取得正
的利润。
2.生产能力约束:
Cournot 均衡
假设双寡头垄断中的每个厂商必须选择一个有特定能力的产出水平,在该产出水平范围内,
边际成本为常数,高于此水平则边际成本无穷大。
显然,厂商首先选择产出量然后选择价
7
格的两阶段博弈与古诺竞争的实质是一样的。
一旦厂商确定了生产能力(产量),唯一可行
的价格就是使市场需求量等于两个厂商市场能力之和的价格。
-1-1
数。
如果 pA = pB < p ,总需求超过产业总产量 qA + qB ,那么任意一家企业都可以通过略
微提高价格(仍然能够卖出 qA )以获取正的利润。
因此, pA = pB < p 不可能是一个均衡。
另一方面,如果 pA = pB > p ,厂商 A 可以稍微降低一点自己的价格,将自己的销量提高
到 qA ,也能获得更多的利润。
因此, pA = pB > p 也不可能是一个均衡。
唯一的均衡就是
pA = pB = p 。
在 Cournot 竞争和 Bertrand 竞争中,厂商数目都是两个,但是二者的均衡迥异,这说明博
弈(资源配置)结果高度依赖于竞争的具体形式。
3.重复博弈和默契合谋
假设 Bertrand 博弈可以无限期地重复下去,贴现因子为 δ (或者假设贴现因子为 1,但是
在每一期,博弈继续进行的概率都为 δ )。
在情形下,两个厂商都实行“触发策略”是可能
的。
假设垄断价格为 pM 。
假设两家企业从一开始就选择价格 pM ,如果发现有厂商偏离此
价格,则在后续博弈中一直选择完全竞争价格 c。
如果某家厂商在第 K 期背离,选择一个略低于 pM 的价格得到整个市场,并因此得到垄断
利润(实际上略低于此)。
由于在后续博弈中,对方会采用触发策略进行惩罚,利润为零。
因此,背离的总收益为 π M 。
如果不背离,两家厂商在每一期都得到 π M 2 。
因此,没有厂商选择背离当且仅当
π M <
π M 1
2 1- δ
即
δ > 1 2
默契合谋成立的条件:
(1)厂商 A 的背叛行为很容易被厂商 B 察觉;
(2)厂商 B 愿意长
期采取自损性惩罚行为。
八、承诺性投资和进入阻止
在以前讨论厂商进入或退出市场时,都没有考虑厂商之间的策略性行为。
实际上,厂商在
决定进入或退出市场时,一般都会猜测其行为对于其对手的行为以及未来市场价格的影响。
在图 13.6 中,在位企业(企业 1)可以通过不可转移的投资(sunkcost),阻止竞争对手
(企业 2)进入市场。
因为有了这种不可转移的投资,企业 1 的“打击”威胁变得可信。
8
进入
1 ∙
打击容忍
⎛ 3 ⎫⎛ 2 ⎫
ç⎪ç ⎪
投资
不进入
⎛ 6 ⎫
ç ⎪
1
不投资
进入 ∙ 2不进入
1 ∙ ⎛10 ⎫
打击 容忍
⎝ 0 ⎭
⎛ -2 ⎫ ⎛ 3.5 ⎫
ç ⎪ ç ⎪
图 13.6
P460,Example15.7 自学。
九、进入和不完全信息
十、不完全信息博弈
9