关于定价的博弈论模型.docx

资源描述

关于定价的博弈论模型.docx

《关于定价的博弈论模型.docx》由会员分享，可在线阅读，更多相关《关于定价的博弈论模型.docx（14页珍藏版）》请在冰豆网上搜索。

关于定价的博弈论模型.docx

关于定价的博弈论模型

CH13 关于定价的博弈论模型

分析寡头市场的最大困难在于策略问题。

在此情形下，市场上仅有几家企业，每一家企业

在做决策时，都必须在一定程度上考虑其它企业的行为。

博弈论就是用以研究策略选择的

一种主要的工具。

一、基本概念

在一些情况下，个人或企业必须作出策略性选择，并且最终的结果依赖于每一个行动者的

选择，这种情况就可以看成是一个博弈。

1．博弈的三要素

任何一个博弈都必须具备三个要素：

（1）博弈的参与者

参与人的具体身份无关紧要，在博弈中没有“好人”与“坏蛋”之分，我们只是简单地假

设每个参与者在考虑到对手行为的前提下，做出最有利的策略性选择。

（2）策略

策略是博弈参与者的行动规则。

在非合作博弈中，参与者之间不能就策略选择达成一个有约束力的协议。

（3）支付（payoffs）

支付是参与者的最终受益。

支付包括了与博弈结果相关的所有方面，既包括显性的货币报

酬，也包括隐性的参与者关于结果的心理感受。

2. 符号

两个参与者（A 和 B）之间的博弈 G 用下式表示

G[SA , SB ,U A （a, b）,U B （a, b）]

其中， SA 和 SB 分别表示参与者 A 和参与者 B 的可选策略，U A （a, b）和U B （a, b）分别表示

当参与者 A 和 B 分别选择策略 a 和策略 b 时，各自所得到的支付（ a ∈ SA , b ∈ SB ）。

二、Nash 均衡

市场均衡：

在均衡价格和产量下，买方和卖方都没有动力去改变自己的行为。

Nash 均衡：

对于策略组合（ a , b ），如果给定其它参与者的策略，没有一个参与者会选

* *

择单方面偏离，那么这个策略组合就构成一个 Nash 均衡。

也就是说

U A （a*, b* ） ≥ U A （a', b* ）对于所有 a' ∈ SA

U B （a*, b* ） ≥ U B （a*, b'）对于所有 b' ∈ SB

对纳什均衡的理解

设想所有参与者在博弈之前达成一个（没有约束力的）协议，规定每个参与人选择一个特

定的战略。

那么，给定其他参与人都遵守此协议，是否有人不愿意遵守此协议？

如果没有

参与人有积极性单方面背离此协议，我们说这个协议是可以自动实施的（self-enforcing），

这个协议就构成一个纳什均衡。

否则，它就不是一个纳什均衡。

三、一个例子

两个厂商（A 和 B）决定自己花多少钱用于做广告。

每个厂商可以选择较高的预算（H）或

较低的预算（L）。

1．博弈的扩展式表述

图 13.1

2．博弈的策略式（规范式）表述

表 13.1

3．占优策略和 Nash 均衡

从表 13.1 可以看出，低预算（L）是厂商 B 的占优策略，即不管厂商 A 选择哪一种策略，

L 都是厂商 B 的最佳选择。

由于该博弈的结构是公共知识，厂商 A 也知道 L 是厂商 B 的占

优策略，所以厂商 A 将选择 L。

因此，该博弈的均衡是（L，L）。

请验证（L，L）构成一个 Nash 均衡，而其它三个策略组合都不是 Nash 均衡。

1,-1

-1,1

1,-1

四、混合策略 Nash 均衡

上面的博弈存在唯一的 Nash 均衡，但是并非所有博弈都是如此。

在下图所示的猜谜博弈

中，没有上述意义上的 Nash 均衡存在；而在“性别之战”博弈中，存在两个 Nash 均衡。

儿童 B

H（正面） T（反面）

儿童 A

表 13.2 猜谜博弈

表 13.3 “性别之战”

Nash 均衡不存在的一个主要原因是参与人的策略较少，缺乏灵活性。

在以下两种情况下，

参与者的潜在策略数无穷大，就可以保证博弈至少存在一个均衡：

（1）参与者的策略是某

一区间内的连续变量（比如厂商对产量或价格的选择）；

（2）参与者使用混合策略——以

一定的概率选择某种概率。

相应地，以概率 1 选择某种行动的策略叫做“纯策略”。

下面，我们来求解“猜谜博弈”的混合策略 Nash 均衡。

Suppose that the players decide to randomize amongst his strategies and play a mixed strategy.

Player A could flip a coin and play H with probability r and T with probability 1-r , and player B

flip a coin and play H with probability s and T with probability 1-s.

Given these probabilities, the outcomes of the game occur with the following probabilities:

H-H ,

rs; H-T, r（1-s）; T-H, （1-r）s; T-T,（1-r）（1-s）. Player A’s expected utility is then given by

E（uA ） = rs

（1） + r（1- s）（-1） + （1- r）s（-1） + （1- r）（1- s）

（1）

= 4rs - 2r - 2s +1 = 2r（2s -1） - 2s +1

Oviously, A’s optimal choice of r depends on B’s probability, s. If s < 1 2 , utility is maximized

by choosing r = 0 . If s > 1 2 , A should opt for r = 1 . And when s = 1 2 , A’s expected utility

is 0 no matter what value of r is choosen. A’s best response function is

⎧ 0,if s < 1 2

⎪

⎪[0,1], if s = 1 2

For player B, expected utility is given by

E（uB ） = rs（-1） + r（1- s）

（1） + （1- r）s

（1） + （1- r）（1- s）（-1）

= -（4rs - 2r - 2s +1） = 2s（1- 2r） - （1- 2r）

Now, when r > 1 2 , B’s expected utility is maximized by choosing s = 0 . If r < 1 2 , A should

opt for s = 1 . And when r = 1 2 , A’s expected utility is independent of what s is choosen. B’s

best response function is

⎧ 1,if r < 1 2

⎪

⎪[0,1], if r = 1 2

response

curve of B

response

curve of A

1/2

1/21

Nash equilibria are shown in the figure by the intersections of optimal response curves for A and

Or, we can get the equilibrium through the FOC

∂E（uA ）

∂r

∂E（uB ）

∂s

= 4s - 2 = 0

= 4r - 2 = 0

⇒ s =

⇒ r =

⎩EuB （H ） = EuB （T ）

⎩（-1） ⨯ r +1⨯ （1- r） = 1⨯ r + （-1） ⨯ （1- r）

对上式的理解：

在给定参与人B采用混合战略（s）H + （1- s）T 的情况下，如果混合战略

（r）H + （1- r）T 是参与人A的最优选择，必有 EuA （H ） = EuA （T ）。

同样的，在给定参与

人A采用混合战略（r）H + （1- r）T 的情况下，如果混合战略（s）H + （1- s）T 是参与人B的

最优选择，必有 EuB （H ） = EuB （T ）。

这样，混合策略Nash均衡就可以由以下两式得到

⎧EuA （H ） = EuA （T ）

⎨

即

⎧1⨯ s + （-1） ⨯ （1- s） = （-1） ⨯ s +1⨯ （1- s）

⎨

这样很容易就可以得到上面的混合策略Nash均衡。

-3，-3

0.5，-10

-10，0.5

-2，-2

四、囚徒困境

囚徒 B

囚徒 A

坦白

抵赖

表 13.3 囚徒困境

抵赖 is a dominated strategy. A rational player would therefore never 抵赖. This solves the

game since every player will 坦白. Notice that I don't have to know anything about the other player.

囚徒困境：

个人理性与集体理性之间的矛盾。

This result highlights the value of commitment in the Prisoner's dilemma – commitment consists

of credibly playing strategy 抵赖.

囚徒困境的广泛应用：

军备竞赛、卡特尔、公共品的供给。

五、动态博弈

参与人 A 首先行动，参与人 B 在观察到参与人 A 的行动以后，再行动。

相对于动态博弈，

参与者同时行动，或者虽然行动上又先后，但是后行动者不能观察到先行动者的选择的博

弈叫做静态博弈。

1. 扩展式表述

图 13.2

2．策略式表述

表 13.4

请注意企业B的策略和策略空间。

策略是对行动规则的完备描述，由于在参与者A选择以后，

1，1

3，0

0，3

2，2

参与者B可能面临两种情况——参与者A选择了H或者选择了L，因此，参与者B的策略就要

分别描述这两种情况下自己的行动选择。

以策略（L，H）为例，它表示如果参与人A选择

了L，那么参与人B就选择L，如果参与人A选择了H，那么参与人B也选择H。

3. 均衡

（1）Nash 均衡

根据表 13.4 的策略式表述，该博弈一共有 3 个纯策略 Nash 均衡：

[L, （L, L）]、[L, （L, H）]和

[H, （H,L）]。

其中，[L, （L, H）]和[H, （H,L）]并不合理。

以[H, （H,L）]为例，参与人 A 之所以选择

H，是因为他相信如果自己选择了 L，参与人 B 将选择 H。

但是很明显，参与人 B 的这一

“威胁”并不可信。

因为一旦参与人 A 真的选择了 L，对参与人 B 来说，最有选择是 L 而

不是 H。

策略组合[L, （L, H）]同样存在这一问题。

只有[L, （L, L）]是唯一合理的均衡。

因此，Nash 均衡不能剔除动态博弈中的不可信威胁。

为了得到更为合理的均衡，我们需要

更强的均衡概念。

（2）子博弈精炼（完备）均衡（Subgame Perfect Equilibrium）

定义：

一个扩展式博弈的子博弈由单个决策结x和该决策结的所有后续结（包括终点结）组

成，它不能切割原博弈的信息集。

图 13.2 中的博弈包含 3 个子博弈——原博弈本身以及由参与者 B 的两个决策结点开始的两

个子博弈；而图 13.1 中的博弈仅包含 1 个子博弈，那就是原博弈本身。

定义：

如果策略组合在每一个子博弈上都构成 Nash 均衡，那么，该策略组合构成子博弈

精炼（完备）均衡。

运用逆向归纳法，我们可以剔除不可信威胁，得到子博弈精炼均衡[L, （L, L）]。

六、重复博弈

在重复博弈中，参与者的策略集扩大。

在这种博弈中，前期的行动结果可能影响到后期的

行动选择，因此，需要考虑可信威胁和子博弈精炼的问题。

重复博弈的结果受博弈重复次数的影响很大。

1．有限期重复博弈

表 13.5

很容易看出，该博弈的唯一 Nash 均衡是（U，L）——一个典型的囚徒困境博弈。

由逆向归纳法可知，在重复次数有限的情况下，重复博弈的唯一子博弈精炼均衡是每一期

博弈的策略组合都是（U，L）——即简单地重复单期博弈的 Nash 均衡。

2．无限期重复博弈

上述逻辑在无限期重复博弈中不再适用。

在无限期博弈中，逆向归纳法没有一个起始点。

在此情形下，参与者可以宣布自己将采用“触发策略”（triggerstrategy）——从第一期开

始，自己一直采用最优的合作策略，即（D，R），只要其它参与者也这样做；一旦发现有

人背离此策略组合，将永远采用单期 Nash 均衡策略（U，L）。

要使两个参与人都采用触发策略成为一个子博弈精炼均衡，必须使该威胁（承诺）可信。

假设在第 K 期，参与人 A 宣布自己将采用触发策略，在该期合作，那么参与人 B 有无动

力背离？

如果参与人 B 合作，在每一期都可以得到 2；如果背离（选择 L），在第 K 期得到

3，而在随后的每一期得到 1。

以 δ 表示贴现因子。

如果合作，参与人 B 的总收益的现值是

2 + δ 2 + δ 2 2 + L =

1- δ

如果背离，参与人 B 的总收益的现值是

3 + δ1+ δ 21+ L = 3 +

参与人选择合作当且仅当

1- δ

> 3 +

1- δ

即

δ > 1 2

也就是说，只要参与人有足够的耐心，合作就可以实现。

这就是著名的“无名氏定理”的

主要内容。

七、静态博弈中的定价

假设有两个企业，A 和 B，均以不变的边际成本 c 生产相同的产品。

每个企业的策略是选

择各自的价格， pA 和 pB 。

显然，价格不可能小于 c。

由于两家企业的产品是同质的，因

此，如果 pA = pB ，我们假设两家企业的市场份额相等。

1．Bertrand-Nash 均衡

假设两家企业的生产能力不受限制。

该博弈的唯一均衡是 pA = pB = c 。

如果企业 A 的价格高于 c，企业 B 将选择一个比 pA 稍低的价格得到这个市场，并取得正

的利润。

2．生产能力约束：

Cournot 均衡

假设双寡头垄断中的每个厂商必须选择一个有特定能力的产出水平，在该产出水平范围内，

边际成本为常数，高于此水平则边际成本无穷大。

显然，厂商首先选择产出量然后选择价

格的两阶段博弈与古诺竞争的实质是一样的。

一旦厂商确定了生产能力（产量），唯一可行

的价格就是使市场需求量等于两个厂商市场能力之和的价格。

-1-1

数。

如果 pA = pB < p ，总需求超过产业总产量 qA + qB ，那么任意一家企业都可以通过略

微提高价格（仍然能够卖出 qA ）以获取正的利润。

因此， pA = pB < p 不可能是一个均衡。

另一方面，如果 pA = pB > p ，厂商 A 可以稍微降低一点自己的价格，将自己的销量提高

到 qA ，也能获得更多的利润。

因此， pA = pB > p 也不可能是一个均衡。

唯一的均衡就是

pA = pB = p 。

在 Cournot 竞争和 Bertrand 竞争中，厂商数目都是两个，但是二者的均衡迥异，这说明博

弈（资源配置）结果高度依赖于竞争的具体形式。

3．重复博弈和默契合谋

假设 Bertrand 博弈可以无限期地重复下去，贴现因子为 δ （或者假设贴现因子为 1，但是

在每一期，博弈继续进行的概率都为 δ ）。

在情形下，两个厂商都实行“触发策略”是可能

的。

假设垄断价格为 pM 。

假设两家企业从一开始就选择价格 pM ，如果发现有厂商偏离此

价格，则在后续博弈中一直选择完全竞争价格 c。

如果某家厂商在第 K 期背离，选择一个略低于 pM 的价格得到整个市场，并因此得到垄断

利润（实际上略低于此）。

由于在后续博弈中，对方会采用触发策略进行惩罚，利润为零。

因此，背离的总收益为 π M 。

如果不背离，两家厂商在每一期都得到 π M 2 。

因此，没有厂商选择背离当且仅当

π M <

π M 1

2 1- δ

即

δ > 1 2

默契合谋成立的条件：

（1）厂商 A 的背叛行为很容易被厂商 B 察觉；

（2）厂商 B 愿意长

期采取自损性惩罚行为。

八、承诺性投资和进入阻止

在以前讨论厂商进入或退出市场时，都没有考虑厂商之间的策略性行为。

实际上，厂商在

决定进入或退出市场时，一般都会猜测其行为对于其对手的行为以及未来市场价格的影响。

在图 13.6 中，在位企业（企业 1）可以通过不可转移的投资（sunkcost），阻止竞争对手

（企业 2）进入市场。

因为有了这种不可转移的投资，企业 1 的“打击”威胁变得可信。

进入

1 ∙

打击容忍

⎛ 3 ⎫⎛ 2 ⎫

ç⎪ç ⎪

投资

不进入

⎛ 6 ⎫

ç ⎪

不投资

进入 ∙ 2不进入

1 ∙ ⎛10 ⎫

打击容忍

⎝ 0 ⎭

⎛ -2 ⎫ ⎛ 3.5 ⎫

ç ⎪ ç ⎪

图 13.6

P460，Example15.7 自学。

九、进入和不完全信息

十、不完全信息博弈

展开阅读全文