关于定价的博弈论模型.docx

上传人:b****4 文档编号:3510802 上传时间:2022-11-23 格式:DOCX 页数:14 大小:34.65KB
下载 相关 举报
关于定价的博弈论模型.docx_第1页
第1页 / 共14页
关于定价的博弈论模型.docx_第2页
第2页 / 共14页
关于定价的博弈论模型.docx_第3页
第3页 / 共14页
关于定价的博弈论模型.docx_第4页
第4页 / 共14页
关于定价的博弈论模型.docx_第5页
第5页 / 共14页
点击查看更多>>
下载资源
资源描述

关于定价的博弈论模型.docx

《关于定价的博弈论模型.docx》由会员分享,可在线阅读,更多相关《关于定价的博弈论模型.docx(14页珍藏版)》请在冰豆网上搜索。

关于定价的博弈论模型.docx

关于定价的博弈论模型

 

CH13 关于定价的博弈论模型

 

分析寡头市场的最大困难在于策略问题。

在此情形下,市场上仅有几家企业,每一家企业

在做决策时,都必须在一定程度上考虑其它企业的行为。

博弈论就是用以研究策略选择的

一种主要的工具。

一、基本概念

在一些情况下,个人或企业必须作出策略性选择,并且最终的结果依赖于每一个行动者的

选择,这种情况就可以看成是一个博弈。

1.博弈的三要素

任何一个博弈都必须具备三个要素:

(1)博弈的参与者

参与人的具体身份无关紧要,在博弈中没有“好人”与“坏蛋”之分,我们只是简单地假

设每个参与者在考虑到对手行为的前提下,做出最有利的策略性选择。

(2)策略

策略是博弈参与者的行动规则。

在非合作博弈中,参与者之间不能就策略选择达成一个有约束力的协议。

(3)支付(payoffs)

支付是参与者的最终受益。

支付包括了与博弈结果相关的所有方面,既包括显性的货币报

酬,也包括隐性的参与者关于结果的心理感受。

2. 符号

 

两个参与者(A 和 B)之间的博弈 G 用下式表示

G[SA , SB ,U A (a, b),U B (a, b)]

其中, SA 和 SB 分别表示参与者 A 和参与者 B 的可选策略,U A (a, b) 和U B (a, b) 分别表示

当参与者 A 和 B 分别选择策略 a 和策略 b 时,各自所得到的支付( a ∈ SA , b ∈ SB )。

二、Nash 均衡

市场均衡:

在均衡价格和产量下,买方和卖方都没有动力去改变自己的行为。

 

1

 

Nash 均衡:

对于策略组合( a , b  ),如果给定其它参与者的策略,没有一个参与者会选

*  *

择单方面偏离,那么这个策略组合就构成一个 Nash 均衡。

也就是说

U A (a*, b* ) ≥ U A (a', b* ) 对于所有 a' ∈ SA

U B (a*, b* ) ≥ U B (a*, b') 对于所有 b' ∈ SB

对纳什均衡的理解

设想所有参与者在博弈之前达成一个(没有约束力的)协议,规定每个参与人选择一个特

定的战略。

那么,给定其他参与人都遵守此协议,是否有人不愿意遵守此协议?

如果没有

参与人有积极性单方面背离此协议,我们说这个协议是可以自动实施的(self-enforcing),

这个协议就构成一个纳什均衡。

否则,它就不是一个纳什均衡。

三、一个例子

两个厂商(A 和 B)决定自己花多少钱用于做广告。

每个厂商可以选择较高的预算(H)或

较低的预算(L)。

1.博弈的扩展式表述

 

图 13.1

2.博弈的策略式(规范式)表述

 

表 13.1

3.占优策略和 Nash 均衡

从表 13.1 可以看出,低预算(L)是厂商 B 的占优策略,即不管厂商 A 选择哪一种策略,

L 都是厂商 B 的最佳选择。

由于该博弈的结构是公共知识,厂商 A 也知道 L 是厂商 B 的占

优策略,所以厂商 A 将选择 L。

因此,该博弈的均衡是(L,L)。

请验证(L,L)构成一个 Nash 均衡,而其它三个策略组合都不是 Nash 均衡。

2

1,-1

-1,1

-1,1

1,-1

 

四、混合策略 Nash 均衡

上面的博弈存在唯一的 Nash 均衡,但是并非所有博弈都是如此。

在下图所示的猜谜博弈

中,没有上述意义上的 Nash 均衡存在;而在“性别之战”博弈中,存在两个 Nash 均衡。

 

儿童 B

H(正面)   T(反面)

儿童 A

 

表 13.2 猜谜博弈

 

表 13.3 “性别之战”

Nash 均衡不存在的一个主要原因是参与人的策略较少,缺乏灵活性。

在以下两种情况下,

参与者的潜在策略数无穷大,就可以保证博弈至少存在一个均衡:

(1)参与者的策略是某

一区间内的连续变量(比如厂商对产量或价格的选择);

(2)参与者使用混合策略——以

一定的概率选择某种概率。

相应地,以概率 1 选择某种行动的策略叫做“纯策略”。

下面,我们来求解“猜谜博弈”的混合策略 Nash 均衡。

Suppose that the players decide to randomize amongst his strategies and play a mixed strategy.

Player A could flip a coin and play H with probability r and T with probability 1-r , and player B

flip a coin and play H with probability s and T with probability 1-s.

Given these probabilities, the outcomes of the game occur with the following probabilities:

 H-H ,

rs; H-T, r(1-s); T-H, (1-r)s; T-T,(1-r)(1-s). Player A’s expected utility is then given by

E(uA ) = rs

(1) + r(1- s)(-1) + (1- r)s(-1) + (1- r)(1- s)

(1)

= 4rs - 2r - 2s +1 = 2r(2s -1) - 2s +1

Oviously, A’s optimal choice of r depends on B’s probability, s. If s < 1 2 , utility is maximized

by choosing r = 0 . If s > 1 2 , A should opt for r = 1 . And when s = 1 2 , A’s expected utility

is 0 no matter what value of r is choosen. A’s best response function is

⎧ 0,if s < 1 2

⎪[0,1], if s = 1 2

3

 

For player B, expected utility is given by

E(uB ) = rs(-1) + r(1- s)

(1) + (1- r)s

(1) + (1- r)(1- s)(-1)

= -(4rs - 2r - 2s +1) = 2s(1- 2r) - (1- 2r)

Now, when r > 1 2 , B’s expected utility is maximized by choosing s = 0 . If r < 1 2 , A should

opt for s = 1 . And when r = 1 2 , A’s expected utility is independent of what s is choosen. B’s

best response function is

⎧ 1,if r < 1 2

⎪[0,1], if r = 1 2

s

1

response

curve of B

response

curve of A

 

1/2

 

1/21

r

Nash equilibria are shown in the figure by the intersections of optimal response curves for A and

B.

Or, we can get the equilibrium through the FOC

∂E(uA )

∂r

∂E(uB )

∂s

= 4s - 2 = 0

= 4r - 2 = 0

⇒ s =

⇒ r =

1

2

1

2

⎩EuB (H ) = EuB (T )

⎩(-1) ⨯ r +1⨯ (1- r) = 1⨯ r + (-1) ⨯ (1- r)

对上式的理解:

在给定参与人B采用混合战略 (s)H + (1- s)T 的情况下,如果混合战略

(r)H + (1- r)T 是参与人A的最优选择,必有 EuA (H ) = EuA (T ) 。

同样的,在给定参与

人A采用混合战略 (r)H + (1- r)T 的情况下,如果混合战略 (s)H + (1- s)T 是参与人B的

最优选择,必有 EuB (H ) = EuB (T ) 。

这样,混合策略Nash均衡就可以由以下两式得到

⎧EuA (H ) = EuA (T )

⎧1⨯ s + (-1) ⨯ (1- s) = (-1) ⨯ s +1⨯ (1- s)

这样很容易就可以得到上面的混合策略Nash均衡。

 

4

-3,-3

0.5,-10

-10,0.5

-2,-2

 

四、囚徒困境

 

囚徒 B

囚徒 A

坦白

抵赖

表 13.3  囚徒困境

抵赖 is a dominated strategy. A rational player would therefore never 抵赖. This solves the

game since every player will 坦白. Notice that I don't have to know anything about the other player.

囚徒困境:

个人理性与集体理性之间的矛盾。

This result highlights the value of commitment in the Prisoner's dilemma – commitment consists

of credibly playing strategy 抵赖.

囚徒困境的广泛应用:

军备竞赛、卡特尔、公共品的供给。

五、动态博弈

参与人 A 首先行动,参与人 B 在观察到参与人 A 的行动以后,再行动。

相对于动态博弈,

参与者同时行动,或者虽然行动上又先后,但是后行动者不能观察到先行动者的选择的博

弈叫做静态博弈。

1. 扩展式表述

 

图 13.2

2.策略式表述

 

表 13.4

请注意企业B的策略和策略空间。

策略是对行动规则的完备描述,由于在参与者A选择以后,

 

5

1,1

3,0

0,3

2,2

 

参与者B可能面临两种情况——参与者A选择了H或者选择了L,因此,参与者B的策略就要

分别描述这两种情况下自己的行动选择。

以策略(L,H)为例,它表示如果参与人A选择

了L,那么参与人B就选择L,如果参与人A选择了H,那么参与人B也选择H。

3. 均衡

(1)Nash 均衡

根据表 13.4 的策略式表述,该博弈一共有 3 个纯策略 Nash 均衡:

[L, (L, L)]、[L, (L, H)]和

[H, (H,L)]。

其中,[L, (L, H)]和[H, (H,L)]并不合理。

以[H, (H,L)]为例,参与人 A 之所以选择

H,是因为他相信如果自己选择了 L,参与人 B 将选择 H。

但是很明显,参与人 B 的这一

“威胁”并不可信。

因为一旦参与人 A 真的选择了 L,对参与人 B 来说,最有选择是 L 而

不是 H。

策略组合[L, (L, H)]同样存在这一问题。

只有[L, (L, L)]是唯一合理的均衡。

因此,Nash 均衡不能剔除动态博弈中的不可信威胁。

为了得到更为合理的均衡,我们需要

更强的均衡概念。

(2)子博弈精炼(完备)均衡(Subgame Perfect Equilibrium)

定义:

一个扩展式博弈的子博弈由单个决策结x和该决策结的所有后续结(包括终点结)组

成,它不能切割原博弈的信息集。

图 13.2 中的博弈包含 3 个子博弈——原博弈本身以及由参与者 B 的两个决策结点开始的两

个子博弈;而图 13.1 中的博弈仅包含 1 个子博弈,那就是原博弈本身。

定义:

如果策略组合在每一个子博弈上都构成 Nash 均衡,那么,该策略组合构成子博弈

精炼(完备)均衡。

运用逆向归纳法,我们可以剔除不可信威胁,得到子博弈精炼均衡[L, (L, L)]。

六、重复博弈

在重复博弈中,参与者的策略集扩大。

在这种博弈中,前期的行动结果可能影响到后期的

行动选择,因此,需要考虑可信威胁和子博弈精炼的问题。

重复博弈的结果受博弈重复次数的影响很大。

1.有限期重复博弈

B

A

U

D

表 13.5

很容易看出,该博弈的唯一 Nash 均衡是(U,L)——一个典型的囚徒困境博弈。

由逆向归纳法可知,在重复次数有限的情况下,重复博弈的唯一子博弈精炼均衡是每一期

博弈的策略组合都是(U,L)——即简单地重复单期博弈的 Nash 均衡。

6

 

2.无限期重复博弈

上述逻辑在无限期重复博弈中不再适用。

在无限期博弈中,逆向归纳法没有一个起始点。

在此情形下,参与者可以宣布自己将采用“触发策略”(triggerstrategy)——从第一期开

始,自己一直采用最优的合作策略,即(D,R),只要其它参与者也这样做;一旦发现有

人背离此策略组合,将永远采用单期 Nash 均衡策略(U,L)。

要使两个参与人都采用触发策略成为一个子博弈精炼均衡,必须使该威胁(承诺)可信。

假设在第 K 期,参与人 A 宣布自己将采用触发策略,在该期合作,那么参与人 B 有无动

力背离?

如果参与人 B 合作,在每一期都可以得到 2;如果背离(选择 L),在第 K 期得到

3,而在随后的每一期得到 1。

以 δ 表示贴现因子。

如果合作,参与人 B 的总收益的现值是

2 + δ 2 + δ 2 2 + L =

2

1- δ

如果背离,参与人 B 的总收益的现值是

3 + δ1+ δ 21+ L = 3 +

参与人选择合作当且仅当

δ

1- δ

2

1- δ

> 3 +

δ

1- δ

δ > 1 2

也就是说,只要参与人有足够的耐心,合作就可以实现。

这就是著名的“无名氏定理”的

主要内容。

七、静态博弈中的定价

 

假设有两个企业,A 和 B,均以不变的边际成本 c 生产相同的产品。

每个企业的策略是选

择各自的价格, pA 和 pB 。

显然,价格不可能小于 c。

由于两家企业的产品是同质的,因

此,如果 pA = pB ,我们假设两家企业的市场份额相等。

1.Bertrand-Nash 均衡

假设两家企业的生产能力不受限制。

该博弈的唯一均衡是 pA = pB = c 。

如果企业 A 的价格高于 c,企业 B 将选择一个比 pA 稍低的价格得到这个市场,并取得正

的利润。

2.生产能力约束:

Cournot 均衡

假设双寡头垄断中的每个厂商必须选择一个有特定能力的产出水平,在该产出水平范围内,

边际成本为常数,高于此水平则边际成本无穷大。

显然,厂商首先选择产出量然后选择价

7

 

格的两阶段博弈与古诺竞争的实质是一样的。

一旦厂商确定了生产能力(产量),唯一可行

的价格就是使市场需求量等于两个厂商市场能力之和的价格。

-1-1

数。

如果 pA = pB < p ,总需求超过产业总产量 qA + qB ,那么任意一家企业都可以通过略

微提高价格(仍然能够卖出 qA )以获取正的利润。

因此, pA = pB < p 不可能是一个均衡。

另一方面,如果 pA = pB > p ,厂商 A 可以稍微降低一点自己的价格,将自己的销量提高

到 qA ,也能获得更多的利润。

因此, pA = pB > p 也不可能是一个均衡。

唯一的均衡就是

pA = pB = p 。

在 Cournot 竞争和 Bertrand 竞争中,厂商数目都是两个,但是二者的均衡迥异,这说明博

弈(资源配置)结果高度依赖于竞争的具体形式。

3.重复博弈和默契合谋

假设 Bertrand 博弈可以无限期地重复下去,贴现因子为 δ (或者假设贴现因子为 1,但是

在每一期,博弈继续进行的概率都为 δ )。

在情形下,两个厂商都实行“触发策略”是可能

的。

假设垄断价格为 pM 。

假设两家企业从一开始就选择价格 pM ,如果发现有厂商偏离此

价格,则在后续博弈中一直选择完全竞争价格 c。

如果某家厂商在第 K 期背离,选择一个略低于 pM 的价格得到整个市场,并因此得到垄断

利润(实际上略低于此)。

由于在后续博弈中,对方会采用触发策略进行惩罚,利润为零。

因此,背离的总收益为 π M 。

如果不背离,两家厂商在每一期都得到 π M 2 。

因此,没有厂商选择背离当且仅当

π M <

π M 1

2 1- δ

δ > 1 2

默契合谋成立的条件:

(1)厂商 A 的背叛行为很容易被厂商 B 察觉;

(2)厂商 B 愿意长

期采取自损性惩罚行为。

八、承诺性投资和进入阻止

在以前讨论厂商进入或退出市场时,都没有考虑厂商之间的策略性行为。

实际上,厂商在

决定进入或退出市场时,一般都会猜测其行为对于其对手的行为以及未来市场价格的影响。

 

在图 13.6 中,在位企业(企业 1)可以通过不可转移的投资(sunkcost),阻止竞争对手

(企业 2)进入市场。

因为有了这种不可转移的投资,企业 1 的“打击”威胁变得可信。

 

8

 

 

进入

1 ∙

打击容忍

⎛ 3 ⎫⎛ 2 ⎫

ç⎪ç ⎪

投资

不进入

⎛ 6 ⎫

ç ⎪

1

不投资

进入 ∙ 2不进入

1 ∙ ⎛10 ⎫

打击 容忍

⎝ 0 ⎭

⎛ -2 ⎫ ⎛ 3.5 ⎫

ç ⎪ ç  ⎪

图 13.6

P460,Example15.7 自学。

九、进入和不完全信息

 

十、不完全信息博弈

 

9

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 自然科学 > 物理

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1