博弈论第一章.docx

上传人:b****9 文档编号:25325609 上传时间:2023-06-07 格式:DOCX 页数:60 大小:160.20KB
下载 相关 举报
博弈论第一章.docx_第1页
第1页 / 共60页
博弈论第一章.docx_第2页
第2页 / 共60页
博弈论第一章.docx_第3页
第3页 / 共60页
博弈论第一章.docx_第4页
第4页 / 共60页
博弈论第一章.docx_第5页
第5页 / 共60页
点击查看更多>>
下载资源
资源描述

博弈论第一章.docx

《博弈论第一章.docx》由会员分享,可在线阅读,更多相关《博弈论第一章.docx(60页珍藏版)》请在冰豆网上搜索。

博弈论第一章.docx

博弈论第一章

 

1完整信息静态博弈

 

1.0对策论研究的内容与根本形式

 

对策论研究的内容

对策论研究多个行为主体的决议问题。

 

对策论研究的形式

博弈(game),由多个行为主体组成的系统。

Stackelbergmodel

Cournotmodel

 

博弈的种类

参加者行动的时间与次序

同时行动——静态博弈;

先后行动——动向博弈。

参加者的信息多少

信息同样——完整信息;

信息不一样——不完整信息。

 

1.1根本理论:

博弈的标准式和纳什平衡

 

例1少儿游戏:

“石头、剪刀、布〞。

 

博弈的准式表示(normal-formrepresentation)

 

(1)参加人(player).

n个参加人:

1,2,⋯,i,⋯,n.

(2)略(strategy).

一个参加人的略是他采纳的一个行。

参加人i的略:

si.

参加人i的略空:

Si.

略的一个合:

s={s1,s2,⋯,sn}.

化表示:

s-i={s1,⋯,si-1,si+1,⋯,sn}.

(3)利润(payoff).

参加人i的利润:

ui=ui(s1,s2,⋯,sn)

 

n个参加人博弈的准形式表示:

G={S1,S2,⋯S,n;u1,u2,⋯u,n}

 

完整信息(completeinformation):

每个参加人知道其余人的略空和利润。

静博弈(staticgame):

全部的参加人同行。

每一个人行,不知道其余人的行。

 

例1〔〕:

博弈{石、剪刀、布}的描绘:

参加人:

1,2。

略空:

S1=S2={石、剪刀、布}

利润:

两人出手的函数

u1(石,石)=0,u1(石,剪刀)=1,u1(石,布)=-1

 

u2(石,石)=0,u2(石,剪刀)=-1,u2(石,布)=1

⋯⋯

 

利润表:

两个参加人,有限个略的博弈的表示方法。

 

P2

石头剪刀布

 

石头

0,0

1,-1

-1,1

 

P剪刀

-1,1

0,0

1,-1

1

 

1,-1

-1,1

0,0

 

博弈的:

可否知道每个参加人的略?

 

例2:

囚犯窘境(ThePrisoner’sDilemma)

 

囚犯2

缄默招认

 

缄默

-1,-1

-9,0

囚犯1

招认

0,-9

-6,-6

 

囚犯1的考:

无方缄默是招,自己“招〞好于“缄默〞。

 

囚犯2的考:

无方什么,“招〞好于“缄默〞。

两人的:

(招,招)。

 

定:

si是si的格劣略〔strictlydominated〕,假如:

 

ui(si,s-i)ui(si,s-i)

 

“缄默〞是“招认〞的严格劣战略

 

例3:

参加人2

左中右

 

1,0

1,3

3,0

 

参加人1中0,20,16,0

 

0,

2

2,

4

5,

3

 

参加人1:

没有严格劣战略。

参加人2:

“右〞严格劣于“中〞

考虑:

重复剔除严格劣战略(iteratedeliminationofstrictlydominated

strategies)

可预示的两人选择:

(下,中)。

 

例4:

参加人2

左中右

 

0,4

4,0

5,3

 

参加人1中4,00,45,3

 

下3,53,56,6

 

两人都没有格劣略。

两人会如何各自的略?

 

定:

s*=(s1,⋯,n

是一个什平衡

(Nashequilibrium),

假如

*

s*)

ui(si*,s-i*)

ui(si,s-i*)

 

什平衡最大化的解

maxui=ui(s1*,⋯s,i,⋯s,n*)

siSi

 

各例中的什平衡:

囚犯窘境:

〔招,招〕

例3:

〔下,中〕

例4〔1.1.4〕:

(下,右).

 

什平衡与重复剔除格劣略的关系:

没有被剔除的独一的略合是什平衡.

假如略是一个什平衡,它在重复剔除格劣略后留下.

 

多个什平衡

 

例5性(thebattleoftheSexes)

 

帕特

歌剧拳击

 

歌剧

2,1

0,0

克里斯

拳击

0,0

1,2

 

纳什平衡:

(歌剧,歌剧),(拳击,拳击)

 

1.2应用

 

例古诺双头垄断模型〔CournotModelofDuopoly〕

 

二个公司,生产产量:

q12

q

市场需求:

P=a–Q,

Q=q1

2

+q

公司本钱:

Cii

i

(q)=cq,i=1,2.

公司利润:

i(q1,q2)=Pqi–Ci(qi)=(a–(q1+q2))qi–cqi,

博弈的描绘:

参加人:

公司1,公司2

战略:

产量qi

利润:

i(q1,q2)

公司i选择产量求

max

(s,,s*):

iij

siSi

 

一阶条件

d1=a–c–2q1–q2*=0

dq1

d2=a–c–q1*–2q2=0

dq2

厂商选择自己利润最大的产量

q1=acq2

q2=acq1

2

2

解纳什平衡得

q1*=q2*=ac

3

 

π1=π2=(a–c–(ac+ac))ac=(ac)2

3339

当ui是可微分的候,什平衡以下方程的的解:

ui(s1,s2

...,sn)=0,i=1,⋯n,

si

思虑:

用重复剔除格劣略求什平衡

 

比:

假如两个厂商生

q1=q2=ac

4

2

π1=π2=(a–c–(ac+ac))ac=(ac)

4448

 

例特德双断模型〔BertrandModelofDuopoly〕

 

两个企生有差的商品。

消者企i的需求

qi(pi,pj)=a–pi+bpj,

本钱:

Ci(qi)=cqi,i=1,2.

略si:

pi0

利润:

i(pi,pj)=(a–pi+bpj)(pi–c)

 

什平衡(p1

2

*,p*)

max

i(pi,pj*)

=max(a–pi+bpj*)(pi–c)

解得p1

2

a

c

*=p*=

2

b

 

例最后要价仲裁(Final-offerArbitration)

 

一个公司和一个工会,经过一个仲裁员决定薪资。

公司和工会同时提出薪资:

wf,wu

仲裁员有一个标准:

x,选择两方建议中比较凑近x的建议:

假如x<(wf+wu)/2,那么wf

假如x>(wf+wu)/2,那么wu

 

wf(wf+wu)/2xwu

 

公司和工会不知道x,但知道x

的散布函数F(x)和密度函数f(x)。

剖析

wf被选择的概率:

Prob{x

2

wu

}=Fwf

2

wu

wu被选择的概率:

Prob{x>wf

2

wu}=1–F

wf

wu

2

希望薪资

Ew=wfF

wf

wu

+wu1–F

wf

wu

2

2

wf*

知足

min

wfF

wf

wu*

+wu*

1–F

wf

wu*

wf

2

2

wu*

知足

max

wf*F

w*f

wu+wu

1–F

w*f

wu

wu

2

2

 

由一阶条件

F

wfwu

+1wff

wf

wu-1wuf

wfwu=0

2

2

2

2

2

 

1wff

wfwu

+1-Fwf

wu-1wuf

wfwu=0

2

2

2

2

2

 

由此解出薪资的平衡建议。

 

两式相减

 

F

wf

wu

=1

2

2

两式相加

u

wf

wu

f

wf

wu

=1

w*f

2

–w*f

2

假如x

为正态散布:

x~N(m,

2)

w*f

wu*

=m

2

wu*–wf*=1

=2

2,

f(m)

纳什平衡

 

wu*=m+2/2,wf*=m–2/2

 

例公共财富问题

 

一个乡村,有n个村民,在公共草地上放羊。

村民i放牧的羊数:

gi

全村的羊总数:

G=g1+...+gn

养一只羊的(个人)本钱为c,一只羊的价值为v(G)

当G0,v'(G)<0,v''(G)<0

 

当G>Gmax,v(G)=0

每个村民选择养羊数目使自己利润最大

giv(G)–cgi

一阶条件

v(G)+giv'(G)–c=0,i=1,...,n

将n个等式相加获得

nv(G)+Gv'(G)–nc=0

即纳什平衡G1知足

v(G1)+G1v'(G1)–c=0

n

全村在总利润最大的放牧数G2知足

maxG2v(G2)–cG2

一阶条件

v(G2)+G2v'(G2)–c=0

G1与G2哪一个大?

G1大

 

v

 

v(G)

OGmaxG

 

Gv'(G)/n

 

v'(G)

Gv'(G)

 

决议问题:

在条件变差时,利润上涨仍是降落?

在往常的(一人)决议中,假如有几个选择,决议者选择利润最大的一个。

假如外界条件改变,使他的一个或几个利润降落,那么它不论如何选择,

都不会使利润比本来更大。

在一块田里选择栽种的(纯)收入:

棉花

3000元

花生

3700元

玉米

3500元

假如本钱上涨,收入变成

棉花

3000元

花生

3200元

玉米

3400元

人决议利润往常降落

在多人决议时的利润降落与增添

〔1〕初始时

参加人

2

1

2

T

T

S

5,4

8,3

1

参加人1

S

4,3

6,5

2

 

平衡为〔S1,T1〕,参加人1的利润为5。

〔2〕外界条件使参加人1在选择S1时的利润降落

参加人2

T1T2

 

S13,45,2

参加人1

S24,36,5

 

平衡〔S2,T2〕

参加人1的利润6。

 

多人决议,利润可能上涨。

 

混淆战略和平衡的存在

 

例1少儿游:

“石、剪刀、布〞不存在什平衡。

如何略?

 

例6猜硬(MatchingPennies)

参加人2

正面反面

正面

-1,1

1,-1

参加人1

反面1,-1-1,1

 

也不存在什平衡。

 

将本来的略

sik称略(purestrategy)。

略空

Si

〔i1,⋯,iK〕。

=s

s

混淆略(mixedstrategy):

略空Si的概率散布

i〔i1,⋯,iK〕

:

p=pp.

——由参加人定。

〔参加者在可行中全部行的一个概

率散布〕

利润:

vi

(p

1,⋯,n

k

jjk

i1,⋯,n

p)=

p

)u(s

s)

=Eui(s1,⋯,sn)

 

——由概率算的希望。

的情况:

二个参加人

S1={s11,⋯,s1J},S2={s21,⋯s,2K}利润:

JK

v1(p1,p2)=p1jp2ku1(s1j,s2k)

j1k1

 

猜硬的利润:

假如

p1=(1,

3),p2

=(

1,2),

4

4

3

3

v1

=–1

×1

+

1×2+

3×1

–3×2

=-1/6

4

3

4

3

4

3

4

3

v2

=

1

1

1

2

3

1

3

2

4

×–×–

4

×

+

4

×=1/6

3

4

3

3

3

随意的混淆略,

p1

1-p)

2

1-q),

=(p

p=(q

v1(p1,p2)=pq(-1)+p(1-q)+(1-p)q+(1-p)(1-q)(-1)

=2p(1-2q)+2q-1

v2(p1,p2)=pq+p(1-q)(-1)+(1-p)q(-1)+(1-p)(1-q)

=2q(2p-1)+1–2p

 

混淆略中的劣略

 

例7

参加人2

LR

 

T

3,--

0,--

 

参加人1M

0,--

3,--

 

B

1,--

1,--

 

假如只考略,B不是格劣略。

在略,假如参加人

 

L,那么1选T,假如参加人2选R,那么1选R。

可否剔除B?

 

假如1选择p=(0.5,0.5,0),那么对2的任何混淆战略(q,1–q)

v1(p,q)=0.5q3+0.5(1-q)0+0.5q0+0.5(1-q)3=1.5考虑以概率1选择B,即pB=(0,0,1),那么

v1(pB,q)=q1+(1-q)1=1

即B为p的严格劣战略。

 

v

 

3

MT

 

p

1B

 

O1q

仿佛能够剔除B?

假如改写一下:

参加人2

LR

 

T

3,--

0,--

 

参加人1M

0,--

3,--

 

B

2,--

2,--

 

结果有何变化?

 

给出其余人的混淆战略p-i,i的最优反应:

p

vi(pi,p-i)vi(pi,p-i)

 

例6〔续〕在猜硬币中,参加人1的利润:

v1(p1,p2)=pq(-1)+p(1-q)+(1-p)q+(1-p)(1-q)(-1)

=2p(1-2q)+2q-1

参加人1的最优反应

假如q1,p=1;

2

假如q1,p=0;

2

假如q=1,p在[0,1]中随意。

2

参加人2的利润:

v2(p1,p2)=pq+p(1-q)(-1)+(1-p)q(-1)+(1-p)(1-q)

=2q(2p-1)+1–2p

参加人2的最优反应

假如p1,q=0;

2

假如p1,q=1;

2

假如p=1,q在[0,1]中随意。

2

pp

 

11

 

1/2

 

O

1/2

1q

O

1

q

参加人1

参加人2

 

混淆战略的纳什平衡

 

什平衡:

p*=〔p1*,⋯,pn*〕足

vi(p*i,p*-i)vi(pi,p*-i)

什平衡最大化的解

maxvi=vi(p1*,⋯p,i,⋯p,n*)

pi

在猜硬中,{〔1

1

〕,〔1

1〕}是一个什平衡.

2

2

2

2

p

 

1

 

O1/21q

 

例8性〔〕

克里斯取混淆略(p,(1–p)),帕特取〔q,(1–q)〕

克里斯利润

v1=2pq+(1-p)(1-q)

=p(3q-1)+1-q

她的最反

p=0,当q

1,

3

p=1,当q

1

3

p随意在[0,1]中,当q=1

3

 

帕特利润

v2=pq+2(1-p)(1-q)

=q(3p-2)+2–2p

 

他的最优反应

q=0,当p

2;

3

q=1,当p

2;

3

q随意在[0,1]中,当p=2.

3

 

pp

 

O

 

q

 

O

 

q

克里斯

帕特

 

纳什平衡:

{(2,1),(1,2)};

3333

{(0,1),(0,1)};

{(1,0),(1,0)}.

 

纳什平衡的存在

二个参加人,二个战略

参加人2

LR

 

Ux,ay,b

参加人1

Dz,cw,d

 

参加人1的混淆战略:

(p,1-p);

参加人2的混淆战略:

(q,1-q).

 

参加人1的利润:

v1(p,q)=pqx+p(1–q)y+(1–p)qz+(1–p)(1–q)w=p[q(x–z+w–y)–(w–y)]+q(z–w)+w

分3种状况:

(1)x–z+w–y=0。

v1(p,q)=p(y–w)+q(z–w)+w

p=1,当yw;

p=0,当yw;

p[0,1],当y=w.

p

p

 

O

 

q

 

O

 

q

yw

yw

 

(2)x

 

–z+w–y

p=0,当q

p=1,当q

 

0

(w

(w

 

–y)/(x–y)/(x

 

–z+w–z+w

 

–y)

–y);

p[0,1],当q=(w–y)/(x–z+w–y).

 

p

 

O

 

q

0(w

–y)/(x

–z+w

–y)

1

 

pp

 

OqOq

1(w–y)/(x–z+w–y)(w–y)/(x–z+w–y)0

 

(3)x–z+w–y0

p=1,当q(w–y)/(x–z+w–y);

p=0,当q(w-y)/(x–z+w–y),

p[0,1],当q=(w-y)/(x–z+w–y).

 

p

 

Oq

0(w–y)/(x–z+w–y)<1

 

pp

 

OqOq

(w–y)/(x–z+w–y)01(w–y)/(x–z+w–y)

 

最优反应曲线一共能够归纳为4种状况。

 

似的剖析可得参加人2的最反曲只有4种可能:

 

pp

 

O

 

p

 

q

 

O

 

p

 

q

 

OqOq

 

什平衡的存在:

参加人1的任何最反与参加人2的任何最

反起码有一个交点。

 

超二个参

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 人文社科 > 文学研究

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1