博弈论 第一章.docx

上传人:b****6 文档编号:3239146 上传时间:2022-11-20 格式:DOCX 页数:21 大小:77.67KB
下载 相关 举报
博弈论 第一章.docx_第1页
第1页 / 共21页
博弈论 第一章.docx_第2页
第2页 / 共21页
博弈论 第一章.docx_第3页
第3页 / 共21页
博弈论 第一章.docx_第4页
第4页 / 共21页
博弈论 第一章.docx_第5页
第5页 / 共21页
点击查看更多>>
下载资源
资源描述

博弈论 第一章.docx

《博弈论 第一章.docx》由会员分享,可在线阅读,更多相关《博弈论 第一章.docx(21页珍藏版)》请在冰豆网上搜索。

博弈论 第一章.docx

博弈论第一章

1完全信息静态博弈

1.0对策论研究的内容与基本形式

对策论研究的内容

对策论研究多个行为主体的决策问题。

对策论研究的形式

博弈(game),由多个行为主体构成的系统。

Stackelbergmodel

Cournotmodel

博弈的类型

参与者行动的时间与顺序

同时行动——静态博弈;

先后行动——动态博弈。

参与者的信息多少

信息相同——完全信息;

信息不同——不完全信息。

1.1基本理论:

博弈的标准式和纳什均衡

例1儿童游戏:

“石头、剪刀、布”。

博弈的标准式表示(normal-formrepresentation)

(1)参与人(player).

n个参与人:

1,2,…,i,…,n.

(2)战略(strategy).

一个参与人的战略是他采取的一个行动。

参与人i的战略:

si.

参与人i的战略空间:

Si.

战略的一个组合:

s={s1,s2,…,sn}.

简化表示:

s-i={s1,…,si-1,si+1,…,sn}.

(3)收益(payoff).

参与人i的收益:

ui=ui(s1,s2,…,sn)

n个参与人博弈的标准形式表示:

G={S1,S2,…,Sn;u1,u2,…,un}

完全信息(completeinformation):

每个参与人知道其他人的战略空间和收益。

静态博弈(staticgame):

所有的参与人同时行动。

每个人行动时,不知道其他人的行动。

例1(续):

博弈{石头、剪刀、布}的描述:

参与人:

1,2。

战略空间:

S1=S2={石头、剪刀、布}

收益:

两人出手的函数

u1(石头,石头)=0,u1(石头,剪刀)=1,u1(石头,布)=-1

u2(石头,石头)=0,u2(石头,剪刀)=-1,u2(石头,布)=1

……

收益表:

两个参与人,有限个战略的博弈的表示方法。

P2

石头剪刀布

石头0,01,-1-1,1

P1剪刀-1,10,01,-1

布1,-1-1,10,0

 

博弈的问题:

能否知道每个参与人选择的战略?

例2:

囚徒困境(ThePrisoner’sDilemma)

囚徒2

沉默招认

沉默-1,-1-9,0

囚徒1

招认0,-9-6,-6

 

囚徒1的考虑:

无论对方选沉默还是招认,自己选“招认”好于“沉默”。

囚徒2的考虑:

无论对方选什么,“招认”好于“沉默”。

两人的选择:

(招认,招认)。

定义:

si是si的严格劣势战略(strictlydominated),如果:

ui(si,s-i)ui(si,s-i)

“沉默”是“招认”的严格劣战略

例3:

参与人2

左中右

上1,01,33,0

参与人1中0,20,16,0

下0,22,45,3

 

参与人1:

没有严格劣战略。

参与人2:

“右”严格劣于“中”

考虑:

重复剔除严格劣战略(iteratedeliminationofstrictlydominatedstrategies)

可预见的两人选择:

(下,中)。

例4:

图1.1.4

参与人2

左中右

上0,44,05,3

参与人1中4,00,45,3

下3,53,56,6

 

两人都没有严格劣战略。

两人会如何选择各自的战略?

定义:

s*=(s1*,…,sn*)是一个纳什均衡(Nashequilibrium),如果

ui(si*,s-i*)ui(si,s-i*)

纳什均衡为最大化问题的解

ui=ui(s1*,…,si,…,sn*)

各例中的纳什均衡:

囚徒困境:

(招认,招认)

例3:

(下,中)

例4(图1.1.4):

(下,右).

纳什均衡与重复剔除严格劣势战略的关系:

没有被剔除的唯一的战略组合是纳什均衡.

如果战略是一个纳什均衡,它们在重复剔除严格劣势战略后留下.

多个纳什均衡

例5性别战(thebattleoftheSexes)

帕特

歌剧拳击

歌剧2,10,0

克里斯

拳击0,01,2

纳什均衡:

(歌剧,歌剧),(拳击,拳击)

1.2应用

例古诺双头垄断模型(CournotModelofDuopoly)

二个企业,生产产量:

q1,q2

市场需求:

P=a–Q,Q=q1+q2

企业成本:

Ci(qi)=cqi,i=1,2.

企业利润:

i(q1,q2)=Pqi–Ci(qi)=(a–(q1+q2))qi–cqi,

博弈的描述:

参与人:

企业1,企业2

战略:

产量qi

收益:

i(q1,q2)

企业i选择产量求

i(si,,sj*):

一阶条件

=a–c–2q1–q2*=0

=a–c–q1*–2q2=0

厂商选择自己利润最大的产量

q1=

q2=

解纳什均衡得

q1*=q2*=

利润

π1=π2=(a–c–(

+

))

=

当ui是可微分的时候,纳什均衡为下列方程组的的解:

=0,i=1,…,n

思考:

用重复剔除严格劣势战略求纳什均衡

比较:

如果两个厂商生产

q1=q2=

利润

π1=π2=(a–c–(

+

))

=

例贝特兰德双头垄断模型(BertrandModelofDuopoly)

两个企业生产有差别的商品。

消费者对企业i的需求

qi(pi,pj)=a–pi+bpj,

成本:

Ci(qi)=cqi,i=1,2.

战略si:

pi0

收益:

i(pi,pj)=(a–pi+bpj)(pi–c)

纳什均衡(p1*,p2*)满足

maxi(pi,pj*)=max(a–pi+bpj*)(pi–c)

解得p1*=p2*=

例最后要价仲裁(Final-offerArbitration)

一个企业和一个工会,通过一个仲裁人决定工资。

企业和工会同时提出工资:

wf,wu

仲裁人有一个标准:

x,选择双方提议中比较靠近x的提议:

如果x<(wf+wu)/2,则wf

如果x>(wf+wu)/2,则wu

 

wf(wf+wu)/2xwu

企业和工会不知道x,但知道x的分布函数F(x)和密度函数f(x)。

分析

wf被选择的概率:

Prob{x<

}=F

wu被选择的概率:

Prob{x>

}=1–F

期望工资

Ew=wfF

+wu1–F

wf*满足

wfF

+wu*1–F

wu*满足

wf*F

+wu1–F

由一阶条件

F

+

wff

-

wuf

=0

wff

+1-F

-

wuf

=0

由此解出工资的均衡提议。

两式相减

F

=

两式相加

wu*f

–wf*f

=1

如果x为正态分布:

x~N(m,2)

=m

wu*–wf*=

=

纳什均衡

wu*=m+

wf*=m–

例公共财产问题

一个村庄,有n个村民,在公共草地上放羊。

村民i放牧的羊数:

gi

全村的羊总数:

G=g1+...+gn

养一只羊的(私人)成本为c,一只羊的价值为v(G)

当G0,v'(G)<0,v''(G)<0

当G>Gmax,v(G)=0

每个村民选择养羊数量使自己收益最大

giv(G)–cgi

一阶条件

v(G)+giv'(G)–c=0,i=1,...,n

将n个等式相加得到

nv(G)+Gv'(G)–nc=0

即纳什均衡G1满足

v(G1)+

v'(G1)–c=0

全村在总收益最大的放牧数G2满足

maxG2v(G2)–cG2

一阶条件

v(G2)+G2v'(G2)–c=0

G1与G2哪一个大?

G1大

v

 

v(G)

OGmaxG

Gv'(G)/n

 

v'(G)

Gv'(G)

决策问题:

在条件变差时,收益上升还是下降?

在通常的(一人)决策中,如果有几个选择,决策者选择收益最大的一个。

如果外界条件改变,使他的一个或几个收益下降,则它无论怎样选择,都不会使收益比原来更大。

例在一块田里选择种植的(纯)收入:

棉花3000元

花生3700元

玉米3500元

如果成本上升,收入变为

棉花3000元

花生3200元

玉米3400元

人决策收益通常下降

例在多人决策时的收益下降与增加

(1)初始时

参与人2

T1T2

S15,48,3

参与人1

S24,36,5

均衡为(S1,T1),参与人1的收益为5。

(2)外界条件使参与人1在选择S1时的收益下降

参与人2

T1T2

S13,45,2

参与人1

S24,36,5

均衡变为(S2,T2)

参与人1的收益为6。

多人决策时,收益可能上升。

1.3混合战略和均衡的存在

例1儿童游戏:

“石头、剪刀、布”

不存在纳什均衡。

如何选择战略?

例6猜硬币(MatchingPennies)

参与人2

正面反面

正面-1,11,-1

参与人1

反面1,-1-1,1

也不存在纳什均衡。

将原来的战略sik称为纯战略(purestrategy)。

战略空间Si=(si1,…,siK)。

混合战略(mixedstrategy):

战略空间Si的概率分布:

pi=(pi1,…,piK).

——由参与人选定。

(参与者在可选行动中所有行动的一个概率分布)

收益:

vi(p1,…,pn)=k(jpjk)ui(s1,…,sn)

=Eui(s1,…,sn)

——由概率计算的期望值。

较简单的情形:

二个参与人

S1={s11,…,s1J},S2={s21,…,s2K}

收益:

v1(p1,p2)=

p1jp2ku1(s1j,s2k)

猜硬币的收益:

如果p1=(

),p2=(

),则

v1=–

×

+

×

+

×

×

=-1/6

v2=

×

×

×

+

×

=1/6

任意的混合战略,p1=(p,1-p),p2=(q,1-q),则

v1(p1,p2)=pq(-1)+p(1-q)+(1-p)

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 小学教育 > 语文

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1