供应链系统的部分合作博弈研究解析Word文件下载.docx

资源描述

供应链系统的部分合作博弈研究解析Word文件下载.docx

《供应链系统的部分合作博弈研究解析Word文件下载.docx》由会员分享，可在线阅读，更多相关《供应链系统的部分合作博弈研究解析Word文件下载.docx（11页珍藏版）》请在冰豆网上搜索。

供应链系统的部分合作博弈研究解析Word文件下载.docx

重复博弈;

部分合作博弈;

合作关系

中图分类号:

F273.7;

F224.32　　　文献标识码:

A　　　文章编号:

100727375（200704ResearchonQuasi2CooperativeeiSystem

ZHAO2（1.Schoolofment,Tianjin300072,China;

2.DepartmInstitute,Shenzhen518029,China

Abstract:

Aitheonobstacleexistingininformationandknowledgesharinginsupplychainduetooftrustmechanismandslackofcontractconstraint,thispaperputsforwardtheconceptofquasi2cooperativegameusingcooperativegametheory,analysesthegenerationresonsofquasi2coopera2tivegame,andthendesignstheimprovedquasi2cooperativegamestrategyfortransferringandoptimizingthedynamicstructureofrepetitivegame.Finallyitpresentsseveralsuggestionsinordertoobtainanden2hancetrustandimprovesupplychaincooperation.

Keywords:

supplychainsystem;

repetitivegame;

quasi2cooperativegame;

cooperativerelationship

　　供应链管理是设计和保持一种良好的机制和模

式,通过资源集成,借助合作企业的力量更好地发挥自身的核心优势,使自身和整个供应网络获得竞争优势的过程

[1]

。

显然,供应链管理目标的实现依赖于结点企业的业务与能力的有效集成,而集成的核心则是供应链合作关系的实现,合作与协调是供应链管理的永恒主题。

供应链合作关系其实就是供应链节点企业在一定时间内的分享信息、共担风险和共享利益的协议。

然而,在企业个体利益最大化的理性假设和企业信用普遍缺失的现实情况下,供应链合作关系的实现是理论与实践中的难题。

因此,供应链合作关系形成机理和途径的研究,对于构建与优化供应链系统,改善与指导供应链运营具有重要的理论与现实意义。

博弈论是研究供应链合作关系的主要工具之

一。

纳什将博弈分为合作博弈与非合作博弈两大类。

一般认为,合作博弈是局中人能够交换信息且合作协议具有强制性,而非合作博弈则是局中人既不能交换信息又不具有强制性约束协议

[2]

假设供应链上供应商与经销商是理性的,那么

支持合作博弈进行的是对博弈参与人的具有完全约束力的协议和充分的沟通与信任。

原则上,条款完备的协议以及充分沟通与信任的建立可以使局中人双方突破囚徒困境,实现帕累托均衡而进行合作博弈。

目前,运用博弈分析体系,尤其是合作博弈理论,研究供应链系统中成员企业之间既考虑个体理性与成员企业的收益,又顾及供应链系统收益的互动对策已有许多成果。

有关供应链信息价值的大部分研究肯定了信息共享具有价值。

马新安等

[3]

研究

了通过激励伙伴信息共享活动来提高供应链绩效的

　　工　业　工　程第10卷　

问题。

石小法和杨东援[4]研究了一个供应商和n个零售商的两级供应链模型,认为信息共享可以降低供应商的存货水平,降低供应商的期望费用。

但是,理论界对于供应链信息价值定量化的分析结果差异甚大。

D’Amours2Montreuil2Lefrancois2Soumis[5]模型揭示了供应链信息共享的程序直接决定了最优的供应链结构。

但是Cachon2Fisher[6]的模型认为,信息共享可以降低供应链成本的12.1%。

而F.Chen[7]的模型则指出信息共享对降低供应链费用的贡献最高达9%。

万杰等人[8]的研究认为,在市场需求不稳定,且零售商和生产商都采用固定间隔库存策略时,供应链各方只是共享信息,并不能完全消除订货波动。

看来,理论界部分人士与供应链软件供应商着力推崇的信息共享,并非是解决供应链系统成员企业博弈困境的最有效途径

竞争力的数据,

博弈的障碍[9],供应链是动态的,核心企业与其上下游企业在不断追求优越收益分配中,一方面促进供应链结构的稳定,另一方面却又要不断优化供应链,保持动态灵活性。

刘志学和许泽勇[10]在3PL的运作能力与努力水平均为非透明信息的假设前提下,建立了3PL与其客户之间的合作博弈模型,利用最大值原理求解得出博弈双方的合作策略。

李建标和武立东[11]则认为合作博弈与非合作博弈的区别主要在于主体的行为相互作用时,当事人能否达成一个具有约束力的协议,如果能,就是合作博弈,反之则为非合作博弈。

他们还认为在供应链联盟的构建中,基于信任的合作是最根本的理念。

上述有关供应链博弈的研究主要是基于合作博弈理论来进行的。

这些研究没有涉及和揭示部分合作前提的博弈。

事实上,在合作与非合作博弈之间存在大量的中间状态的博弈,此类博弈中的协议并非都具有强制力。

并且,在博弈的某些阶段可能存在某些有强制力的协议,而其他阶段这些协议的强制力会弱化甚至消失,也有可能会出现新的有强制力的协议[12]。

通常,供应链成员企业合作竞争关系的博弈形式,一方面协议约束力不足,另一方面,博弈双方局中人为持有私有信息,缺乏信息共享的驱动力,导致信任程度滞留在低水平。

对于合作与非合作博弈之间状态博弈产生的机理与演化途径,至今并没有人给出进一步的研究与结论。

本文研究的焦点是在企业信任机制欠缺、协议约束松弛的双重影响下,供应链系统成员企业合作的生成与改进。

1　部分合作博弈的存在与界定在供应链管理实践中牛鞭效应的产生表明:

供应链成员企业之间,要么缺乏协议的约束,要么缺乏通信与信任,甚至两者皆有缺失。

牛鞭效应还反映

弈。

但是,

彻底瓦解,,成,

一定程度的合作始终与。

全合作亦非完全非合作博弈,而是处于两者之间的一种博弈。

供应链合作伙伴之间的博弈其实是在一个类似半闭半开区间[非合作博弈,合作博弈两极之间某一点上的博弈。

当供应链系统牛鞭效应发生的初始条件具备时,供应链成员企业的合作关系迅速衰减,之后需要经过长时间的库存消化与信用重建,供应链成员企业之间关系向合作博弈演进。

当然,如果成员企业之间合作关系彻底破裂,就会在半闭半开区间[非合作博弈,合作博弈上移动到非合作博弈。

在此,笔者将处于部分强制力协议约束或（与一定程度信任支持的博弈称为“部分合作博弈”。

参与人在博弈中的合作受到合作协议所具有的约束力和局中人相互的信任程度的综合影响。

真实的供应链合作博弈实际上是在由这两个因素组成的空间中某一点的博弈,如图1所示

图1　部分合作博弈区间组合

　　部分合作博弈可能会这样演化:

当部分合作博弈处于协议有约束力与有相互信任二者之一或二者均较低的状态时,就会导致部分合作博弈退化。

典型的导致退化的行为包括滥用协议约束松弛以获得额外收益和降低对另一方的信任程度以避免风险等。

任何导致合作退化的行为与策略的运用都可能使合作博弈退化并收敛为非合作博弈。

而不断采取促进合作的进化行为与策略会促进部分合作博弈所处的位置趋向图1右上方的合作博弈。

在供应链系统中,制造商（以下简称甲与零部件供应商（以下简称乙的交易是一种博弈,博弈局中人本质上是异质且相互依赖的。

在此,假设博弈局中人的博弈地位与权力等同。

甲乙的策略行动空间是（C,D,C表示彼此相互完全信任,D表示签订具有完全严格约束力的协议,

条款松弛。

。

甲　CD

0,66,0,

图2　期望支付矩阵

　　博弈协调均衡在（C,C与（D,D实现,即完全的信任或完全的协议约束力都会导致均衡。

但是具有完全约束力的协议达成,需要较高交易成本的投入,而造成双方期望收益的降低。

在供应链系统中,制造商与零件供应商之间的博弈是重复博弈,博弈的历史可被观察到。

在此,将甲乙双方重复博弈表示为G={I,S,μ},I是参与者集合,S是所有参与者策略空间,μ是所有参与者的收益函数。

如果重复博弈只进行T次,就是有限重复博弈,用G（T表示;

如果重复博弈进行了无穷多次,就是无限重复博弈,用G（∞表示。

用g（T表示第T次博弈。

在供应链系统的部分合作博弈中,完全和完美信息一般难以获取,而无论预先制订怎样周详的协议,动态且持续的博弈环境都始终存在着约束松弛。

因此,图2中（C,C或（D,D协调均衡在供应链实践中是难以实现的。

在部分合作博弈状态中,博弈双方的行动或策略组合远远超过（C,C或（D,D两种。

在策略空间内存在一个所有部分合作策略组合构成的集M。

令E是具有部分约束力协议与部分信任组合的策略组合集。

在现实世界中,VMI、JIT以及预付订金等供应链运营模式,都属于不同程度约束力协议与信任的组合的部分合作博弈,都可以应用于M中的某个组合点。

对图2所示的博弈进行改造,在甲乙双方局中人行动空间中插入某个具体的行动E∈M,得到图3所示博弈。

　　　　乙

C　　　E　　　D

0,6

5,1,1,4

6,04,1,

图3　部分合作博弈第一阶段期望支付矩阵

　　在此,引入博弈合作度指标α∈〔0,1〕来衡量部分合作博弈不同策略组合实现的合作程度:

各阶段博弈帕累托收益之和

假设在重复博弈G（∞前两个阶段博弈G（2中,彼此不知道对方的类型,只有在第一个阶段博弈中识别对手行动并进而断定其类型,在下一个阶段博弈中调整策略。

如果在第一阶段博弈中双方信用类型匹配,下一阶段博弈继续维持;

否则,损失方在第二阶段会采用“彻底的”针锋相对策略（Titfortatstrategy,采用行动D,而获利方则会采取对应策略D,以争取保留价值,即:

若g（1的策略组合是（C,C,g（2仍选C,G（2可能实现策略组合为{（C,C,（C,C},其总期望支付值是{（10+10,（8+8}={20,16}。

若g（1的策略组合是（E,E,g（2仍选E,G（2可能实现行动组合{（E,E,（E,E},其总期望支付值是{14,14}。

若g（1的策略组合是（D,D,g（2仍选D,G（2可能实现行动组合{（D,D,（D,D},其总期望支付值是{6,4}。

若g（1的策略组合是（C,E或（C,D（策略组合中前者是一方的策略,后者是另一方的策略,g（2为（D,D。

前两个阶段博弈G（2可能实现的行动组合{（C,E,（D,D}或{（C,D,（D,D},其

总期望支付值相应为{4,7}或{3,8}。

若g（1的策略组合为（E,D或（E,C,g（2为（D,D,G（2可能实现行动组合{（E,D,（D,D}或{（E,C（D,D},其总期望支付值相应为{4,6}或{8,3}。

若g（1的策略组合为（D,E或（D,C,g（2为（D,D,G（2可能实现行动组合{（D,E,（D,D}或{（D,C（D,D},其总期望支付值相应为{7,3}或{9,2}。

由上述分析可得图4“彻底的”针锋相对策略的G（2的两阶段总期望支付矩阵。

甲　C

ED,4,73,8

8,39,27,3,图4　“彻底的”针锋相对策略的G（2的总期望支付矩阵

　　这种奖惩机制规定,如果局中人双方初始阶段博弈的策略行为是信任程度匹配的,下一阶段博弈将重复进行这个行动组合;

如果初始阶段信任程度不匹配,则下一阶段博弈将退化到严格的协议约束策略（D,D,而百分之百严格的协议约束（D,D是需要付出契约制定成本的。

这个机制是G（2的纳什均衡。

在这样的纳什均衡自执行机制作用下,考察G（2初始阶段博弈采用三种不同初始策略而导致的策略组合合作度α发生的变化:

　　假设该重复博弈每个阶段博弈都重复采取（D,D,选择完全互不信任,使用完全约束力协议来规范

博弈,得到的策略组合合作度为α20+1618

假设该重复博弈每个阶段博弈都重复采取（C,C,选择完全诚信合作,得到的策略组合合作度是α=1。

后者是达到阶段博弈的帕累托均衡收益。

由上述分析得到重复博弈G（2的策略组合合作度区间

是α∈18

1]。

再考察重复博弈G（∞前两个阶段博弈G（2的初始阶段采用3种不同策略而导致策略组合合作度α发生的变化:

g（1为（D,D,g（2采取（D,D,则αDD=

策略组合合作度αDD处于区间下限,博弈的合作程度较低;

g（1为（C,C,g（2采取（C,C,αCC=1,策略组合合作度αCC处于区间上限,这是一种完全合作博弈,合作程度最高;

g（1为（E,E,g（2采取（E,E,αEE=

策略组合合作度αEE处于区间中游,合作程度明显高于第一种情况。

在g（1中,（C,CD,D（E,这三种策略组合中,。

这里引入一个———系统平均合作β∈[0,1],两个端点分别表示完全不合作和完全合作。

用G（T匹配表示信任程度相互匹配的重复博弈,其初始博弈是以相等概率采取（C,

C、（D,D、（E,E3种策略组合,则G（2匹配的平均合作度为

β（G（2匹配=3（αDD+αCC+

αEE54

显然,此时供应链系统的完全合作未能实现。

在g（1中,假设双方局中人以等概率采取每一个策略组合,即不管初始阶段双方的信任是否匹配,在彻底的针锋相对机制下,G（2的系统平均合作度为

β彻底（G（2=9

（αDD+αCC+αEE+αCE+αCD+

αEC+αED+αDC+αDE=

由以上两式可知,系统平均合作度β彻底（G（2明显低于β（G（2匹配。

由此可见。

供应链的系统平均合作度不仅与初始阶段博弈局中人双方采取的诚信是否匹配有关,而且与双方诚信的匹配水平也相关。

由以上分析可得结论:

在供应链系统中,制造商与供应商双方如果采取了高度诚信的匹配来进行试单交易,将有利于供应链系统维持较高的合作程度;

如果信任程度不匹配,在第二阶段博弈中,双方都会投入成本以加强协议约束力,从而导致合作度降低;

如果信任程度低水平匹配,下一阶段博弈会重复这种匹配,系统平均合作度将保持在一起低水平。

2　部分合作博弈的策略改进

无名氏定理

[13]

认为,在无限重复博弈G（∞

　第4期赵道致,沐　潮:

供应链系统的部分合作博弈研究　　　

中,如果贴现因子δ充分接近1,则G（∞存在合作解的子博弈完美均衡,这个合作解不是阶段博弈的纳什均衡。

在无限重复博弈G（∞中,有合作解存在的可能,这种合作解能够实现比采用阶段博弈更高的平均收益,但是也并不可能实现阶段博弈的帕累托收益。

因为只要在G（∞中某个阶段博弈有部分信任缺失,即有个别或部分阶段博弈没有采取策略组合（C,C,G（∞平均收益就会低于阶段博弈的帕累托收益,整个G（∞就会处于部分合作状态而成为部分合作博弈。

在G（∞中,针锋相对策略所描述的重复的或随机的信任缺失,使得部分合作博弈的合作程度更为低下。

因为,针锋相对策略不仅会降低信任程度,而且在信任缺失模式被识别后,本来天真的对手会通过学习变得老练。

如果要恢复有限合作,

罚背叛的局中人为条件上,

合（C,D或（D,C

（C,C

假设在第t-1阶段博弈中,局中人甲采用判断策略D。

甲在第t次阶段博弈中悔过,采用策略C,而乙方则会采用惩罚策略D,形成策略组合（C,D。

老练的乙方在t+1次阶段博弈中,并不一定会选择合作C,甚至也不采用部分合作策略E,而且惩罚先前信任缺失者甲方多次,即从第t阶段博弈开始持续惩罚t+i次,局中人乙才予甲方以有限合作,恢复采用E或C。

这就是所谓的“延迟的针锋相对策略”。

这是更为老练的策略,对于先背叛而后又希望合作的局中人,这是艰难的考验,考验的艰难程度与惩罚的次数i相关。

在考验的第1到i次过程中,甲有可能再度信任缺失,甚至在了解对手坚持采用“延迟的针锋相对策略”后,甲方干脆不悔过,保持信任缺失。

实践表明,供应链系统中老的核心企业,通过进化学习,运用“延迟的针锋相对策略”,降低供应链系统的合作程度,导致系统收敛到非合作博弈的可能性增加,最终使得G（∞的系统平均合作度β（G（∞大为降低。

避免系统合作程度的降低,需要重点研究。

笔者在上述分析的重复博弈G（∞前两个阶段博弈G（2中,设计一种“有限程度”的报复机制（或称谅解机制,以求获取较好的系统合作程度。

这个机制规定:

局中人双方初始阶段博弈如果信任程度匹配,下一阶段博弈重复进行;

如果信任程度不匹配,即如果一方在首次阶段博弈中,投入的信任程度弱于对方一级,则在次阶段增加一级;

如果投入的信任程度弱于对方两级,则次阶段采取D,双方陷入（D,D。

相反,如果一方在首次阶段博弈中投入的信任程度高于对方一级,则在次阶段立即降低一级;

如果投入的信任程度高于对方两级,则在次阶段立即降低两级,双方陷入（D,D。

演示上述机制如下:

若g（1的策略组合是（C,E,第二阶段一方选

C,G（2的行动组合为{（C,E,（E,C},其总期望支付值是{（1+5（5+1}={（6,6};

若g（1的策略组合是（,g（2一方选E,G（2,E},其总期望支{6,;

（1（E,D,g（2一方选E,G{（E,D（D,E},其总期望支付5,5};

若g（1的策略组合是（D,E,g（2一方选D,G（2的行动组合为{（D,E,（E,D},其总期望支付值是{5,5};

若g（1的策略组合是（C,D,g（2一方选D,G（2的行动组合为{（C,D（D,D},其总期望支付值是{3,8};

若g（1的策略组合是（D,C,g（2一方选D,G（2的行动组合为{（D,C（D,D},其总期望支付值是{9,2}。

根据图3的数据和上述两阶段博弈行动组合,可以得到图5“有限程度”报复策略G（2的总期望支付矩阵。

甲　

6,63,8

6,6,5,5

9,25,5,

图5　“有限程度”报复策略G（2总期望支付矩阵　　在G（2的初始阶段博弈中,假设双方局中人在初始阶段博弈,采取每一个行动组合的概率是相等的,即不管初始阶段双方的信任匹配或不匹配,可得使用“有限程度”报复（即谅解策略机制的G（2的系统平均合作度为:

　　6工　　　业工程第10卷　β（G（2=1（α+α+αEE+α+α+谅解DDCCCECD935αEC+αED+α+αE=。

DCD81比较β（G（2和β（G（2可知,“有限程谅解彻底度”报复策略（即谅解机制的G（2的系统平均合作度β（G（2高于使用彻底的针锋相对策略的谅解G（2的

展开阅读全文