数据包络分析法DEA概述.docx
《数据包络分析法DEA概述.docx》由会员分享,可在线阅读,更多相关《数据包络分析法DEA概述.docx(10页珍藏版)》请在冰豆网上搜索。
数据包络分析法DEA概述
(1)数据包络分析法(DEA)概述
数据包络分析(DataEnvelopmentAnalysis,简称DEA)方法是运用数学工具评价经济系统生产前沿面有效性的非参数方法,它适应用于多投入多产出的多目标决策单元的绩效评价。
这种方法以相对效率为基础,根据多指标投入与多指标产出对相同类型的决策单元进行相对有效性评价。
应用该方法进行绩效评价的另一个特点是,它不需要以参数形式规定生产前沿函数,并且允许生产前沿函数可以因为单位的不同而不同,不需要弄清楚各个评价决策单元的输入与输出之间的关联方式,只需要最终用极值的方法,以相对效益这个变量作为总体上的衡量标准,以决策单元(DMU)各输入输出的权重向量为变量,从最有利于决策的角度进行评价,从而避免了人为因素确定各指标的权重而使得研究结果的客观性收到影响。
这种方法采用数学规划模型,对所有决策单元的输出都“一视同仁”。
这些输入输出的价值设定与虚拟系数有关,有利于找出那些决策单元相对效益偏低的原因。
该方法以经验数据为基础,逻辑上合理,故能够衡量个决策单元由一定量大投入产生预期的输出的能力,并且能够计算在非DEA有效的决策单元中,投入没有发挥作用的程度。
最为重要的是应用该方法还有可能进一步估计某个决策单元达到相对有效时,其产出应该增加多少,输入可以减少多少等。
1978年由著名的运筹学家查恩斯(A.Charnes),库伯(W.W.Cooper)和罗兹(E.Rhodes)首先提出数据包络分析(DataEnvelopmentAnalysis,简称DEA)的方法,DEA有效性的评价是对已有决策单元绩效的比较评价,属于相对评价,它常常被用来评价部门间的相对有效性(又称之为DEA有效)。
他们的第一个数学模型被命名为CCR模型,又称为
模型。
从生产函数角度看,这一模型是用来研究具有多项输入、特别是具有多项输出的“生产部门”时衡量其“规模有效”和“技术有效”较为方便而且是卓有成效的一种方法和手段。
自从该方法提出以来,就广泛应用于各个行业的有效性评价上。
此后,得到不断的完善,并且在实践中的应用也越来越广泛。
例如1984年R.D.Banker,A.Charnes和W.W.Cooper给出了一个被称为BCC的模型,又称之为BC2模型。
另外,于1985年Charnes,Cooper和B.Golany,L.Seiford,J.Stutz给出了另一个模型,称为CCGSS模型,
又称之为C2GS2模型,这两个模型是用来研究生产部门之间的“技术有效”相对效率。
下面将介绍这两个优化模型。
(2)数据包络模型(又称为DEA模型)描述
数据包络分析(DEA)由美国著名运筹学家A.Charnes等人在1978年以相对效率概念为基础发展起来的一种新的绩效评价方法。
这种方法是以决策单元(DecisionMakingUnit,简称DMU)的投入、产出指标的权重系数为变量,借助于数学规划模型将决策单元投影到DEA生产前沿面上,通过比较决策单元偏离DEA生产前沿面的程度来对被评价决策单元的相对有效性进行综合绩效评价。
其基本思路是:
通过对投入产出数据的综合分析,得出每个DMU综合相对效率的数量指标,确定各DMU是否为DEA有效。
下面我们先描述DEA模型。
假设有n个待评价的对象(又称之为n个决策单元DMU),每个决策单元都有m种类型的投入及s种类型的产出,它们所对应的权重向量分别记为:
,
。
这n个决策单元中第j个的投入和产出量用向量分别记作:
,
,
其中:
为第j个决策单元对第i种类型输入的投入总量,
为第j个决策单元对第r种类型输出的产出总量,且
,
;
为第i种输入指标的权重系数,
为第r种产出指标的权重系数,且
,
。
则每个决策单元DMU投入与产出比的相对效率评价指数如下:
通过适当选取权重向量V和U的值,使对每个j,均满足
。
现对某第
个决策单元进行绩效评价,则以第
个决策单元的效率指数为目标,以所有的待评的决策单元的效率指数为约束,第
个决策单元简记为
,故可以得到一般的DEA优化模型如下:
上面的模型是分式规划规划问题模型,为了方便计算,通过适当的变换,我们可以将其化为一个等价的线性规划数学模型,并且引进阿基米德穷小量
(在实数范围内
表示的是大于0但小于任意正数的量),构成了具有非阿基米德无穷小量
的
的模型。
它的对偶线性规划问题模型如下:
其中:
,
,均为对偶变量,m维单位向量
,s维单位向量
,
和
均松弛变量,
,
。
模型是假定生产技术是固定规模报酬的。
后来,Banker,ChamesandCooper又对
模型进行推广,他们把固定规模报酬假设改为非递增规模报,则在上述的DEA模型的基础上需增加一个约束条件:
。
在此假设下非递增规模报酬时的技术效率为
。
如果我们把固定规模报酬假设改为可变规模报酬(variableReturnstoScale,简记VRS),则DEA模型中的上述约束条件应改为:
。
从而得到的如下新的DEA模型:
线性规划模型在可变规模报酬(VRS)条件下求得的相对效率称为纯技术效率,在CRS假设条件下得到的相对效率称为技术效率,又称为总体效率,它是规模效率与纯技术效率的乘积。
因此,可以根据C2R模型(4-3)和VRS模型(4-4)来确定规模效率。
模型(4-3)表明,当第j0个决策单元产出Y0保持不变的情况下,应尽量保证投入量X0按照同一比例减少。
假设上述规划问题模型(4-3)求得最优解为
,则有,若
,且
,则称被评价决策单元相对于其它决策单元而言DEA有效,此时该决策单元既满足技术有效又满足规模有效;若
,但
不同时等于零向量,则称被评价决策单元为弱DEA有效,这时该被评价的决策单元不是同时技术有效和规模有效,此时需要应用VRS模型(4-4)进一步进行计算;如果
,则称此被评价的决策单元为非DEA有效。
值得注意的是,VRS模型(4-4)是在对C2R模型(4-3)计算的基础上进行的分析,用以确定是否为纯技术有效。
由于总体效率表现为规模效率和纯技术效率之积,根据上述的分析并通过模型(4-3)和(4-4)容易求得规模效率值。
另外,对于非DEA有效的决策单元,需要通过进一步的分析讨论并求出被评价的决策单元DMU在DEA相对于有效面上的投影(即新决策单元),则新决策单元相对于原来的决策单元而言是DEA有效的。
设
为第j0个决策单元对应于
在DEA的相对有效面上的投影,则它们之间的转换关系可以表示为如下公式:
根据上述公式(4-5),可以求得各个非DEA有效的决策单元相对于某有效决策而言,在保持其产出量不变的情况下,可以计算出对各项指标的投入量进行相应的的调整量。
并且可以对相应的财务绩效上存在不足的决策单元相对于DEA有效的决策单元而言给出针对性的管理建议。
(3)DEA方法的应用
自从数据包络法提出至今,其应用范围日渐广泛。
例如它被广泛应用于学校、医院、铁路、银行等公共服务部门的运行效率的评估实证研究。
DEA作一种新的效率评估方法,与以前的传统方法相比有很多优点。
首先,DEA方法可以用于对具有多投入、多产出的多个决策单元的生产(或经营)绩效性进行评价,而且应用时可以避免像传统方法那样因为各指标量纲的不同而寻求权重因素所带来的诸多困难,其评价结果相对而言比较客观;其次,DEA模型中投入、产出指标的权重可以建立数学规划模型,然后根据实际的数据而产生,而不是事先给定投入与产出的权重权重系数,因此它不受人为主观因素的影响,可避免在权重的分配时评价者的主观意愿对评价结果的造成人为的影响;另外,数据包络法是一种典型的非参数估计方法,应用该方法评价时无须设定评价函数的具体形式,投入产出采用隐函数的形式表示,不同决策单元的评价函数其参数可以变动,针对各个决策单元都将通过数学规划模型的手段给出最优的投入产出函数,从而利用计算简化。
数据包络法评价的是决策单元的相对有效性,其生产前沿面可以看成是最优决策单元的投入与产出所组成的一个包络面,如果对应被评价的决策单元在该生产前面上,则称之为DEA有效,否则,称之为非DEA有效。
DEA方法主要用来研究决策单元的多输入多输出的相对有效的绩效评价的有用方法,因此使用这一方法时也存在一些缺陷。
首先,它衡量的生产函数边界是确定的,因而它无法分随机因素和测量误差的影响;其次,该方法的绩效效率评价容易受到极值的影响,而且决策单元的效率值对投入、产出指标的选择比较敏感,这就使得如何准确地选取投入、产出指标成为有效使用DEA方法的关键;另外,由于被评价的决策单元都是从最有利于自己的角度分别求取权重,这就导致了这些权重随着决策单元的不同而可能不同。
从而使得每个决策单元的特性缺乏有效的可比性;最后,根据DEA评价方法的特点就是只能判断各个决策单元是否DEA有效,而将所有决策单元分为有效和非有效两大类,因而使用该方法进行决策单元的绩效评价时,可能出现大量甚至全部的决策单元为有效的情形,因此传统的DEA方法不能对被评价的决策单元进行排序。
4.3.2主成分分析法
(1)主成分分析法介绍
主成分分析法又称之为主分量分析法,它是将多个变量通过线性变换以选出少数个重要变量(或称之为指标)的一种多元统计分析方法。
在实际应用中,它常常是将原来诸多具有一定相关性的指标重新组成一组新的相互无关的综合指标来代替原来众多指标以达到降维的一种方法。
在实际问题的研究中,为了更为全面分析问题,常常提出很多与此有关的指标(或称为变量),因为这些指标都在不同程度上反映这个研究问题的某些信息,然而,应用统计分析方法研究具有多个变量的问题时,变量个数太多往往会增加问题的复杂性。
因此最希望于指标数较少而包含的信息量较多。
一般情况下,各个变量之间都有一定的相关性,如果两个变量之间有一定的相关关系时,可以认为这两个变量反映所研究问题的信息有一定的重叠。
主成分分析法是对原来提出的所有指标,建立尽可能少的新指标,使得这些新的指标之间互不相关,并且这些新指标所反映的信息尽可能保持原有的信息,信息的大小通常用方差来衡量。
通常认为主成分分析法是一种对原始信息进行压缩的一种方法。
通过该方法可以将原来相关的若干指标,变换成综合的不相关的少数指标。
(2)主成分分析法基本思路
设X1,X2,…,XP表示以x1,x2,…,xp为样本观测值的随机变量,如果能找到c1,c2,…,cp,使得
但上述公式必须加上某种限制,否则权值可选择无穷大而没有意义,通常规定:
由于解c1,c2,…,cp是p维空间的一个单位向量,它代表一个“方向”,称为主成分方向。
通常情况下,一个主成分不足以代表原来的p个变量的信息。
因此需要找出第二个甚至更多的主成分,原则上,第二个主成分不应该再包含第一个主成分的信息,其它的也依次类推,统计学上的意义就是让这两个主成分的协方差为零,几何上的解释就是这两个主成分的方向正交。
具体确定各个主成分的方法如下:
设Fi表示第i个主成分分量,于是假设
确定(c11,c12,...,c1p),使得
,并且满足
确定(c21,c22,...,c2p),使得
,并且满足(c21,c22,...,c2p)与(c11,c12,...,c1p)正交及:
确定(c31,c32,...,c3p),使得
,并且满足(c31,c32,...,c3p)与(c11,c12,...,c1p),(c21,c22,...,c2p)正交及:
..................................……
如何确定主成分的个数呢?
在实际问题的研究中,由于主成分的最主要目的是为了降维,减少变量的个数,故一般选取少量的主成分(例如通常情况下不超过5个或6个),只要它们能包含原变量信息量的85%以上即可。
(3)主成分分析法的实现步骤
1)样本数据进行标准化
设有n个样本,有p个指标,构造原始数据的矩阵为:
在实际问题的应用中,往往因为存在各个指标间量纲的不同,故计算前就必须先消除量纲的影响而需要对原始数据进行标准化处理。
应用公式:
对上述矩阵A进行标准化得到矩阵设为B,其中
和
分别表示第j个指标的平均值和标准差,上述标准化过程需对输入和输出指标都逐一进行。
2)计算相关矩阵
对于上述标准化后的矩阵B,再应用下面的公式:
对矩阵B进行变换即得到下面的相关矩阵R:
3)求特征值及特征向量
应用上述的相关矩阵R,根据特征方程
,求得特征根
将解由大到小依次排列如下:
此时,
实际上是特征值为
所对应的特征向量。
原变量如果服从正态分布,那么各主成分之间相互独立。
4)求各个主成分的表达式
根据前面m个主要特征值求得的特征向量,容易写出全部m个主成分所反映的p个样本的总信息,它等于p个原变量的总信息。
信息量的多少,用变量的方差来度量。
其主成分表达式均是p个变量的线性组合,系数分别为其特征向量的各个分量,第一特征向量所对应的主成分表达式成为第一主成分,其它依次类推。
5)第i个主成分的贡献率是设为
则
前m个主成分的累计贡献率是km:
则
保留主成分个数多少主要取决于保留部分的累积方差总和所占百分之,即上述的累积贡献率,它标志着前几个主成分所占总信息量的多少。
通常情况下,在应用时,如果前m个主成分的累计贡献率为到达85%以上比较好,认为它们基本包含了原来所有指标的信息,因而常常选取累积贡献率达到85%以上的前几个主成分作为新的综合评价指标即可。