中文deap21使用说明.docx
《中文deap21使用说明.docx》由会员分享,可在线阅读,更多相关《中文deap21使用说明.docx(38页珍藏版)》请在冰豆网上搜索。
中文deap21使用说明
效率与生产力分析中心(CEPA)
工作报告
DEAP2.1版本指南:
数据包络分析
(计算)程序
CoelliT.J
No.8/96
澳大利亚,NSW2351,阿米代尔
新英格兰大学,计量经济学系
CEPA工作报告
http:
//www.une.edu.au/econometrics/cepawp.htm
ISSN1327-435X
ISBN1863894969
摘要
这篇论文描述了一个程序,这个程序是用来实施数据包络分析(DEA),以此来计算生产中的效率。
程序中实施的方法是基于RolfFare,ShawnaGrosskopf和他的同事的工作。
计算程序中有三个主要的选择。
第一个包括标准的CRS和VRS两个DEA模型(这包括了技术效率和规模效率的计算),这两个模型是Fare,GrosskopfandLovell(1994)设计的。
第二个选择考虑了这些模型的延伸,即说明成本和配置效率。
这些模型也是Fareetal(1994)设计的。
第三个选择考虑到了MalmquistDEA模型的使用,这个模型是用面板数据来计算全要素生产率变化(TFP)、技术进步、技术效率变化和规模效率变化的指数。
后面所说的模型Fare,Grosskopf,NorrisandZhang(1994)曾经讨论过。
所有的模型无论在投入主导型还是产出主导型(除了成本效率)都能够获得。
1.INTRODUCTION说明
这个指南描述了一个实施数据包络技术的计算机程序。
DEA模型是运用线性规划的方法通过建造一个非参数分段的面(前沿),然后相对这个面计算效率。
计算机程序能够考虑模型的多样性。
三个主要的选择是:
1.标准CRS和VRS的数据包络分析模型,它们包括技术效率和规模效率的计算(当规模效率适合)。
这些模型是Fare,GrosskopfandLovell(1994)构造的。
2.上述模型的延伸,考虑了成本和配置效率。
这些模型也是Fareetal(1994)构造的。
3.第三个选择考虑到了MalmquistDEA模型的使用,这个模型是用面板数据来计算全要素生产率变化(TFP)、技术进步、技术效率变化和规模效率变化的指数。
这些方法Fare,Grosskopf,NorrisandZhang(1994)曾经讨论过。
这些方法无论是在投入主导型还是在产出主导型(除了成本效率)都是能够获得的。
当合适的时候,程序的结果可以包括技术、规模、配置、成本效率的估计值;还有松弛变量的残值;对应点;全要素生产率和技术进步变化指数。
文章可以分为以下几章。
第二章给出了Farrell(1957);Fare,GrosskopfandLovell(1985,1994)等关于效率测度概念的简短的介绍。
第三章概述了这些思想是怎样通过DEA方法实现实证研究的。
第四部分描述了计算程序,DEAP。
第五章给了一些运用程序的例子。
最后,在第六章,总结了要点。
附录里面包含了程序所用的重要技术方面的概述。
2.EFFICIENCYMEASUREMENTCONCEPTS效率测度的概念。
这章的主要目的是概述一些常用的测度效率的方法,并且讨论了相对于技术有效(通常由某种形式的前沿机构所代表)怎样计算出他们。
过去的40年里,我们运用个很多不同的方法估计前沿效率。
两个有代表性的方法是:
1.数据包络分析
2.随机前沿法
他们分别包含了数学规划和计量经济学的方法。
这篇论文和DEAP计算机程序是关于DEA方法的。
计算机程序FRONTIER可以通过随即前沿法估计前沿效率,想得到更多关于FRONTIER请看Coelli(1992,1994)的研究。
这章对现代的效率测度给了一个简短的介绍。
更详细的方法请参考Fare,GrosskopfandLovell(1985,1994)andLovell(1993)的研究。
现代效率测量是与Farrell(1957),他在Debreu(1951)andKoopmans(1951)的工作的基础上定一个一个简单的测度公司效率的方法,这个方法考虑了多投入。
他认为公司的效率可以分为两个部分:
技术效率,反映了公司在给定投入的情况下所能获得的最大的产出的能力。
另一个是配置效率。
它反映了给定各自投入价格的情况下使用最优比例的能力。
两个测量结合起来给出了总经济效率的测度。
接下来的讨论从Farrell最初的想法开始,这个想法产生于投入,然后关注于投入的减少。
这通常被称为投入主导型。
2.1Input-OrientatedMeasures投入主导型的测度
Farrell通过一个简单的例子阐述了他的观点。
这个例子假设一个公司的规模报酬不变,使用了两个投入(x1和x2)生产单一的产出(y)已知全效率公司的单位等产量曲线,由数据1的SS′代表,允许技术效率的度量。
如果给定的公司用一定数量的投入,由P点所定义,去生产一单位的产出,公司的技术无效可以有QP的距离所表示,它就是在不减少产出的情况下,所有的投入按比例减少的数量。
这通常由百分数QP/OP的比率表示,它代表了所有投入减少的百分比。
公司的技术效率通常由
TEI=OQ/OP
(1)
也就是1减去QP/OP。
它取值0~1,因此提供了公司技术无效的指标。
1代表完全的技术有效,例如,Q点就是技术有效的,因为他在效率曲线上。
数据1技术和配置效率
如果投入的价格的比率由数据1的AA’表示,那么配置效率也就算出来了。
P点运作的公司的配置效率由下面的比率给出定义。
AEI=OR/OQ
(2)
因为RQ的距离代表如果生产发生在配置有效的点Q’,而不是技术有效但是配置无效的Q点,那么就可以降低生产成本。
总经济效率(EE)可以由下面的比率
EEI=OR/OP(3)
RP的距离可以解释为成本降低。
注意,技术和配置的效率给出了总的经济效率,
TEI*AEI=(OQ/OP)*(OR/OQ)=(OR/OP)=EEI(4)
数据2
分段线性等量曲线
这些效率测量假设完全有效率的公司是已知的。
在实践中,这并不是问题,效率等量曲线是从样本数据中估计出的。
Farrell认为无论是使用非参数分段线性等量曲线(没有观测的点在它的左边或下边)(参考数据2),还是参数形式,比如柯布道格拉斯形式,相对应的数据也都没有在它左边或者下边的。
Farrell用美国48个洲的农业数据给出了他的方法的一个例子。
2.2Output-OrientatedMeasures产出主导型测量方法
上述投入主导型技术效率测量方法提出了一个问题:
在不减少产出数量的同时,能按比例减少多少的投入?
人们也可以问这样的问题:
不改变投入数量的同时,产出数量可以按比例增加多少呢?
这是一个与上面阐述的投入主导型测量方法相反的产出主导型测量方法。
投入主导型测度方法和产出主导型测度方法可以用仅包含一个投入和一个产出的简单例子进行阐述。
数据3(a)描述了这一问题。
我们有一个规模收益递减的函数f(x),和一个在P点运行的无效率的公司。
Farrell的投入主导型测量方法中的TE与图中的AB/AP是相同的,然而产出主导型测度方法的TE是CP/CD。
仅当规模收益不变的时候,产出主导型和投入主导型测度方法的技术效率是相等的。
但是存在规模报酬递增还是递减的时候就不相等。
数据3(b)描述了规模报酬不变。
我们可以看到AB/AP=CP/CD,对于任意无效率的P,我们都可以选择。
数据3
投入和产出主导型技术效率
测度方法和规模收益
我们可已通过考虑包括两产出(y1和y2)和一投入(x1)来进一步考虑产出主导型测度方法。
再一次,我们假设规模报酬不变,我们可以用一单位产品可能曲线(产品等量曲线)的两个方面来表示技术。
数据4描述了这个例子,ZZ’就是单位产品可能曲线,点A是无效率的公司。
注意,无效率的点A,在曲线下方,因为ZZ’代表最高的生产可能线。
数据4
产出主导型的技术和配置效率
Farrell的产出主导型测度模型可以如下定义。
在数据4中,AB的距离代表技术无效。
这就是,在不增加额外的投入的基础上,可以增加多少产出。
因此,产出主导型的技术效率就是这个比率。
TE0=OA/OB(7)
如果我们有价格的信息,我们就可以画等产量曲线DD’,并定义配置效率为
AE0=OB/OC(8)
他有一个使收益增加的定义(类似于投入主导型的减少成本的配置无效的定义)。
进一步,我们可以定义总体经济效率为两个测度的综合:
EE0=(OA/OC)=(OA/OB)*(OB/OC)=TE0*AE0(9)
这三个测量也都在0~1之间。
在总结这章之前,关于我们定义的六个效率测度有两点我们需要说明。
1)所有的测度都是从原点到实际观察到的生产点的射线。
因此,他们都有相对恒定的投入(产出)比例。
这种射线的效率测度的优点是他们都是单位不变的。
这就是变化度量的单位(例如:
测量劳动数量用人时而不是人年)将不会改变效率值。
非射线的测度,比如较短的生产点到生产面的距离,可能是被要求的,但是测度将相对选择的测度单位而不是恒定的。
在这种情况下,改变测度单位可能导致发现一个不同的更近的点。
当我们考虑DEA的松弛变量的时候,在我们将对这一问题进行深入的研究。
2)Farrell的投入主导和产出主导技术效率的测量与Shepherd(1970)的投入产出距离模型可以看做是等价的。
想知道更多请看Lovell(1993,p10)。
当我们运用DEA计算全要素变化的Malmquist指标的时候,这项观察变得重要。
3.DataEnvelopmentAnalysis(DEA)数据包络分析
数据包络分析是前沿估计的非参数数学规划方法。
这里讨论的DEA模型是很简短的,只有相对很少的技术细节。
想知道更多方法论的细节请参考SeifordandThrall(1990),Lovell(1993),AliandSeiford(1993),Lovell(1994),Charnesetal(1995)andSeiford(1996)的研究。
Farrell(1957)的关于前沿估计的分段线性规划方法仅仅被Farrell论文后的20年里少数的几个作者所推崇。
作者,比如Boles(1966)andAfriat(1972),所推崇的数学规划方法可以完成任务,但是这种方法并没有引起人们的广泛关注,直到Charnes,CooperandRhodes(1978)发表了论文,并且创造了数据包络分析这个词。
从那以后,涌现了大量的拓展和运用DEA方法的文献。
Charnes,CooperandRhodes(1978)提出了一个模型,这个模型是投入主导型并假设规模报酬不变(CRS)。
接下来的论文提出了相反的假设,比如Banker,CharnesandCooper(1984)提出了规模报酬变化的模型(VRS)。
接下来DEA的讨论从3.1的投入主导型的CRS模型开始,因为这个模型是最应该被广泛应用的。
3.1TheConstantReturnstoScaleModel(CRS)规模报酬不变模型
我们从定义一些记号开始。
假设有N个公司或者像DEA文献里面叫的DMU。
每个公司有K个投入和M个产出的数据。
对于第i个DMU,他们分别由xi和yi来代表,K×N的投入矩阵为X,M×N的产出矩阵为Y,代表了所有N个DMU的所有数据。
DEA的目的就是在数据点的基础上构造一个非参数的包络前沿,使所有的观测的数据都在生产前沿的上面或者下面。
比如工业的一产出,两投入的简单例子,可以看做是一些相交平面,形成了一个涵盖三维空间的散点的紧紧的盖子。
给出了规模报酬不变的假设,这可以由投入的单位等产量曲线代表。
(参考数据介绍DEA的最好的办法是通过比率的形式。
对于每个DMU,我们都得到所有产出关于所有投入的比率的测量,比如:
u’yi/v’xi,其中u是M×1的输出权重矩阵,v是K×1的的投入权重矩阵。
选择最优的权重就是数学规划要解决的问题。
maxu,v(u’yi/v’xi),
stu’yj/v’xj≤1,j=1,2,...,N,
u,v≥0(10)
这就包括了寻找u和v的过程,这样第i个DMU的效率测度就被最大化了,并且由于约束,所有的效率都是小于等于1.一个特殊的比率的问题就是他有无限个解决办法。
为了避免这个问题,我们就可以加入这样的一个假设v’xi=1,这就提出了:
maxμ,ν(μ’yi),
stν’xi=1,
μ’yj-ν’xj≤0,j=1,2,...,N,
μ,ν≥0,(11)
这里,符号由u和v变为μ和ν正反映了这种转变。
这种形式在线性规划里面被称为乘数形式。
使用线性规划的二元形式,我们可以得到这个问题的相等的形式。
minθ,λθ,
st-yi+Yλ≥0,
θxi-Xλ≥0,
λ≥0,
其中θ是一个标量而λ是个N×1的常数矢量,这个包络形式比乘数形式少了很多的约束(K+M其中θ的值就是第i个DMU的效率分数。
要满足θ≤1,1代表前沿效率上的点,也就是技术有效的DMU,这是Farrell(1957)的定义。
注意,线性规划问题必须要解决N次,对于每个样本DMU都要计算一次,然后每个DMU都得到了θ值。
Slacks松弛变量
DEA的非参数前沿分段线性形式会产生效率测度的一些不同的地方。
问题的产生是因为分段前沿函数与坐标轴平行的部分。
(参考数据2)这在大多数的参数模型里面是不存在的(参考数据1)。
为了阐述这一问题,参考数据5,其中DMU的投入包括C和D是两个有效率的DMU,他代表了前沿。
DMU的A和B是无效率的DMU。
根据Farrell(1957)的技术效率测度,DMUA和B的技术效率分别为OA’/OAandOB’/OB。
然而,问题是A’点是否是效率点呢。
因为我们可以在得到同样产出的情况下减少投入的数量x2,(通过CA’)。
这在文献里称做投入松弛变量。
当我们考虑更多投入和更多产出的情况时,图示就不再简单了,并且相关的概念产出松弛也是可能发生的。
因此,在DEA的分析中,提供Farrell的技术效率测度(θ)和非零的投入或产出松弛变量,以此来提供准确的DMU的技术效率指标,这件事是值得争论的。
注意,对于第i个DMU的产出松弛变量仅仅当Yλ-yi=0的时候才等于0,投入松弛变量也仅仅当θxi-Xλ=0的时候才等于0。
(对于给定的θ和λ)
数据5
效率测度和投入松弛变量
在数据5中,与A’点相关的投入松弛变量就是投入x2的CA’。
当简单的例子里面有更多的投入和产出的时候,我们就可以发现更近的效率前沿点(比如C点)。
因此,接下来的松弛变量的计算就不是没有意义的。
一些作者建议用两阶段线性规划的方法去移动效率前沿点,通过最大化需要的松弛变量的总和,把无效的的前沿点(比如数据5的A’点)移动到有效率的点(如C点)。
两阶段线性规划问题可以如下定义:
minλ,OS,IS-(M1’OS+K1’IS),
st-yi+Yλ-OS=0,
θxi-Xλ-IS=0,
λ≥0,OS≥0,IS≥0,(13)
其中oS是M×1的产出松弛变量矩阵,IS是K×1的投入松弛变量矩阵,M1和K1分别是他们的M×1和K×1的矩阵。
注意,在两阶段线性规划中,θ不是变量,他的取值来于第一阶段。
更进一步,我们要注意两阶段线性规划的问题对于N个DMU来说每个都要解决。
有两个主要问题是关于两阶段线性规划的。
第一个也是最显而易见的是松弛变量的总和是最大化而不是最小化。
因此,我们找到的不是最近的效率点而是最远的效率点。
第二个关于两阶段方法的主要问题是对于计量单位来说他不是不变的。
计量单位的改变,比如说更多的投入,从千克到吨(在其他计量单位不变的前提下),可以导致发现不同的效率前沿点和不同的松弛变量和更多的测度方法。
然而,我们也要注意,在数据5中的简单的例子里有两点并不是问题所在。
因为在垂直面上仅有一个效率点。
然而,如果松弛变量发生在两个或者更多维的结构直面上仅有一个效率点。
然而,如果松弛变量发生在两个或者更多维的结构中(这是经常发生的)上述问题就会发生了。
(Charnes,Cooper,Rousseau和Semple(1987)设计了一个单位不变的模型,在这个模型里松弛变量的单位价值和第i个公司的使用的投入或者产出的数量成反比。
这能解决直接问题,但是由创造了另一个问题,因为这种方法没有足够的理由计算松弛变量的权重。
)
这个问题的结果是,许多研究仅仅解决第一阶段的线性规划问题(等式12),从而得到Farrell的每个DMU的辐射的技术效率值(θ)。
并且完全忽略松弛变量,或者他们记录辐射的Farrell的技术效率值(θ)和残余松弛变量,这个变量是这样计算的OS=-yi+YλandIS=θxi-Xλ.然而,这个方法并非能解决所有的问题,可能是因为残余松弛变量不一定提供所有的松弛(Koopmans)变量(例如,数据5.5中有一些观测点在前沿的垂直面部分上时),或者是可能不总是能找出每个DMU的最近的效率点。
在DEAP软件中,我们关于松弛变量给使用者三种选择。
他们是:
1.一阶段DEA,我们在等式12构造线性规划模型并计算松弛变量残值。
2.两阶段DEA,我们用等式12和13构造线性规划模型。
3.多阶段DEA,我们构造一系列的辐射的线性规划模型以此来识别有效预测点。
同其他两种方法相比,多阶段DEA方法计算复杂。
然而,这种方法的优点是他能识别投入和产出混合的效率预测点,这些点与非有效点十分的相似,并且识别出的效率预测点相对于测度单位来说是不变的。
因此,同另外两个方法相比我们推举使用多阶段的DEA。
我们在这个指南中说了很多关于松弛变量的问题,现在我们总结出我们也许夸大了松弛变量的作用。
松弛变量可以看做是用DEA方法来得到前沿结构和使用有限样本的人工品。
如果我们能够得到DEA的无限样本,或者使用另外一个估计前沿结构的方法,这种方法有一个光滑的结构表面,那么松弛变量的问题就消失了。
另外对于这个观察,我们接受FerrierandLovell(1990)的观点是合理的。
他们认为松弛变量可以看做是配置无效率。
因此,我们相信技术效率分析可以合理的集中于在一阶段DEA线性规划(参考等式12)中得到的辐射效率指数。
然而,如果我们坚持想得到Koopmans效率预测点,我们就强力建议使用多阶段的方法而不是两阶段的方法,原因如上所述。
Example1例子1
我们用一个包括五个DMU(公司)的简单例子阐述规模报酬不变投入主导型的数据包络分析。
每个DMU都是两投入一产出,数据如下:
表1规模报酬不变的DEA例子数据
这个例子的投入产出比率在数据6中绘出,同时还汇出了DEA的同等式12对应的前沿。
我们可以记在心里,然而,这个DEA前沿是对5个DMU每个都计算一次线性规划的结果。
例如,对于DMU3我们可以这样重新书写等式12.
minθ,λθ,
st-y3+(y1λ1+y2λ2+y3λ3+y4λ4+y5λ5)≥0,
θx13-(x11λ1+x12λ2+x13λ3+x14λ4+x15λ5)≥0,
θx23-(x21λ1+x22λ2+x23λ3+x24λ4+x25λ5)≥0,
λ≥0,(14)
whereλ=(λ1,λ2,λ3,λ4,λ5)′.
θ和λ的值在表2第三行中提供了最小的θ值。
我们注意到DMU3的技术效率值是0.833。
DMU3可以在不减少产出的情况下将投入降低16.7%。
这就意味着应该在数据6的3’点生产。
这个估计点3’在DMU2和DMU5的连线上,它被认为是点3的对应点。
他们定义了前沿相关部分的所在(例如与DMU3相关的)也就定义了DMU3的效率生产点。
点3’是点2和点5的线性组合,线性组合的权重就是表2第三行的λ值。
数据6
规模报酬不变投入主导型DEA例子
表2
规模报酬不变投入主导型DEA的结果
很多研究都讨论目标和对应点。
DMU的目标也就是对应的效率投影点3’。
这等于0.833×(2,2)=(1.666,1.666)。
因此,DMU3要得到3单元的产出就得要用3×(1.666,1.666)=(5,5)单元的两种投入
人们可以对其他各个无效率的DMU进行类似的讨论。
DMU4的效率指数是0.714,同DMU3一样有类似的对应点。
DMU1的效率指数是0.5,DMU2就是他的效率的对应点。
我们可以注意到,DMU1的估计点在效率部分的上端,这个效率部分平行于x2的轴。
因此,它不代表效率点(根据Koopman的定义。
)因为我们可以减低投入x2的0.5个单位(因此生产点就在点2)仍旧能得到相同数量的产出。
因此DMU1可以说为投入放射性浪费了50%,并且有0.5单元的x2的(非放射性)投入松弛变量。
这就导致了目标(x1=1,x2=2)。
那就是相对应的点2.
3.2TheVariableReturnstoScaleModel(VRS)andScaleEfficiencies规模收益变化模型(VRS)和规模效率
CRS的假设仅仅在所有的DMU都在最优的规模上运作的时候才合适(例如:
LRAC曲线上的一个相应的平面部分)。
不完全竞争和约束,财务等等,可能导致DMU不在最合适的规模上运作。
Banker,CharnesandCooper(1984)拓展了规模报酬不变的DEA模型为规模报酬变化的情形。
当DMU没有在最优的规模上运作的时候,CRS说明书的使用可能会导致技术效率的测度被规模效率所混淆。
VRS模型说明书将会允许剔除规模效率影响的技术效率的计算。
CRS线性规划模型可以通过增加凸性约束很容易的修改成VRS模型。
对等式12增加的凸性约束为:
N1’λ=1可以得到,
minθ,λθ,
st-yi+Yλ≥0,
θxi-Xλ≥0,
N1’λ=1
λ≥0,(15)
N1是所有的N×1的矩阵。
这种方法形成了一个凸面,他能够比CRS的圆锥形的面更紧密的包络所有的数据,因此获得的技术效率比使用CRS模型获得的技术效率高或者是相等的。
VRS规说明书是20世纪最受欢迎的说明书。
CalculationofScaleEfficiencies规模效率的计算
许多研究把从CRS模型获得的技术效率分解成了两部分,一部分是因为规模无效率,一部分是因为纯技术无效。
这可以在相同的数据上通过实施CRS和VRS两个DEA模型来做到。
如果对于一个特定的DMU,两个技术效率不同,这就证明这个DMU存在规模无效。
规模无效可以通过VRS的技术效率和CRS的技术效率的不同来计算。
数据7试图阐述这一问题。
在这个数据里面我们有一投入一产出的例子,并且我们画出了VRS和CRS的效率前沿。
在CRS的投入主导型技术无效里,P点的距离是PPC,而在VRS模型里技术无效是PPV。
两者的不同PCPV,就是规模无效率。
我们可以用比率效率测度来表示这些。
TEI,CRS=APC/AP
TEI,VRS=APV/AP
SEI=APC/APV
所有的这些测度都在0~1之间。
我们也可以注意到,
TEI,CRS=TEI,VRS×SEI
因为
APC/AP=(APV/AP)×(APC/APV).
这就是CRS的技术效率可以分解称纯技术效率和规模效率。
数据7
DEA中规模经济的计算
规模效率方法的一个缺点就是他的值不能反映DMU是否运行在规模报酬递增或者规模报酬递减的领域里。
这可以通过运行一个非规模报酬递增(NIRS)的额外的DEA模型来确定。
这可以通过改变等式15的DEA模型来做到,将等式15的N1’λ=1的限制替换成N1’λ≤1可以得到
minθ,λθ,
st-yi+Yλ≥0,
θxi-Xλ≥0,
N1’λ≤1
λ≥