1、最新江苏省各市区环境卫生状况分析汇总2012江苏省各市区环境卫生状况分析2012江苏省各地区环境卫生状况分析应数1101 王松 2007110122摘要本文主要研究的是2012年江苏省各地区的环境卫生问题,利用多元统计知识,分别对这13个地区进行了归类。首先,我们进行了聚类分析,画出了类平均法的谱系聚类图,得到了较为合适的分类,并通过计算各类的平均值发现:苏州和南京属于环境卫生高管理水平地区,无锡属于环境卫生中等管理水平地区,其余地区属于环境卫生低管理水平地区。然后,我们又进行了因子分析,得到了两个公共因子Factor1(生活垃圾处理效率因子)、Factor2(粪便处理效率因子),并计算出了它
2、们的得分,然后根据这两个因子的得分构建得分函数Y=4.2032019*Factor1+2.3208286*Factor2进行了综合评价地区泰州盐城宿迁镇江连云港淮安扬州南通徐州常州无锡南京苏州得分-3.7719-3.4336-3.3816-3.0245-2.3966-2.3521-1.9879-1.5096-1.4708-0.42544.10699.424110.2228最后根据评价得分对其进行分类,得到:苏州和南京属于环境卫生高管理水平地区,无锡属于环境卫生中等管理水平地区,其余地区属于环境卫生低管理水平地区。这与聚类分析的结果一致。关键词:类平均法 聚类分析 因子分析 综合评价1、问题描述
3、 自改革开放以来,我国的经济发展越来越快,人民的生活管理水平也日益提高,但伴随而来的环境问题却愈加严重。所以环境卫生的管理变得尤为重要。下面请根据的数据,对江苏省各地区的管理水平进行估计。2、分析方法2.1 聚类分析聚类分析又称群分析,它的功能是建立一种分类方法,将一批样品或变量按照它们在性质上的亲疏、相似程度进行分类。聚类分析的内容十分丰富,按其聚类的方法可分为:系统聚类法、调优法(动态聚类法)、最优分割法、模糊聚类法、图论聚类法、聚类预报法。本文主要运用的是系统聚类法,它的主要思想是:开始每个对象自成一类,然后每次将最相似的两类合并,合并后重新计算新类与其他类的距离或相近性测度(本文采用的
4、是类平均法)。这一过程一直继续直到所有对象都归为一类为止。下面我们利用SAS软件对的数据进行聚类分析,得到谱系聚类图:使用类平均法的谱系聚类图根据谱系聚类图,我们可以看出分为三类比较合适:=南京、苏州,=无锡,=徐州、扬州、常州、连云港、淮安、盐城、镇江、宿迁、泰州、南通。分别计算各类地区的环境卫生的平均值,我们得到:13个地区的分类及环境卫生状况平均值类别第一类第二类第三类该类所包含地区南京、苏州无锡徐州、扬州、常州、连云港、淮安、盐城、镇江、宿迁、泰州、南通平均清扫面积生活垃圾平均清运量粪便平均清运量无害化处理厂平均日处理量垃圾粪便平均年处理量环卫机械平均辆数公共厕所平均个数8028.52
5、03.7257.5656550210.831622.5979.548351099.62875110.584016861710.335.7421.692148136.201221.7397.3由此可见,第一类属于环境卫生高管理水平,第二类属于环境卫生中等管理水平,第三类属于环境卫生低管理水平。2.2因子分析因子分析(Factor analysis)就是用少数几个因子来描述许多指标或因素之间的联系,以较少几个因子来反映原资料的大部分信息的统计学分析方法。 因子分析特点: (1)因子变量的数量远少于原有的指标变量的数量,因而对因子变量的分析能够减少分析中的工作量。(2)因子变量不是对原始变量的取舍,
6、而是根据原始变量的信息进行重新组构,它能够反映原有变量大部分的信息。(3)因子变量之间不存在显著的线性相关关系,对变量的分析比较方便,但原始部分变量之间多存在较显著的相关关系。(4)因子变量具有命名解释性,即该变量是对某些原始变量信息的综合和反映。 因子分析主要包括以下几个步骤:确定待分析的原有若干变量是否适合进行因子分析、因子提取、因子变量的命名解释、计算因子变量得分。下面我们利用SAS软件对的数据进行因子分析。 是否适合进行因子分析判断因子分析是从众多的原始变量中重构少数几个具有代表意义的因子变量的过程。其潜在的要求:原有变量之间要具有比较强的相关性。因此,因子分析需要先进行相关分析,计算
7、原始变量之间的相关系数矩阵。如果相关系数矩阵在进行统计检验时,大部分相关系数均小于0.3且未通过检验,则这些原始变量就不太适合进行因子分析。SAS运行结果:各变量的相关系数矩阵由变量间相关系数都超过0.3,所以本问题,即2012年江苏省各地区环境卫生情况适合因子分析。 提取公共因子对于公共因子的提取,我们采用的是主风量法。SAS运行结果:相关阵的特征值、累计贡献率及因子载荷矩阵由特征值的累计贡献率可知,前2个特征值的累计贡献率为0.93200.9,所以,最后选择了2个公共因子,包含2个公共因子的因子分析模型为:X1=0.98469Factor1-0.11313Factor2+X2=0.9838
8、5Factor1-0.01855Factor2+X3=0.70639Factor1+0.63654Factor2+X4=0.93375Factor1-0.32531Factor2+X5=0.98705Factor1-0.05521Factor2+X6=0.91352Factor1-0.32839Factor2+X7=0.75624Factor1+0.44716Factor2+由于X3(粪便清运量)和X7(公共厕所)在Factor2上的载荷比较大,所以可以将Factor2解释为粪便处理效率因子。但是对于Factor1,各变量的载荷都比较大,所以含义比较模糊,不好进行解释。所以下面需考虑进行因子旋
9、转。 因子旋转和因子命名解释由于第1个公共因子含义不清,所以对因子载荷矩阵进行方差最大的正交旋转。方差最大正交旋转(varimax orthogonal rotation)的基本思想是:使公共因子的相对负荷的方差之和最大,且保持原公共因子的正交性和公共方差总和不变。可使每个因子上的具有最大载荷的变量数最小,因此可以简化对因子的解释。SAS运行结果:方差最大正交旋转矩阵及旋转后的因子载荷矩阵因子模型为:X1=0.88284Factor1+0.45056Factor2+X2=0.82981Factor1+0.52888Factor2+X3=0.23624Factor1+0.92106Factor2
10、+X4=0.95774Factor1+0.24571Factor2+X5=0.85276Factor1+0.50012Factor2+X6=0.94265Factor1+0.23187Factor2+X7=0.38255Factor1+0.79088Factor2+ 从旋转后的因子载荷可以看出,X1(清扫面积),X2(生活垃圾清运量),X4(无害化处理厂日处理能力),X5(垃圾粪便年处理量),X6(环卫机械)五个变量在公共因子Factor1上的载荷比较大,所以Factor1可以解释为生活垃圾处理效率因子,X3(粪便清运量)和X5(公共厕所)在公因子Factor2上的载荷比较大,所以Factor
11、2可以解释为粪便处理效率因子。 计算因子变量得分因子变量确定以后,对于每一个样本数据,我们希望得到它们在不同因子上的具体数据值,即因子得分。估计因子得分的方法主要有:回归法、Bartlette法等。计算因子得分应首先将因子变量表示为原始变量的线性组合。即:回归法,即Thomson法:得分是由贝叶斯Bayes思想导出的,得到的因子得分是有偏的,但计算结果误差较小。贝叶斯(BAYES)判别思想是根据先验概率求出后验概率,并依据后验概率分布作出统计推断。Bartlett法:Bartlett因子得分是极大似然估计,也是加权最小二乘回归,得到的因子得分是无偏的,但计算结果误差较大。对于因子变量得分的计算
12、,本文采用的的是回归法。SAS运行结果:标准化的因子得分系数因子得分函数:Factor1=0.21915*X1+0.15635*X2-0.31838*X3+0.35222*X4+0.18111*X5+0.35137*X6-0.18558*X7Factor2=-0.01711*X1+0.07718*X2+0.70377*X3-0.23365*X4+0.04091*X5-0.23880*X6+0.51967*X7标准因子得分 综合评价可以根据因子得分构建得分函数进行综合评价:Y=4.2032019*Factor1+2.3208286*Factor2因子前的权数选择每个因子所解释的方差。分别代入每个
13、地区环境卫生的标准因子得分即可得到每个地区环境卫生的综合得分值。SAS运行结果:综合得分从上图可以看出,苏州和南京的综合得分较高,说明这两个地区的环境卫生状况非常好;无锡的综合得分为4.1069,说明该地区的环境卫生状况较好;其余地区得分较低,均为负值,说明这些地区的环境卫生状况较差。根据以上情况,我们可以将这13个地区大致分为三大类,第一类为环境卫生高管理水平地区(苏州和南京),第二类为环境卫生中等管理水平地区(无锡),第三类为环境卫生低管理水平地区(常州、徐州、南通、扬州、淮安、连云港、镇江、宿迁、盐城、泰州)。三、建议根据以上分析的结果,我们提出以下几点建议:1.常州、徐州、南通、扬州、
14、淮安、连云港、镇江、宿迁、盐城、泰州这些地区应该加大管理力度,争取把环境卫生做到最好。2.无锡地区管理的力度还不够,应该继续加强。附录一:数据来源:江苏统计年鉴2012附录二:SAS程序:1、聚类分析goptions ftext=宋体;data a;input area $ x1-x7;cards;南京 7409 225 12.1 5800 224.5 1126 1166无锡 4835 109 9.6 2875 110.5 840 1686徐州 1609 52 0.0 2200 51.6 372 488常州 2543 58 0.6 2960 58.7 276 796苏州 8648 183 3.
15、0 7300 197.1 2119 793南通 2647 53 7.2 910 55.8 294 197连云港 1795 24 3.2 1400 27.2 254 481淮安 2142 40 2.1 1100 31.2 207 446盐城 1450 23 0.7 1220 23.3 49 225扬州 1572 43 0.0 2110 47.5 196 474镇江 1372 26 0.9 1130 26.5 235 313泰州 915 19 1.2 680 20.6 119 263宿迁 1058 19 0.9 1100 19.5 215 290;proc cluster data=a metho
16、d=ave std pseudo rsq outtree=b;var x1-x7;id area;run;goptions lsize=4 hsize=8;/*控制输出聚类图的大小*/proc tree data=b horizontal graphics n=3 out=c;copy area x1-x7; title 使用类平均法的谱系聚类图;run; 2、因子分析goptions ftext=宋体;data a;input area $ x1-x7;cards;南京 7409 225 12.1 5800 224.5 1126 1166无锡 4835 109 9.6 2875 110.5
17、840 1686徐州 1609 52 0.0 2200 51.6 372 488常州 2543 58 0.6 2960 58.7 276 796苏州 8648 183 3.0 7300 197.1 2119 793南通 2647 53 7.2 910 55.8 294 197连云港 1795 24 3.2 1400 27.2 254 481淮安 2142 40 2.1 1100 31.2 207 446盐城 1450 23 0.7 1220 23.3 49 225扬州 1572 43 0.0 2110 47.5 196 474镇江 1372 26 0.9 1130 26.5 235 313泰州
18、 915 19 1.2 680 20.6 119 263宿迁 1058 19 0.9 1100 19.5 215 290;proc factor data=a corr msa method=principal priors=one p=0.9 simple;var x1-x7;run;proc factor data=a rotate=varimax n=2 score out=b;var x1-x7;run;proc print data=b;var factor1 factor2;run;data pingjia;set b;y=4.2032019*Factor1+2.3208286*Factor2;proc sort data=pingjia;by y;run;proc print;var area y;run;
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1