因子分析.docx
《因子分析.docx》由会员分享,可在线阅读,更多相关《因子分析.docx(14页珍藏版)》请在冰豆网上搜索。
因子分析
中国主要城市废水中主要污染物排放情况综合分析Comprehensive analysis of emissions of major pollutants in wastewater China main city
[摘要]:
人类生活环境日益恶化,为了对环境进行合理有效的治理,本文拟对中国主要城市废水中主要污染物排放情况进行分析。
本文选取了12项指标利用因子分析法对全国31个主要城市废水进行实证分析计算出因子得分和因子总分以反映各城市废水中污染物情况。
并根据计算结果对数据进行综合分析。
最后对于废水治理提出参考建议。
(本文数据源为统计年鉴中《2012年主要城市废水中主要污染物排放情况》)
关键词:
主要城市废水排放主要污染物因子分析
[Abstract]:
thehumanlivingenvironmentisgettingworseandworse,inordertomakeasoundandeffectivegovernanceontheenvironment,thispaperintendstoemissionsofmajorpollutantsinwastewaterChinesemaincityanalysis.Thispaperchooses12indexesofempiricalanalysistoreflectthecitywastewaterpollutantsinfactorscoresandfactorscoresonthe31maincitywastewaterbyusingthefactoranalysismethod.Accordingtothecalculationresults,thedatawereanalyzed.Finally,suggestionsforwastewatertreatment.(thedatasourceforthestatisticalyearbook2012"maincitywastewaterdischargeofmajorpollutantssituation")
Keywords:
themaincitywastewateremissionsofmajorpollutantsfactoranalysis
以上结果
表12012年中国主要城市废水中主要污染物排放情况原始数据表
对
对数据进行相关因子分析对
对原始数据进行因子分析欠,首先对数据进行标准化处理。
然后对数据是否适合因子分析进行实用性检验。
对数据进行相关因子分析后得到各表如下:
表2KMO和Bartlett的检验
取样足够度的Kaiser-Meyer-Olkin度量。
.530
Bartlett的球形度检验
近似卡方
466.172
df
78
Sig.
.000
由表知KMO检验值大于0.5且巴特莱特球形度检验P值小于0.05。
因此适合做因子分
由碎石图可知特征值>=1的成分数为4个。
但观察表3可知若选取四个因子则解释的总方差累积值为82.698%。
由表4知对挥发酚的提取量仅为24.9%,对汞的提取量仅为19.8%.因此若选取四个因子作分析则对总体数据概括量较小。
表3解释的总方差
成份
初始特征值
提取平方和载入
旋转平方和载入
合计
方差的%
累积%
合计
方差的%
累积%
合计
方差的%
累积%
1
4.408
33.909
33.909
4.408
33.909
33.909
2.937
22.591
22.591
2
2.893
22.253
56.162
2.893
22.253
56.162
2.922
22.479
45.069
3
2.013
15.486
71.648
2.013
15.486
71.648
2.855
21.964
67.033
4
1.437
11.051
82.698
1.437
11.051
82.698
2.036
15.665
82.698
5
.958
7.368
90.066
6
.786
6.047
96.113
7
.308
2.368
98.481
8
.122
.942
99.423
9
.042
.321
99.744
10
.018
.141
99.885
11
.007
.057
99.943
12
.006
.043
99.986
13
.002
.014
100.000
提取方法:
主成份分析。
表4公因子方差
初始
提取
Zscore(排放总量)
1.000
.814
Zscore(化学需氧量)
1.000
.965
Zscore(氨氮)
1.000
.957
Zscore(总氮)
1.000
.939
Zscore(总磷)
1.000
.936
Zscore(石油类)
1.000
.827
Zscore(挥发酚)
1.000
.249
Zscore(铅)
1.000
.967
Zscore(汞)
1.000
.198
Zscore(镉)
1.000
.988
Zscore(六价铬)
1.000
.979
Zscore(总铬)
1.000
.983
Zscore(砷)
1.000
.947
提取方法:
主成份分析。
因此在因子分析的抽取步骤中将因子的固定数量改为五个。
继续进行因子分析科的下列图表:
表5解释的总方差
成份
初始特征值
提取平方和载入
旋转平方和载入
合计
方差的%
累积%
合计
方差的%
累积%
合计
方差的%
累积%
1
4.408
33.909
33.909
4.408
33.909
33.909
2.982
22.939
22.939
2
2.893
22.253
56.162
2.893
22.253
56.162
2.899
22.301
45.240
3
2.013
15.486
71.648
2.013
15.486
71.648
2.785
21.426
66.665
4
1.437
11.051
82.698
1.437
11.051
82.698
2.015
15.497
82.162
5
.958
7.368
90.066
.958
7.368
90.066
1.028
7.904
90.066
6
.786
6.047
96.113
7
.308
2.368
98.481
8
.122
.942
99.423
9
.042
.321
99.744
10
.018
.141
99.885
11
.007
.057
99.943
12
.006
.043
99.986
13
.002
.014
100.000
提取方法:
主成份分析。
表6旋转成份矩阵a
成份
1
2
3
4
5
Zscore(排放总量)
.198
.024
.879
.060
-.079
Zscore(化学需氧量)
.763
-.121
.595
-.054
-.109
Zscore(氨氮)
.483
-.036
.851
-.014
.022
Zscore(总氮)
.928
-.056
.206
-.080
-.161
Zscore(总磷)
.926
-.047
.220
-.069
-.154
Zscore(石油类)
.007
.015
.908
.012
.047
Zscore(挥发酚)
.589
-.021
-.053
.154
.432
Zscore(铅)
-.090
.978
-.006
-.036
-.044
Zscore(汞)
-.181
-.061
.002
-.114
.874
Zscore(镉)
-.127
.984
-.077
-.027
-.021
Zscore(六价铬)
-.041
-.043
-.022
.989
-.039
Zscore(总铬)
-.021
-.053
.071
.988
-.042
Zscore(砷)
.056
.971
.071
-.046
-.019
提取方法:
主成份。
旋转法:
具有Kaiser标准化的正交旋转法。
a.旋转在6次迭代后收敛。
由表5可知前5个因子的累积方差贡献率已达到90.066%,保留了原始数据大部分信息因此确定选择5个因子。
由表6(旋转后的成分矩阵)可知第1个因子上氮和磷这两个指标的载荷较大,其主要反映着两个变量的信息,因此第1个因子可命名为氮磷指标因子。
它解释了原变量22.939%的信息。
第2个因子上铅、镉和砷这三个指标的载荷较大,因此第2个因子可命名为铅镉砷指标因子,它解释了原变量22.301%的信息。
第3个因子上氨氮和石油类这两个指标的载荷较大,因此第3个因子可命名为氨氮石油类指标因子。
它解释了原变量15.485%的信息。
第4个因子上六价铬和总铬这两个指标的载荷较大,因此可命名为铬指标因子。
它解释了原变量11.051%的信息。
第5个因子上汞的载荷较大,因此可命名为汞指标因子。
它解释了原变量7.368%的信息。
在所有变量中,化学需氧量和挥发酚2个标量在所保留的5个因子上的在和都不大,它们与各个主因子的相关系数没有明显差别。
说明在废水中化学需氧量和挥发酚含量并不突出。
由表7(因子得分排名及因子总分表)可以看出,沈阳、重庆和石家庄这3个城市废水中氮磷含量最高。
上海、重庆和广州这3个城市的废水中氨氮和石油类含量最高。
南昌、杭州和广州这3个城市的废水中铬的含量较高。
乌鲁木齐、福州和南宁这3个城市的废水中汞的含量较高。
重庆的废水中氮磷、铅、镉、砷及石油类的含量均居前三,其他污染物含量也很高。
因此可见其废水处理不得当,严重影响环境。
而贵阳和太原两个城市的废水中各指标含量均较低可见二者较重视对废水的治理。
表7案例处理汇总a,b
案例
有效
缺失
总计
N
百分比
N
百分比
N
百分比
26
83.9
5
16.1
31
100.0
表8群集成员
案例
5群集
1:
北京
1
2:
天津
1
3:
石家庄
1
4:
太原
2
6:
沈阳
1
9:
上海
3
10:
南京
2
11:
杭州
1
12:
合肥
2
13:
福州
3
14:
南昌
4
15:
济南
1
16:
郑州
2
17:
武汉
2
18:
长沙
2
19:
广州
2
20:
南宁
1
22:
重庆
1
23:
成都
1
24:
贵阳
2
25:
昆明
5
27:
西安
2
28:
兰州
2
29:
西宁
2
30:
银川
2
31:
乌鲁木齐
3
由表7可知有效观测数为26个,缺失值为5个。
由表8可知26个观测被分为以下5类:
第1类:
北京、天津、石家庄、沈阳、杭州、济南、南宁、重庆、成都。
第2类:
太原、南京、合肥、郑州、武汉、长沙、广州、贵阳、西安、兰州、西宁、银川。
第3类:
上海、福州、乌鲁木齐。
第4类:
南昌。
第5类:
昆明。
表9:
图表9为用Ward法发生成的聚类谱系图。
展现了聚类分析中每一此类合并情况。
SPSS自动将各类间的距离映射在0~25之间,并将聚类过程近似的表示在图上。
表10个案汇总
WardMethod
REGRfactorscore1foranalysis1
REGRfactorscore2foranalysis1
REGRfactorscore3foranalysis1
REGRfactorscore4foranalysis1
REGRfactorscore5foranalysis1
1
N
9
9
9
9
9
均值
1.1177975
-.0893238
-.0486093
-.1200684
-.0117105
2
N
12
12
12
12
12
均值
-.6086288
-.2798741
-.1611866
-.2587160
-.4389090
3
N
3
3
3
3
3
均值
-.6959928
-.1795974
1.0499799
-.1387151
1.9639665
4
N
1
1
1
1
1
均值
-.1816706
-.1255120
-.4060667
4.7143721
-.3294720
5
N
1
1
1
1
1
均值
-.4869833
4.8267072
-.3721506
-.1130199
-.1901252
总计
N
26
26
26
26
26
均值
.0000000
.0000000
.0000000
.0000000
.0000000
表11最终聚类中心间的距离
聚类
1
2
3
4
5
1
4.274
4.995
5.126
1.632
2
4.274
6.308
6.556
4.229
3
4.995
6.308
6.924
5.034
4
5.126
6.556
6.924
5.139
5
1.632
4.229
5.034
5.139
表12最终聚类中心间的距离
聚类
1
2
3
4
5
1
4.274
4.995
5.126
1.632
2
4.274
6.308
6.556
4.229
3
4.995
6.308
6.924
5.034
4
5.126
6.556
6.924
5.139
5
1.632
4.229
5.034
5.139
由表10可知第1类地区废水中氮磷含量较高。
第2类地区废水中铅、镉和砷的含量较高。
第3类地区废水中氨氮和石油类含量较多。
第4类地区废水中硌含量较高。
第5类地区废水中汞含量较高。
表11显示的是迭代历史记录。
在迭代过程中,完成第一次迭代后形成的5个新类中心点距初始类中心点的欧氏距离。
经过4次迭代后快速聚类完成。
由表12可知第一类和第五类之间的距离最小,为1.632.,第三类和第四类之间的距离最大,为6.924.。
表13聚类成员
案例号
聚类
距离
1
5
.584
2
5
.632
3
5
.820
4
1
.833
5
.
.
6
5
2.543
7
.
.
8
.
.
9
2
.000
10
1
.783
11
1
1.550
12
5
1.099
13
1
1.640
14
3
.000
15
5
.925
16
5
.995
17
5
1.000
18
5
1.088
19
5
1.464
20
1
1.510
21
.
.
22
5
2.609
23
5
.577
24
1
1.448
25
4
.000
26
.
.
27
1
1.377
28
1
1.319
29
1
.874
30
1
.938
31
1
2.541
表13显示的是聚类成员表:
“聚类”表示的是该观测属于哪一类,“距离”表示的是该观测与其所属类别中心之间的欧氏距离。
水污染是我国面临的主要环境问题之一。
随着我国工业的发展,工业废水的排放量日益增加,达不到排放标准的工业废水排入水体后,会污染地表水和地下水。
水体一旦受到污染,要想在短时间内恢复到原来的状态是不容易的。
水体受到污染后,不仅会使其水质不符合饮用水、渔业用水的标准,还会使地下水中的化学有害物质和硬度增加,影响地下水的利用。
我国的水资源并不丰富,若按人口平均占有径流量计算,只相当于世界人均值的四分之一。
而地表水和地下水的污染,将进一步使可供利用的水资源数量日益减少,势必影响工农渔业生产,直接或间接地给人民生活和身体健康带来危害。
因此各城市应适当根据分析结果,针对废水中含量较高的污染物进行合理治理,减少废水对环境的危害。