SPSS的综合运用以我国城市空气质量分析为例.docx
《SPSS的综合运用以我国城市空气质量分析为例.docx》由会员分享,可在线阅读,更多相关《SPSS的综合运用以我国城市空气质量分析为例.docx(18页珍藏版)》请在冰豆网上搜索。
SPSS的综合运用以我国城市空气质量分析为例
年欢
管理科学与工程2013200644
(一)实验目的
近年来随着现代化和工业化的进程,我国大气污染状况十分严重,主要呈现煤烟型污染
气污染物排放总量迅速增加、氮氧化物污染趋势加重、全国形成多个酸雨区等,危害生态环
车、飞机、火车、船舶等交通工具的煤烟、尾气排放。
本文通过聚类分析和主成分分析法,
研究我国主要城市的空气质量,以及各参数对空气质量好坏的影响以及最主要的影响因素。
并据此提出科学合理的对策建议。
(二)问题描述
在2013年之前,大部分人对于雾霾天气的认知都会自然而然觉得是北京的事。
然而,
见度过低,导致多处高速公路封道关闭,给车辆出行带来了不便,也严重影响了市民的正常工作与生活。
(三)数据来源
《中国统计
通过查询“中华人民共和国国家统计局官方网站”的“国家统计数据库”,年鉴》获得。
(四)案例中使用的SPSS方法
1.描述性分析
2.相关分析
3.聚类分析
4.主成分分析
(五)实验内容与步骤
1.
城市空气质量因素的描述性统计
包括
级的天数、年平均气温和年平均相对湿度六项影响空气质量的因素做描述性统计分析,
频数、极小值、极大值、均值和标准差五个项目,见表表1.1描述统计量
描述统计量
可吸入颗粒物
31
.040
.138
.09121
.021762
二氧化硫
31
.008
.079
.03902
.015930
二氧化氮
31
.016
.068
.04005
.011855
空气质量达到及好于二级的天数
31
244
365
326.81
27.463
年平均气温
31
5.2
23.3
13.877
4.9856
年平均相对湿度
31
34
81
63.35
11.047
有效的N(列表状态)
31
0.04毫克/
从表1.1可以看出,在影响空气质量的因素中,可吸入颗粒物的最小值为
立方米,最大值为0.138毫克/立方米,平均值为0.9121毫克/立方米,标准差为0.21762;
二氧化硫的最小值为0.08毫克/立方米,最大值为0.079毫克/立方米,平均值为0.03902
毫克/立方米,标准差为0.01593;二氧化氮的最小值为0.016毫克/立方米,最大值为0.068
0.011855;空气质量达到及好于
326.81天,标准差为27.463;年
平均值为13.877摄氏度,标准差
毫克/立方米,平均值为0.04005毫克/立方米,标准差为
二级的天数最小值为244天,最大值为365天,平均值为
平均气温的最小值为5.2摄氏度,最大值为23.3摄氏度,
为4.9856;年平均相对湿度最小值为34%最大值为81%平均值为63.35%,标准差为11.047。
2.相关分析
(1)按照顺序:
分析一一相关一一双变量打开相关分析的对话框
(2)在简单相关分析的主对话框中将所有变量选入“变量”中。
在“显著性检验”框中,有“双侧检验”和“单侧检验”。
系统默认是双侧检验。
(3)点击“OK,输出结果见表2.1。
表2.1Pearson相关系数
相关性
可吸入颗
粒物
二氧化
硫
二氧化
氮
空气质量达到及好于二级的天数
年平均气
温
年平均相对
湿度
可吸入颗粒物
Pearson相
关性
1
**
.560
**
.460
**
-.901
-.412*
-.132
显著性(双
侧)
.001
.009
.000
.021
.480
N
31
31
31
31
31
31
二氧化硫
Pearson相
关性
.560**
1
.311
-.468**
-.448*
-.232
显著性(双
侧)
.001
.089
.008
.011
.210
N
31
31
31
31
31
31
一氧化氮
Pearson相
关性
**
.460
.311
1
-.359*
-.040
.073
显著性(双
侧)
.009
.089
.047
.831
.696
N
31
31
31
31
31
31
空气质量达到及好
于二级的天数
Pearson相
关性
**
-.901
**
-.468
-.359*
1
.412*
.241
显著性(双
侧)
.000
.008
.047
.021
.192
N
31
31
31
31
31
31
年平均气温
Pearson相
关性
-.412*
-.448*
-.040
.412*
1
**
.617
显著性(双
侧)
.021
.011
.831
.021
.000
N
31
31
31
31
31
31
年平均相对湿度
Pearson相
关性
-.132
-.232
.073
.241
**
.617
1
显著性(双
侧)
.480
.210
.696
.192
.000
N
31
31
31
31
31
31
**.在.01水平(双侧)上显著相关。
*.在0.05水平(双侧)上显著相关。
表2.1给出了Pearson相关系数,以一个矩阵的形式表现出来。
从中可以看出,可吸入
颗粒物、二氧化硫、二氧化氮空气质量达到好于二级的天数、年平均温度和年平均相对湿度
的相关系数分别为0.901、0.56、0.46、0.468、0.617和0.617,在这些数据的右边都有两
个星号,表示在0.01的显著性水平下,是显著相关的,还有一些相关系数带有一个星号表
0.01
示在0.05的显著性水平下,相关系数是显著的。
故得出空气质量达到及好于二级的天数和可吸入颗粒物、二氧化硫和二氧化氮在置信度条件下呈高负相关,其中空气质量达到及好于二级的天数和可吸入颗粒物的相关性大
空气质量达到及好于二
雨二氧化硫和二氧化氮与空气质量达到及好于二级的天数的相关性;
级的天数和年平均温度、年平均相对湿度在0.01置信度条件下呈高度正相关,其中年平均
温度与空气质量达到及好于二级的天数相关性等于平均相对湿度与空气质量达到及好于二级的天数的相关性。
3.聚类分析
3.1.衡量指标
31个城市的空气
因素有很多,有,温度,湿度等等,为此本文选取了四个指标,分别是可吸入颗粒物,二氧化硫,二氧化氮,空气质量达到及好于二级的天数。
用以衡量我国主要的
质量,数据来源于中国统计年鉴2011年:
12-19主要城市空气质量指标(2011年)
单位:
毫克/立方米
可吸入颗粒物
二氧化硫
二氧化氮
空气质量达到及
空气质量达到二级以上
城市
(PM10)
(SO2)
(NO2)
好于二级的天数
天数占全年比重(%)
(天)
北京
0.113
0.028
0.056
286
78.4
天津
0.093
0.042
0.038
320
87.7
石家庄
0.099
0.052
0.041
320
87.7
太原
0.084
0.064
0.023
308
84.4
呼和浩特
0.076
0.054
0.039
347
95.1
沈阳
0.096
0.059
0.033
332
91.0
长春
0.091
0.026
0.043
345
94.5
哈尔滨
0.099
0.041
0.046
317
86.8
上海
0.080
0.029
0.051
337
92.3
南京
0.097
0.034
0.049
317
86.8
杭州
0.093
0.039
0.058
333
91.2
合肥
0.113
0.022
0.025
303
83.0
福州
0.069
0.009
0.032
360
98.6
南昌
0.088
0.056
0.038
347
95.1
济南
0.104
0.051
0.036
320
87.7
郑州
0.103
0.051
0.047
318
87.1
武汉
0.100
0.039
0.056
306
83.8
长沙
0.083
0.040
0.047
341
93.4
广州
0.069
0.028
0.049
360
98.6
南宁
0.073
0.026
0.033
351
96.2
海口
0.041
0.008
0.016
365
100.0
重庆
0.093
0.038
0.031
324
88.8
成都
0.100
0.031
0.051
322
88.2
贵阳
0.079
0.049
0.030
349
95.6
昆明
0.065
0.037
0.044
365
100.0
拉萨
0.040
0.009
0.023
364
99.7
西安
0.118
0.042
0.041
305
83.6
兰州
0.138
0.048
0.042
244
66.8
西宁
0.105
0.043
0.026
316
86.6
银川
0.095
0.038
0.030
333
91.2
乌鲁木齐
0.132
0.079
0.068
276
75.6
3.2操作步骤
(2)在主对话框中将用于聚类的所有变量选入“变量”,把区分样本的标签变量选入“标注个案”。
(3)单击“方法”按钮,展开分层聚类分析的方法选择对话框。
2”和“4”,点
(4)点击“统计量”选中“合并进程表”。
选择“方案范围”分别输入“击“继续”回到主对话框,此时分析结果中就包含了凝聚状态表。
点击“绘制”选中“树状图”,点击“继续”回到主对话框,此时分析结果中就包括了冰柱图。
(5)点击“保存”,然后再弹出的对话框中点击“继续”,最后回到主对话框中点击“0K'。
完成上述步骤后,会得到凝聚状态表(表3.1)和树状图(图3.2)。
表3.1分成2~4类时各地区所属的类别
群集成员
群集成员
案例
4群集
3群集
2群集
案例
4群集
3群集
2群集
1:
北京
1
1
1
8:
哈尔滨
1
1
1
2:
天津
1
1
1
9:
上海
1
1
1
3:
石家庄
1
1
1
10:
南京
1
1
1
4:
太原
1
1
1
11:
杭州
1
1
1
5:
呼和浩特
1
1
1
12:
合肥
1
1
1
6:
沈阳
1
1
1
13:
福州
1
1
1
7:
长春
1
1
1
14:
南昌
1
1
1
15:
济南
1
1
1
24:
贵阳
1
1
1
16:
郑州
1
1
1
25:
昆明
1
1
1
17:
武汉
1
1
1
26:
拉萨
2
2
1
18:
长沙
1
1
1
27:
西安
1
1
1
19:
广州
1
1
1
28:
兰州
*1
2
20:
南宁
1
1
1
29:
西宁
1
1
1
21:
海口
2
2
1
30:
银川
1
1
1
22:
重庆
1
1
1
31:
乌鲁木
齐
4
o
3
•
2
23:
成都
1
1
1
HIERARCHICALCLUSTERANALYSIS
的相对距离大小。
每个样本为单独的一类,即31个城市各自为一类;当距离为25时,31个城市被归为一类;
在这里我们将城市分成四类:
第一类:
南京,成都,武汉,杭州,北京;
第二类:
呼和浩特,南昌,贵阳,沈阳,重庆,银川,西宁,哈尔滨,郑州,石家庄,济南,
天津,西安,太原;
第三类:
福州,南宁,广州,昆明,上海,长沙,长春,合肥;
第四类:
海口,拉萨,兰州,乌鲁木齐
4.主成分分析
4.1实验步骤
(1)按照顺序:
分析一一降维一一因子分析进入因子分析主对话框中,将左侧所有变量都
选入“变量”中。
石图。
点击“Continue”按钮,返回到主对话框。
此对话框中的默认选项表明此次主要成分
(3)点击“Scores”按钮,弹出对话框“因子得分”,选中“因子得分系数矩阵”点击“Continue”按钮,返回主对话框。
(4)点击主对话框中的“OK,可以得出输出结果,见表4.1~4.5和图4.6。
表4.1Communalities(变量共同度)
公因子方差
初始
提取
可吸入颗粒物
1.000
.878
二氧化硫
1.000
.721
二氧化氮
1.000
.742
空气质量达到及好于二级的天数
1.000
.782
年平均气温
1.000
.799
年平均相对湿度
1.000
.781
提取方法:
主成份分析。
(方差贡献表)
表4.2TotalVarianeeExplained
解释的总方差
成份
初始特征值
提取平方和载入
旋转平方和载入
合计
方差的%
累积%
合计
方差的%
累积%
合计
方差的%
累积%
1
2.974
49.570
49.570
2.974
49.570
49.570
2.556
42.604
42.604
2
1.407
23.445
73.015
1.407
23.445
73.015
1.825
30.411
73.015
3
.639
10.653
83.668
4
.573
9.553
93.221
5
.330
5.497
98.718
6
.077
1.282
100.000
提取方法:
主成份分析。
表4.3ComponentMatrix(因子载荷矩阵)
成份
1
2
可吸入颗粒物
.888
.300
二氧化硫
.739
.022
二氧化氮
.478
.604
空气质量达到及好于二级的天数
-.864
-.189
年平均气温
-.683
.577
年平均相对湿度
-.447
.763
提取方法:
主成分分析法。
a.已提取了2个成份。
(主成分得分系数矩阵)
表4.4ComponentScoreCoefficientMatrix
旋转成份矩阵a
成份1
1
2
可吸入颗粒物
.915
-.201
二氧化硫
.644
-.363
一氧化氮
.721
.271
空气质量达到及好于二级的天数
-.838
.284
年平均气温
-.286
.847
年平均相对湿度
.011
.884^
提取方法:
主成分分析法。
旋转法:
具有Kaiser标准化的正交旋转法。
a.旋转在3次迭代后收敛。
(主成分得分系数矩阵)
表4.5ComponentScoreCovarianeeMatrix
成份转换矩阵
成份
1
2
1
.856
-.516
2
.516
.856
提取方法:
主成分分析法。
旋转法:
具有Kaiser标准化的正交旋转法。
图4.6碎石图表4.7成分矩阵
成份
影响因素
1
2
可吸入颗粒物
.888
.300
二氧化硫
.739
.022
二氧化氮
.478
.604
空气质量达到及好于二级的天数
-.864
-.189
年平均气温
-.683
.577
年平均相对湿度
-.447
.763
提取方法:
主成分分析法。
a.已提取了2个成份。
4.2结果分析
(1)表2.1中的相关系数表明六个变量之间存在显著相关性,可以进行主成分分析。
0.720,表明提取的主成分对每个
(2)表4.1为变量共同度,表中最后一列的数据都大于
变量的解释程度都较高。
(3)表4.2为方差贡献率,“合计”是特征根,“方差的%是每个特征根对应的方差贡献,
“累计%是累计方差贡献;“初始特征值”列出了所有的主成分,并按照特征根的大小排列,而“提取平方和载入”对应的是提取主要成分后的各项指标。
可以看出两个主成分,因
为有两个特征根大于1.由表4.2可以看出,第一主成分的特征根为2.974,方差贡献率为
49.570%,第二个主成分的特征根为1.407%,方差贡献率为23.445%,两个主成分的累计方
差贡献率达到73.015%,即两个主成分共解释了总变异的73.015%,进一步说明提取两个主
成分是比较合适。
(4)图4.6为碎石图,实际上是按特征根大小排列的主成分折线图。
横坐标表示第几主成
分,纵坐标表示特征根的值,本例在第三个特征根处变得比较平缓,表明可以提取两个主成分。
(5)表4.4为主成分得分系数矩阵,根据该矩阵,可以写出以标准化的原始变量表示的主
成分的表达式。
若记标准化的原始变量为ZX1、ZX2、ZX3、ZX4,两主成分记为f1、f2,则表
达式为:
fi=0.915zx1+0.644ZX2+0.721zx3-0.838zx4
f2=-0.201zx1+0.363ZX2+0.271zx3+0.284zx4
即可得31个城市的主成分得分。
明湿度在一定程度上也能够影响空气的质量。
5.结论
量优,其中拉萨作为我国独具特色的一个旅游城市,不能以先发展再治理的短浅目光来发展经济,一定要重视环境保护。
此外,可得出中国近年来空气质量的污染主要是由于可吸入颗粒物,严重影响人体健康,故各个城市应该致力于控制和减少可吸入颗粒物的排放,比如植树造林,增加绿地面积,尽量减少裸露的地面;城市施工时应注意防止造成大量的扬尘;加大产业调整力度,加快淘汰落后产能,积极推广清洁能源;实施机动车高排放标准,加快油品升级,加大高排放车辆检测力度,努力改善城市拥堵状况,严控机动车污染。